Categories

留学申请注意事项:选校

选校一般是在 GT 之后。我大致是在 2011 年暑假快结束的时候开始看学校的,一开始也比较悠哉,但是到后面就开始有些紧张了,最好做好计划,因为比如每天看一个学校的话,看 20 个学校也要花掉大半个月的。实际上选校这个事情的建议是越早越好,或者可以分成几个阶段来,因为很多步骤其实都会依赖于你要申请哪几个学校。

比如知道去哪里的话,考试也有针对性了,例如去欧洲的话一般要考雅思而不是托福,而加拿大有不少学校似乎是不要 GRE 的,另外 MIT 的 EECS 其实也是不需要 GRE 成绩的。

再比如在考 GT 的时候会有 4 所免费送分的学校,如果事先有看过学校的话(只要大致知道自己肯定会申的 4 个学校就好了),就很好填了,G 和 T 每个学校送一次分都要 100+ 米的,所以还是要好好利用的。我就比较悲剧,考 G 的时候随便填了几个,后来申请的时候搞晕了结果又把那几个重新送了一次;考 T 的时候以为可以后面申请的时候再填结果就留空了,然后后来发现留空了就相当于放弃了免费送分的名额……

还有就是办理成绩单的时候,因为这也是一件比较麻烦的事情——特别是在高峰期的时候。知道自己要申多少学校的话,就好一次办好了。不过到这个阶段就需要更仔细一些的选校了,一方面要把学校列表确定下来,另一方面还得看看各个学校关于成绩单的要求:有个别学校是要求寄两份成绩单的,还有更多的学校并不需要寄成绩单,只要上传扫描版就可以了,纸质版成绩单可以在拿到 offer 之后再寄过去。

再还有就是写文书的时候总是要选校了吧,特别是在 PS 里我认为很重要的一点就是要写为什么你会选择那个学校。另外有些学校还会有一些比较详细的怎样写 PS 的提示,或者有各自特殊的要求,有些学校还要求写两份,一份 Academic Statement of Purpose ,一份 Personal Statement ,或者可能要写一些你如何给学校的 diversity 带来贡献之类的,有人说这些不太相关的材料其实没有人看的,我想大概也是,不过认真写也没有坏处,不要在这种地方“贪小便宜”。

如果写文书的时候都可以一个模板套下来的话,网申的时候总是要选校了,这里我主要是指三个部分:寄送成绩单、寄送 GT 成绩和在线提交申请。这都必须要在确定好学校才能完成的,而且前面提过,GT 成绩最好尽早送,免得出不必要的麻烦。成绩单一般用快递寄,很快,几天就能到,大概一份 100+ 米吧,找合寄会省不少钱。或者如果有很好的朋友在美国的话,可以快递过去让他通过美国的 USPS 帮忙寄送到各个学校,这样也会很便宜。像我们这次申请就是 Optimi 同学正好要去美国参加一个牛比赛,就带过去寄掉了! ^_^

再回到选校的问题,前面说了,选校最好尽早。那么选校究竟要如何选呢?这个是个很难的问题,主要就是要结合自己的情况和定位,以及一些客观的因素来进行选择。之前看过的一篇叫做胡侃CS top school申请的文章里面说的“一个萝卜一个坑”的说法我觉得是挺有道理的,这个文章里还对 CS 方面的牛校做了一些分析,建议参考一下。

对于自己的情况评估的话,应该自己或者你的导师之类的是最清楚的,我就只说一下一些客观的情况吧。关于学校,一个重要的因素当然是排名,usnews 有 graduate school 分不同专业的排名,可以作为参考。不过这个作为粗略的参考就可以了,本身排名就有各种不同的标准和因素在里面,而且同一个梯段内的前后几名其实差别也并不那么大。另一个重要因素就是方向 match 程度吧,或者可以说是选导师。选学校还是选导师这本身就是一个说不清楚的问题,需要具体 case 具体分析,我也没法多说了。

至于我自己的选校策略,其实很简单,我先用粗排名划一个界:美国专业 1~50 的学校,以及加拿大的几所学校。再在这个界限范围内根据导师来选学校,选择的过程中尽量保持各个梯段也都有一些学校。当然后来导师说我过于保守了,我想这和各个人的性格也有很大关系。

选导师的过程中很重要的一个环节就是辨别一个人是不是牛人,特别是,是不是你所感兴趣的领域内的牛人。整个过程本身学生就是处在信息获取不完整的劣势——看看那些教授的主页吧,很多都是非常简略的,或者是读到最后赫然出现诸如“Last Updated 1998”这样的字样……而且让学生来评估教授工作的重要性本身就是非常困难的。好在这个环节有不少工具可以帮忙——万能的 Internet !

我觉得评判一个教授最直接的方法就是通过他的 publication list ,而且即使是再懒再忙的教授,主页上杂草丛生的情况下,他一般都还是会记得更新 publication list 的。如果真是连 paper list 都显得一副化石样的教授,说不定是已经牛到不 care 论文的程度了,直接去 Google 他的名字,说不定有关于他的 Wikipedia 页!

在第一遍初选的过程中不可能看得太仔细,所以看 paper list 一般不看内容,主要看两个部分:首先是看论文发表在哪里,这需要对自己领域有一个大致的了解,例如机器学习的主要牛会 NIPS 、ICML 以及 COLT (如果算上 Learning Theory 的话)等,和主要期刊 JMLR、Machine Learning 和 Neural Computation 之类的,这样扫一眼 paper list 就大概知道是不是这一行的牛人;然后再可以看他的 paper title ,大致确认一下是不是做自己有所了解或者感兴趣的方向。

这里有几个工具可以用,一个是 Microsoft Academic Search ,它收录的数据没有 Google Scholar 那么全,但是功能花哨许多,搜一个人可以给出他发表论文的出版物的分类统计,这是相当有参考价值的。Microsoft Academic 还有其他有用的功能,例如给出教授的共同作者关系网之类的。不过对于包括机器学习在内的一些方向来说,就论文分类统计这一项来说,还是 DBLP 更权威正式完整一些。DBLP 自己的搜索功能似乎不太好用,不过可以在 Google 里搜索某某某 DBLP ,例如“Michael Jordan DBLP”,一般第一条就是。页面右面会给出 Co-author 和出版物的统计,例如可以看到 Jordan 的 NIPS 和 ICML 数目加起来已经超过 100 篇了。

当然需要说明的一点就是这个论文数目其实和学校排名差不多,起到一个参考作用,并不是说一个发表了 25 篇 NIPS 的教授就一定比另一个发表了 10 篇 NIPS 的教授牛。另外还有一些很牛的教授其实 publication 并不多。所以说除了自己的判断之外,最好是能问一下业内的专家了,比如说如果有人是业内的牛教授的话,不妨去咨询一下,但是如果没有这个条件,也有一个很好的信息资源:去找你领域里最牛的会议或期刊,然后查它的 committee 呀或者 editorial board 之类的列表,或者是其他类似的列表,这里面的人无疑就是领域里被大家所承认的真正有影响力的人了。例如,在 Machine Learning 领域,可以看一下 JMLR 的 editorial board

另外在看学校的时候还有一点就是看做那个领域的人多不多,比如像 Harvard 就各种工科才一个系,其中做机器学习的人非常少,但是仍然是有神牛级别的人在的;令一个极端就是像 CMU ,它专门有一个 Machine Learning Department 。哪种更好并没有什么 general rule ,每个人的观点都不太一样。我个人觉得大一点的系的话,一方面相应的活动或者互相交流可能会多一些(当然和学校的整体实力也有很大关系),另一方面你也可以有更多的选择,比如不太喜欢自己当前的导师做的方向,或者导师生病、旅游而休假或者甚至去了其他学校什么的的时候。

经过各种主观的、客观的、随机的挑选之后大概剩下二十来所学校,便开始仔细看他们的教授和研究方向了。我研究生阶段的主要研究方向是流形学习,PhD 阶段并没有想要限制在这个方向里:一来这样的话我可申请的范围会缩得相当小,二来我对机器学习中其他许多领域也是非常感兴趣的。实际上这一阶段对教授的了解有许多用途:一是可以看看当今领域内的牛人都在做些什么,算是对本行做一个 survey ,也对于确定将来的研究方向和兴趣是非常有帮助的;二来当然是可以进一步确定这个学校是不是适合你,或者说那里在做的东西你是不是真正感兴趣;第三就是这样一来你在 PS 中“为什么选择这个学校”的部分就可以有比较充实的内容可以写了。

这个阶段是比较费力的,似乎也没有什么通用的技巧,就是读论文了,不过其实也是非常 enjoyable 的——如果你对于了解新的事物非常有兴趣的话。但是拿到一个教授的 paper list 你不可能把每篇 paper 都读一遍,只粗粗扫一下并不能起到什么作用,特别是对你不了解的领域,scanning 能得到的信息是非常少的,所以我觉得至少得选一两篇尽力去读一下。可是选那篇呢?这也是非常困难的,本来我们是希望从 paper 的标题列表里看出教授的主要 focus 方向,然后挑出一篇他在这个方向的代表论文来看,然而由于论文发表的时候经常都要讲究 novelty ,有时候一些明明是在讲同一个东西的论文,也会用很不相同的词,稍微外行一点的话,应该很容易就 confuse 了,很容易抓不住重点。这个时候可以尝试用一些辅助工具来帮忙一下,例如,在 Google Scholar 里搜这个教授,看引用量最高的文章,比如 John Lafferty 的结果中第一条就是 Conditional Random Fields ,算是他的成名作吧。不过也不要过于依赖这个方法,因为成名作之类的时常有点年代久远,并不能精确反应教授当前的 focus (特别是在像 CS 这样飞速发展的学科),而新发表的文章即使是很 significant ,也可能由于时间积累还不够没有被 Google Scholar 之类的工具统计出来。比较理想的是教授自己的主页上有列出自己的 Research Highlight 的 paper 或者类似的评注或者 Tutorial 之类的,当然更具体的是有些教授还会把自己的 ongoing projects 写出来。不过如果只是写了 Research Interest 的话,好像大部分都是比较宽泛的话。

另外挑论文的时候尽量挑发表在好的期刊会议上的论文,因为即使是牛教授有时也难免会发几篇灌水的文章的嘛。实际上这一点不止在选校的时候,就包括在平时做科研的时候也是很重要的。刚开始接触科研的时候老师让去多看论文,就会乱七八糟地看,主要关注的都是论文的内容,但是每次跟老师说起在看什么什么论文的时候老师总是会问是哪一年发表在哪里的,谁做的工作,反而对具体内容并不是太关心。一开始会有点不以为然,觉得怎么可以如此片面或者“势利”呢?后来也就渐渐有些明白了。虽然牛人牛会里的论文并不一定总是最好的,但是论平均水平而言必然是比更低档次的论文好好的,如今的 Internet 给我们带来的信息爆炸,通过这种方式实际上是一个非常有效的过滤方式。而且,特别是对于新手来说,很容易被论文里花哨的描述给忽悠了,所不同的是好的论文是真材实料的,而不好的论文是真的在忽悠,但是新手很难分辨出来,所以挑牛人牛会的论文来看还可以在很大程度上避免被忽悠。

此外还要注意论文的 co-authorship ,如果碰到几个 co-author 都属于感兴趣的教授,一方面可以“少读一篇论文”,另一方面可以搞清楚教授之间的关系网——这在学术界是非常重要的。这一方面倒是有不少工具可以用的,比如 Microsoft Academic Search 还提供了 Visualization 的工具来画出教授的 co-authorship 图之类的。Mathematics Genealogy 里则收录了很多 PhD Thesis 指导关系,可以查出谁是谁的导师。另外在看教授的主页的时候也可以多留意一下,如果他给出了已毕业学生的列表,可以看看里面是不是有眼熟的名字,比如 Michael Jordan 主页上的已毕业学生列表里就会惊现各种牛人;此外如果教授给了自己的 CV 或者 PhD thesis 供下载,也可以趁机看一下他的导师是谁。这样建立起来一个空间上的网络,可以有助于你识别出学术界里的各个圈子(或者说“山头”吧…… -.-),并有可能发现之前漏掉的一些牛人之类的,也能帮你找到各个子领域之间的相互关联之类的。我个人觉得这种宏观认识在整个学术过程中都是非常重要的。除了空间上的整体结构,还有就是时间上的演化,所以看论文的时候也要注意发表时间。这样可以注意到一些工作是如何发展、演化、改进的。

不过,要做如此宏观的整理,对于一个学生来说实在是非常够呛的事情,但是也是相当实在的一个锻炼吧,毕竟选择了走学术的路线,这些就是必须要去做的。不过好在我们也可以有一些客观的或者别人的意见可以参考。一个主要的意见来源就是该领域的 Survey ,例如 Active Learning 和 Semi-supervised Learning 之类的 topic 都有比较公认的 survey 可以下载到。另一个就是一些牛人的博客之类的,比如 John Langford 有一个很著名的 blog: hunch.net ,里面有时候会有一些总结性的文章,比如这篇 The End of the Beginning of Active Learning 里就讲了 Active Learning (Theoretical Part) 的发展历程并列出了发展过程中起了重要作用的一些人。另外有时候一些 invited talk 之类的在主讲人简介的时候就会给出比较客观的关于这个人的代表性工作的评述。总之信息时代,放狗搜索就是了!此外,Springer 在 2011 年还出了一本《Encyclopedia of Machine Learning》(网上有电子版,大家自行搜索),非常不错,一般某个词条的作者就是该领域的专家或者至少是“说得上话”的人了。

最后,还有一个了解教授的终极武器:videolectures 。很多人都可以在上面找到 presentation 的视频,一方面可以看看他/她主页上那张 500 年前的照片背后的真实模样,另一方面是可以体验一下他/她的口音——特别是在某个教授约了你电话面试之前,通过这种方法来事先适应一下我觉得是相当不错的选择。而且一个人的言谈举止实际上反映了这个人的许多东西,这些东西虽然在申请前期不需要太在意,但是如果真的是你希望一起度过 PhD 那么多年的时光的人,总不太希望是自己很不喜欢的那种类型吧!

总结一下,信息时代的来临,给我买带来了很多实用的工具,但是我想互联网要发展成为“万能的”还有很长的路要走,现在的问题在于信息爆炸和信息质量参差不齐,所以也不能太过于迷信这些工具。举个例子,比如说 Stephen Smale ,搜索一下最先出来的是他在 Berkeley 的主页,打开一看,“Last update: 1996”……再看比较后面的搜索结果,会发现他原来出现在了 TTIC 的 Faculty 里面,再往下拉,发现他还有香港城市大学的主页……让我不禁想起了这张照片:

总之仅靠 Google 并不能准确知道他本尊究竟在哪里,这样的情况还不少,因为其实大部分教授都是没太多时间去更新自己的主页的呀,说不定他今年不招学生呢,或者出去哪里交流访问几年呢,或者休假一年呢,之类的。反正我自己闹过的一个悲剧就是关于 John Lafferty ,搜索出来的第一个结果就是 CMU 嘛,然后我在给 CMU 的 SoP 上花了一大段来写 Lafferty 的工作有哪些哪些是我很感兴趣的,和我之前做的一些工作如何 match ,我希望在这个方向再做一些什么什么样的工作等等。结果最近我才发现他原来最近已经去了 UChicago 了…… =.=bbb 当然其实如果仔细看 Google 的结果的话,也是可以看到的,但是有时候已经被自认为很确信的信息占据了的大脑就不太会注意其他事情了。

所以呢,除了信息时代的工具之外,如果有认识那个学校的学长学姐或者甚至老师之类的,直接去问那里的人了解情况应当是最靠谱的啦!不过也建议事先做一下功课在去问吧,至少搞清楚自己想要问的问题,如果一上来就是“介绍一下你们学校机器学习研究的情况”这么泛泛的问题的话,估计除了超 nice 的人或者超熟悉的朋友,一般都会比较崩溃的吧。

了解教授以及看论文主要的目的是找准每个学校最 match 或者最想跟的教授,以及在 SoP 上有东西可以写。我写 SoP 的方式是前面部分 general 讲自己为什么要读 PhD ,以及自己的相关经历和成果,然后第二部分就是讲为什么选这个学校,基本上套路是选择这个学校最想跟的一个或两个导师详细说一下,然后再提一下其他比较 match 的导师。当然我的这种方式并不一定是好的,这个我也搞不清楚,另外就是这样的写法其实是有一定风险或者很大风险的:一般最想跟的是该学校这个领域里最牛的人,如果很强调了跟他的欲望的话,别的门槛稍低一些的老师可能会认为你对他们不感兴趣之类的,这样如果你达不到这个牛老板的标准或者他今年不招人的话,就有可能遇到问题,特别是再碰到有些学校招人很强调学生与导师方向的 match 程度的时候。我在 Alberta 的申请上碰到了这个问题。

总之一般可能需要在“最想跟或者最牛的老师”与“最容易申请得到的老师(例如新起步的 assistant professor 、是华人或者组里很多华人、或者主页上大字标明正在招学生,请联系我之类的情况)”之间做一个权衡的选择。我自己在这个问题上最终是比较冒险地做了有点极端的选择,虽然最后运气很好拿到了理想的 offer ,但是我并不太推荐大家走(任何一个)极端。实际上不同的学校他们招人的策略也有可能很不一样的,有些学校可能很看重你的综合实力,并且他们是采取 admit to the department 的策略,甚至有可能第一年都是没有专门的导师的;但是另外的学校可能就会非常强调学生与老师的 match 程度,或者是碰上学校做这个方向的教授本来就人很少的情况,就比较容易因为萝卜和坑不 match 或者碰巧坑被另外的萝卜填上了而产生悲剧。

当然,从理论上来说,如果你有感兴趣的老师,但是有不一定申得上的话,也可以走迂回路线,比如,先申另外一个比较容易申请的导师。到了那边再考虑换导师什么的。但是,怎么说呢,虽然我听说在国外换导师并不是一件罕见的事,但是如果一开始就是抱着跳板的心态的话,并不是一件很道德的事。个人意见。

关于选导师的问题上,除了学术上 match 之外,另外一个非常重要——或者说甚至更加重要的问题就是导师的人品,因为毕竟是要在一起共事五年的人。这个就很难从主页或者 Google Scholar 之类的地方了解到了。而且即便是去询问该学校的学生,也是比较难了解到的。网上流传着一些 general guideline ,比如不要找 Assistant Professor 呀,特别是华人或者韩国的 Assistant Professor 或者女教授呀之类的。因为我并没有出国交流过和外面的老师也很少接触,所以这方面我并不太了解,但是许多时候也需要 case by case 的分析,不能一棍子打死。比如 Optimi 同学去交流的时候就遇到非常 nice 的女 Assistant Professor 。

总之有一些情况是比较客观的,我尝试在这里列举一些,但是在具体的选择上并没有 general rule 可以遵循,还有根据自己的情况来决定吧。首先一个是指导的多少,虽然例外总是有的,但是一般比较 senior 的导师可能就比较少有时间来指导你的一些太细节的问题,而通常是给你一个比较大的方向,但是比较 junior 的导师则通常相反。所以看你自己喜欢或者适合哪种指导方式,实际上是可以有不同的选择的。在某一次电话面试中一个老师还跟我提起 co-advising 的事,他说根据他自己的体会,由一个 senior 的导师和一个 junior 的导师来 co-advise 的话,是很不错的!

junior 的导师的话,可能年龄上经历上也和我们相对更接近一些,也更加能成为朋友吧,而且一般一个 Assistant Professor 刚起步带起来的头几届学生,可能友谊呀感情啊之类的都会更加深厚一些。但是反过来讲,senior 的导师带给你的通常并不仅限于直接的指导,更多的是各种各样的机会,比如和领域内的其他牛人见面、交流、合作的机会等等,这些在科研生活中实际上是非常非常重要的。另外 senior 的导师积累的“数据”也更多一些,让你更容易评估他是否和你所期望的 match ,比如你看他的已毕业学生里大家的去向通常都是哪里,是否和你自己将来的人生规划相符合之类的。相反一个刚起步的导师的话,由于他还没有积累足够的东西来得到同行的普遍认可,所以你需要自己从他做的工作和论文中去评价他的能力甚至潜力,我一再强调,这对于我们学生来说是非常困难的一件事情(记住再顶尖的期刊和会议也是有可能有水文的),而且即使他有很牛的工作,可能是他在读 PhD 阶段做的,那你也不太好判断是他自己很厉害还是他导师很厉害,或者是他自己做学术的厉害程度和他带学生的厉害程度是否相关,之类的问题。

另外有一本小册子叫《A Ph.D. Is Not Enough: A guide to Survival in Science》,网上可以找到电子版,里面的第二章有讲了关于选导师的问题,我并不是说我同意里面的所有观点,但是这无疑是一本非常具有参考价值的小册子。里面的内容和建议应该在开始 PhD 生活之后仍然非常有用的。由于太多文字过于枯燥,因此这里插播 Piled Higher and Deeper 上的漫画一则

我自己在选择导师的时候主要是研究方向的 match 程度为主,其他因素辅助的,至于导师的人品问题,由于前期所能了解到的信息非常有限,所以也并没有过于考虑这方面的问题,我想这个问题和另外许多同学考虑的地域问题之类的都可以稍微延后一点:在申请的时候如果担心的因素太多的话,可能会把自己所能选择的范围缩得太小了,一种方式是在把 offer 拿到之后再来权衡这些方面的问题。并且那个时候通常需要考虑的学校/老师的个数也变少了很多,也可以做更加深入的调查和了解了。比如你拿到 offer 之后即便那边的导师不主动找你 skype ,你如果要求跟他电话 chat 一下,他也通常都很乐意的。虽然说从一次谈话中很难完全认识一个人,但是比较是相当难得的比较直接的接触了。另外许多学校都有 campus visit ,给拿到 offer 的学生们专门组织去学校与导师还有高年级的学生见面和交流的机会,通常都会报销一部分花销(比如上限 $500),如果到那边当面聊的话,实际上能获得的信息量就超级超级大地增加了。

12 comments to 留学申请注意事项:选校

  • david

    校徽杂烩的那张图是手拼的还是工具自动排列的?看起来挺好。

  • david

    这篇的信息量很大,接着问几个问题:-)
    1. 免费送分是什么意思
    2. 流形要解决什么问题,有哪些工业应用
    3. 你跟的是导师是谁呢

    谢谢哈。

    • 你好,免费送分是 ETS 提供的优惠,每参加一次考试可以有四所学校进行免费送分;流形学习这个问题太大了,我没法在这里讲清楚的,可以参考一下我以前写过的一篇流形学习简介。我导师是 Xiaofei He & Deng Cai 。

  • 博主童鞋,想问下Alberta的ML的水平在US的大概能排到什么水平呢?我是对DM和ML都有些兴趣,现在有Alberta的Statistical Machine Learning 的 Master offer,还有UCR做DM的Prof Vagelis Hristidis给的PhD Offer,现在对Alberta不是特别了解,能给我一些指点么》_《多谢~~~:)

  • desmoon

    Xiaofei He
    是你研究生导师,还是出国以后的导师?
    羡慕呀~

  • desmoon

    手头就有一篇他的LPP的论文。
    楼主也算成就了自己的梦想,我也得到了激励,感谢楼主分享

  • present

    你好我是申请2013Fall的,现在正在痛苦地各种准备材料中。。。
    你申请的主要是PhD么?选校里面好像对导师的要求和方向比较苛刻,申请MS的话这方面应该也就不太看重了吧,而且不知道申请学校数是怎么定的?申请16所是不是有点少了?