Categories

Calendar

September 2017
M T W T F S S
« Jun    
 123
45678910
11121314151617
18192021222324
252627282930  

留学申请注意事项:心路历程

在这里记录一下自己申请过程中的一些重要的事吧。也算是自己人生的一个巨大的转折点。因为我之前一直是走工程路线的,特别是在本科阶段,一方面是对科研学术方面的东西接触得不多,另一方面是完全没有考虑过出国留学这一条路——或者说其实是考虑了但是立马被我自己彻底否决了:大概很大的原因是因为自己不愿意花时间去弄英语考试这种“没用”的东西以及认定自己肯定搞不定申请过程中的种种复杂繁琐的流程吧。

实际上要说自己当时对未来的规划的话,那就是没有规划。本来嘛我就并不是一个有远大志向要做出什么惊天动地的伟业的人,只是喜欢开开心心地活着做自己喜欢做的事情而已,而且长期浸泡在校园这样轻松自由的环境里(不知道会不会有人冒出来吐槽说“学校哪点轻松哪点自由了?”,反正我是这样觉得的),也让我对校园外的生活的辛苦和残酷变得越来越没有概念,于是就只是沿着眼前的路往前走而已。所以读研其实也是因为基本上没有什么悬念地保研了嘛,而且那阵子也凑热闹随便跑去参加了某公司的一个校园招聘,在几乎没有做过什么准备,就想去打一下酱油熟悉一下流程为将来找工作做准备的情况下,居然从笔试一直到三轮面试最后人家说如果我愿意放弃保研的话是会给我 offer 的。当然保研的协议早已经签了的,但是这件事无疑更加让我对将来的生活或者生计放松了警惕。

所以如果没有认识你的话,我的人生大概就不会在这个时候又变得这样闹腾起来了吧。真正认真开始考虑出国的可能性是在研一下的时候吧,因为看到你那么坚定地朝着自己认定的目标走,让我很感动,也为自己的散漫和悠闲有些惭愧。所以也许我也想尝试去体验一下你的那份坚毅吧;或者也许我只是想追随你而已——至少我在找导师咨询关于出国的事情的时候是这么说的。

The cost of knowledge: JMLR 的 8g

这一阵子数学家们发起了一场抵制 Elsevier 的运动,建立了一个网站叫做 the cost of knowledge。简而言之,Elsevier 是一个出版商,它旗下有很多期刊,但是在众多恶劣的出版商之中,Elsevier 似乎尤其恶劣,价格高昂,并且搞捆绑销售捆绑一些非常低质量的期刊,而且还被爆参与一些非正当的学术行为,另外还和前一阵子引起很大风波的让 Wikipedia 下线一天的 SOPA 有关。期刊本来的主要作用是传播学术成果,学术论文发表是没有稿费的,并且论文评审和编辑工作完全是有这些科研工作者“志愿”完成的,出版商也不会支付任何费用,他们的收入则主要来源于将期刊集出售给各大学的图书馆之类的机构。而现在呢,随着 Internet 的发展,期刊的主要作用“传播”似乎越发显得不重要了,然而许多出版商却变本加厉,订阅价格越来越贵,许多学校都越来越难以负担,于是几乎是历史必然地,出现了抵制运动,这次首先针对的是据说行为非常恶劣的 Elsevier ,具体可以参见这次运动的 Statement of Purpose,来龙去脉讲得非常清楚。此运动发起之后,各个领域的人也都参与进来,表示支持,抵制的方式就是可以选择 (1) 不投稿;(2) 不引用;(3) 不参与编辑工作。在他们的网站上可以看到已经有各行各业的的公开支持了。

总而言之这是一场非常振奋人心的运动,相信此后科学出版或者说学术界又会有一些好的变化吧。不过这次要 8g 的主角实际上是 Journal of Machine Learning Research (JMLR) ,那已经是十几年前的老故事了。

时间估计的难题

喜欢看书的同学,放假回家的时候都会带几本书呢?然后开学回学校的时候发现真正打开看了的又有多少本呢?反正我从前回家带的书总是看不完的,不止回家,甚至是去自习室或者图书馆,带的书也总是会超过我的处理能力——而且我还没次都是仔细计划过的。当然造成这样的原因有多方面的,比如多带几本书的话,在一本书看不下去的时候可以换一本;又比如也许是因为执行力不够没有能把计划实施(比如中途开小差去了什么的)。但是似乎有一个重要的原因在生活中其他地方也非常常见——就是我们对于时间或精力的估计上,似乎经常存在相当大的误差。

我想来想去,觉得大部分人进行估计的时候,由于无法预料和处理所有的细节,因此会将注意力集中在几个重要的因素上,然后忽略剩下的那些琐碎的细节。这是非常自然的方法,然而问题出在哪里呢?考虑哪些琐碎细节所占的时间,虽然它们单独都小到可以忽略的情况,但是各种各样的小细节加在一起如果总时间非常多呢?是不是就不成了?

比如,要写一个程序,主要的部分当然是在写代码部分喽,但是琐碎的部分呢?比如配置一下工程环境啊,做个 Makefile/automake/CMake 之类的啊,为编辑器选一个新的字体和配色方案来换一下心情啊,找个工具来高亮和清晰化编译器的编译错误啊,更新某个库到最新版本并解决一下相关的依赖关系带来的麻烦呀,去 reddit/twitter 之类的地方看看呀,去找一个“最适合 coding 的时候听的音乐专辑”之类的,等等等等。似乎根本就列不完,也没有办法事先想到所有的事,但是这些乱七八糟的事情加在一起就会悄悄地占去了想到“可观”的一大段时间,以至于最后计划中的任务可能只完成了一半。

GIP Everywhere

GIP 全称 Ghost Instrumentality Program ,看过《攻殻機動隊》和《Neon Genesis Evangelion》的同学应该都知道我是怎么来造这个词的,不过这里就不多说这个名称的含义了,反正取一个神秘一点的名称一直是 CS 人的一大爱好嘛。不过我要说的是这个活动,这是 MSTC 内部的一个活动,简单地来说就是读书会。到目前为止,我逐渐体验了不少类似的活动,作为组织者、参与者甚至被参与者,一点感言,写在这里吧。

先说 GIP ,还记得是在某个暑假里,俱乐部一干人在办公室里讨论俱乐部的未来发展,大概也是那阵子刚好有几位神秘人找我聊过想让我接手俱乐部 Technology Group Leader 的事,GIP 的想法其实我已经酝酿了一阵子了,于是就趁势提了出来。大家的讨论下做了一些分析,优点、缺点以及可行性等等,但是并没有下定论,也没有说支持或者反对,我有一点点感觉到大家并没有能完全理解我的想法,而且之所以酝酿了许久才提出来,也是由于这个我差不多预料到的反应——如果真想做的话,大概就是得由我一个人来筹备和组织以及(最困难的)坚持下去了,所以,既然决心了要试一试自己是否有能力做 TG Leader (因为我一直认为自己在俱乐部是一个纯技术份子,并不适合组织、管理之类的工作,我想甚至考虑找我接任的那只家伙当时肯定也是这么认为的),那总得做些事情吧。

You do (not) know

SPIEGEL: The genome project hasn’t just raised hopes — but also worries. Do you understand those concerns?

Venter: Yes. There are two groups of people. People either want to know the information or they prefer to live like an ostrich with their head in the sand, not knowing anything. The fear is based on the ill-founded […]

关于同行互审

搞科研学术的,对于大部分人来说,发论文就是必不可少的了。可是这个发论文不像平时上课交作业一样,有个老师或者至少是助教来帮你批改,特别是对于一些本身就已经是该领域的领军人物了的人,根本不存在比他们“更高层次”的人来做这种审核。这是一个没法避免的事实,所以学术界几乎都采用同行互审的方式。

其实学术界似乎远没有想象中的那么简单和纯粹,所以我在想是不是什么东西发展到这样一个规模之后必然会有一些诸如潜规则之类的东西出现?总之先不说这个,说 peer review ,其实太具体的东西我也还没有仔细了解过,不过大致的结构还是可以理解的,也就是会有一些比较有声望的人会被选作一个(比如)conference 的评委,然后投到这个会议的论文就(随机地,可能会有一些先验,比如相关研究方向等)分配给各个 reviewer 去审,中间有一些细节可能会有所不同,比如如果自己也投了这个会议的论文的话是不是就不能同时做 reviewer 了,以及 review 到最终决定的过程是否有和原作者之间的 feedback 互动等,但是整体上通常都是如此。不过通常也被划分陈两种比较大的变种,或者说,实际上是三种:

author 公开,reviewer 不公开:也就是最普通的方式了,reviewer 知道自己在审谁的 paper ,但是 author 不知道被谁审了。
author 不公开,reviewer 也不公开:也就是盲审,现在在很多会议上都实行这样的方式。
author 公开,reviewer 也公开:全部公开,似乎不是特别常见,但是也有一些试行。

我想应该第一种是以前最普遍的吧,但是后来人们发现了一个问题,就是如果你是一个很牛的人的话,你的论文或者你挂了名字的论文通常就几乎“百发百中”,一方面可能是大家看到你的名号都不得不给面子,另一方面是一看到你的名号,肯定就会以一种不同的态度(比如,一种仰慕的神色)去读你的论文,相比之下,那些名不见经传的作者通常就比较惨了。