Categories

Calendar

September 2017
M T W T F S S
« Jun    
 123
45678910
11121314151617
18192021222324
252627282930  

The cost of knowledge: JMLR 的 8g

这一阵子数学家们发起了一场抵制 Elsevier 的运动,建立了一个网站叫做 the cost of knowledge。简而言之,Elsevier 是一个出版商,它旗下有很多期刊,但是在众多恶劣的出版商之中,Elsevier 似乎尤其恶劣,价格高昂,并且搞捆绑销售捆绑一些非常低质量的期刊,而且还被爆参与一些非正当的学术行为,另外还和前一阵子引起很大风波的让 Wikipedia 下线一天的 SOPA 有关。期刊本来的主要作用是传播学术成果,学术论文发表是没有稿费的,并且论文评审和编辑工作完全是有这些科研工作者“志愿”完成的,出版商也不会支付任何费用,他们的收入则主要来源于将期刊集出售给各大学的图书馆之类的机构。而现在呢,随着 Internet 的发展,期刊的主要作用“传播”似乎越发显得不重要了,然而许多出版商却变本加厉,订阅价格越来越贵,许多学校都越来越难以负担,于是几乎是历史必然地,出现了抵制运动,这次首先针对的是据说行为非常恶劣的 Elsevier ,具体可以参见这次运动的 Statement of Purpose,来龙去脉讲得非常清楚。此运动发起之后,各个领域的人也都参与进来,表示支持,抵制的方式就是可以选择 (1) 不投稿;(2) 不引用;(3) 不参与编辑工作。在他们的网站上可以看到已经有各行各业的的公开支持了。

总而言之这是一场非常振奋人心的运动,相信此后科学出版或者说学术界又会有一些好的变化吧。不过这次要 8g 的主角实际上是 Journal of Machine Learning Research (JMLR) ,那已经是十几年前的老故事了。

时间估计的难题

喜欢看书的同学,放假回家的时候都会带几本书呢?然后开学回学校的时候发现真正打开看了的又有多少本呢?反正我从前回家带的书总是看不完的,不止回家,甚至是去自习室或者图书馆,带的书也总是会超过我的处理能力——而且我还没次都是仔细计划过的。当然造成这样的原因有多方面的,比如多带几本书的话,在一本书看不下去的时候可以换一本;又比如也许是因为执行力不够没有能把计划实施(比如中途开小差去了什么的)。但是似乎有一个重要的原因在生活中其他地方也非常常见——就是我们对于时间或精力的估计上,似乎经常存在相当大的误差。

我想来想去,觉得大部分人进行估计的时候,由于无法预料和处理所有的细节,因此会将注意力集中在几个重要的因素上,然后忽略剩下的那些琐碎的细节。这是非常自然的方法,然而问题出在哪里呢?考虑哪些琐碎细节所占的时间,虽然它们单独都小到可以忽略的情况,但是各种各样的小细节加在一起如果总时间非常多呢?是不是就不成了?

比如,要写一个程序,主要的部分当然是在写代码部分喽,但是琐碎的部分呢?比如配置一下工程环境啊,做个 Makefile/automake/CMake 之类的啊,为编辑器选一个新的字体和配色方案来换一下心情啊,找个工具来高亮和清晰化编译器的编译错误啊,更新某个库到最新版本并解决一下相关的依赖关系带来的麻烦呀,去 reddit/twitter 之类的地方看看呀,去找一个“最适合 coding 的时候听的音乐专辑”之类的,等等等等。似乎根本就列不完,也没有办法事先想到所有的事,但是这些乱七八糟的事情加在一起就会悄悄地占去了想到“可观”的一大段时间,以至于最后计划中的任务可能只完成了一半。

同义反复

忘记了之前在哪里看到说数学其实就是同义反复而已。从某种程度上来说,这样的言论也不能说完全是乱说,比如一系列的等价的推导,其实可以说就是在说同一件事情。但是“同义反复”多少有些贬义的意思,具体来说应该是指“不必要的反复”吧,但是数学应该不是这样吧。实际上,来考虑一下什么样的“反复”是“不必要的反复”就可以了,我觉得,那些只要是“不太明显” (non-obvious) 的关系,把这样的关系建立起来,应该也都是有其意义的,而尤其重要的是其中那些“深刻”的关联。

不过“深刻”这样的词是不是太抽象了呢?实际上,最近一年一来,接触了些数学专业的人,在同他们讨论问题的时候——好吧,其实大部分时候是我在听他们讲问题的时候——“深刻”这个词便时常在我脑子里出现。有时候听到他们说一些东西,会觉得很震惊,惊讶“原来如此”,惊讶自己从前的理解是如此的“肤浅”和不得要领。然而我一直想要来描述“深刻”这个词,却一直没有想法。也许应该举一个例子,不过有许多例子一时也想不起来了,也许有很多比较合适的经典的例子,比如 5 次以上方程不可用根式解之于 Galois Theory 的联系,我却又没法讲出来。

实际上大致就是那种感觉,不仅仅存在于数学,也存在于任何学科任何领域。从某一方面来说,世间的万事万物,作为一个个的独立的存在的话,并不是什么重要的存在,反而是它们之间的相互关联更加重要一些。所以,如果看到一个现象,得到的只是一些很明显的联系的话(也就是所谓的 obvious 的东西),也就是所谓肤浅了,这样用处大概并不大;但是如果是能抓住更深层次的东西(也就是 non-obvious 的东西),往往就能把问题看得更透彻——这样的带来的优势是可以比较形象地比喻的。比如说,各大洲上的生物有一些具有非常高的相似性,如果能顺着这个线索最终追查出原来曾经几块大陆是连在一起的,那么不仅为什么相差十万八千里的生物具有很高的相似性的问题变得豁然开朗,而且可以由此得到更多的结论来。

深刻,也就是抓住本质的东西,就好比照妖镜照出妖怪的本来面目。唐僧看不见妖怪的原形,所以妖怪用一些“烟雾弹”轻易就让唐僧上当受骗了;但是孙悟空有火眼金睛,却能看透妖怪的本质。这似乎让看透本质这样的能力越来越虚幻起来。但是神话毕竟只是神话,现实中没有人能有火眼金睛,但是看问题看得深刻——或者说,看到本质的东西,这样的能力却并不是遥不可及的。

MSTC 月刊第三期(十周年特辑)

MSTC 月刊第三期,距离第一期创刊号发布已经快要有两年了,所以说叫“月”刊当然不太合适,当然现在就不去纠结这些细节问题了。这次是第三期,也是特别的一期,因为今年是俱乐部成立十周年,所以是十周年特辑。比较遗憾的是没有能在十周年 party 之前弄完,不过现在既然终于要正式出炉了,那么这些话也不多说了吧,制作过程当然是很辛苦和漫长,当然最需要感谢的是各位供稿人,没有你们提供的内容,月刊是绝对做不出来的啦。

先提供下载吧,顺便附上前两期下载以供怀旧之用(校内下载是 FTP 地址,由于历史原因路径中有中文,如果浏览器无法正确处理,请用 FTP 软件下载):

MSTC 月刊 TechCool Issue 3 (十周年特辑),屏幕阅读预览版(JPEG 普通压缩 dpi 72,对页合并,9.12 MB):校外下载|校内下载
MSTC 月刊 TechCool Issue 3 (十周年特辑),屏幕阅读珍藏版(JPEG 高质量压缩 dpi 144,对页合并,24.5 MB):校外下载|校内下载
MSTC 月刊 TechCool Issue 3 (十周年特辑),可打印版(对页拆分,A4 纸张,103 MB):校外下载|校内下载
MSTC 月刊 TechCool Issue 2:校外下载|校内下载
MSTC 月刊 TechCool Issue 1 (创刊号):校外下载|校内下载

我作为这次月刊的重大苦力,迫不及待地想要提一下这次月刊相对于之前版本的特点:首先是风格比较统一,因为整个排版是由我一个人完成的,首次尝试了采用 Adobe InDesign 来排版——果然是专业的排版软件,比 Word 弄出来的东西看起来更加正规了。一开始就希望做成杂志的样子,就按照双页对开为整个一个版面的方式来排版了,加入了大量的图片元素,所以页数(和文件大小)也比以前的两期增加了许多。除了少数照片是在网上找的之外,大部分图片都是出自俱乐部的照片,此外我还动手为其中一些内容画了插图,虽然有些一下子就看出了功力不足或者偷懒嫌疑,但是也有碰巧自己觉得感觉还不错的——比如游记中的水墨风格的那张。

当然除了排版工作之外,还有众多其他苦力,大家都非常辛苦才有这样的成果啊。而且我很期待这次的版本实际打印出来的效果,俱乐部稍大量打印的可能性团长还在评估中,不过我想回头我自己应该会去印一份的。 总之就是这样啦,要给好评哦亲!给差评我会删帖的哦亲!

GIP Everywhere

GIP 全称 Ghost Instrumentality Program ,看过《攻殻機動隊》和《Neon Genesis Evangelion》的同学应该都知道我是怎么来造这个词的,不过这里就不多说这个名称的含义了,反正取一个神秘一点的名称一直是 CS 人的一大爱好嘛。不过我要说的是这个活动,这是 MSTC 内部的一个活动,简单地来说就是读书会。到目前为止,我逐渐体验了不少类似的活动,作为组织者、参与者甚至被参与者,一点感言,写在这里吧。

先说 GIP ,还记得是在某个暑假里,俱乐部一干人在办公室里讨论俱乐部的未来发展,大概也是那阵子刚好有几位神秘人找我聊过想让我接手俱乐部 Technology Group Leader 的事,GIP 的想法其实我已经酝酿了一阵子了,于是就趁势提了出来。大家的讨论下做了一些分析,优点、缺点以及可行性等等,但是并没有下定论,也没有说支持或者反对,我有一点点感觉到大家并没有能完全理解我的想法,而且之所以酝酿了许久才提出来,也是由于这个我差不多预料到的反应——如果真想做的话,大概就是得由我一个人来筹备和组织以及(最困难的)坚持下去了,所以,既然决心了要试一试自己是否有能力做 TG Leader (因为我一直认为自己在俱乐部是一个纯技术份子,并不适合组织、管理之类的工作,我想甚至考虑找我接任的那只家伙当时肯定也是这么认为的),那总得做些事情吧。

这篇文章本来是给 MSTC 月刊写的稿子,但是发现好像这里已经有两个月没有出现新文章了,为了避免有人认为我已经偷偷地死掉了,而月刊又一时半会儿出不来,干脆贴到这里吧。其实是很大的一个话题,而且我写的东西又杂乱到连一个合适的总结性的名字都想不到,而且我在这方面明显还是很新手,但是不管是菜鸟还是大虾,总会有自己的想法嘛,所以我就胡乱写了些文字,就是我自己的非常 personal 的(并且只是“目前”的)想法的一些整理了,希望有人看了会觉得有趣或者是有一些同感。

画画其实和编程很像,对吧?

你有的不过是线条,而你要表达的是整个宇宙——一切你心里能装得下的东西。当然,这很难,有多难呢?大概……就像用C语言写出完整的Linux内核那么难吧。

绘图板

作为一个 IT 人士,身边有各种数码潮人是很正常的,大家都在“败家”,什么 iphone 、ipad 、M9、Kindle、单反等等……我虽然对这些东西不抵制,但是似乎也一点提不起兴趣来。每次和大家站在一起,我就觉得自己是个摩登原始人呀!结果,那天我突然就有了这个想法,在咨询了小 lam 的意见之后,火速买了一个绘图板,快递也很迅速,第二天就到了,而且还是在早上把我从睡梦中叫醒。

Wacom Bamboo Pen Medium ,很喜欢这个名字,不知道为啥要叫 Bamboo ,听起来很可爱啊!不过在我拆开验货的时候,快递员问我这是什么玩意,我说是绘图的,他一副愤世嫉俗的表情看着我说,就一个画画的板?要那么贵?反而搞得我很不好意思,吞吞吐吐地说:“呃,这个……嗯,大致是……还有其他一些功能?”“能上网?”快递员立刻接过话去。于是我咕哝咕哝着就蒙混过关了…… =.=bb 在这种时候总是显得很无力,总不能说更贵的板子多了去了……

打开之后发现绘图板比我想象中的好用的——我原来以为是要“盲定位”的,结果发现不是这样子的,只要鼻尖不离开板子太远,就能感应到指针的移动。还有就是和鼠标的相对移动不一样的是,板子映射到屏幕是绝对位置的映射,一开始会不太习惯当鼠标来用,结果指针移来移去都还是在那里。当然我也没有指望一开始就适应,两大障碍:一是绘图板毕竟和纸不一样,要看着屏幕画,板子和电脑摆得不正的话经常会线条各种扭曲,桌子也得大,摆得下两个东西;二就是软件啦,我对图像处理的软件可以说是一窍不通…… >_< 不过反正我也没有指望能够一下子上手,这个是用板子画的第一幅图:

2010 关于

去年写总结的时候用了孙燕姿的一首歌为题,今年继续吧。《关于》这首歌是这么唱的:

关于 生活的选择题
答案在风里

这一年似乎是碰到许许多多“生活的选择题”吧,所谓人生的抉择,似乎到头来还是随心就好呢!另外还有就是这个歌的前奏是闹铃声,所以一直被我用来做手机上的起床闹铃了。

年年岁岁岁岁年年,又是当你还没有习惯 2010 这样书写日期的时候,这一年就已经过去了。实际上这一年发生了很多事情。不知从何说起,但是纵观这一年,大概主要线索变成了出国的事吧,且不再论选择出国的原因了,但是既然选择了要念 PhD ,面临的许许多多的选择题,答案就变了。

悼念 Partha Niyogi

突然得到 Partha Niyogi 过世的消息,都说不好自己是什么反应了,又有些震惊吧,又有些伤心吧——虽说我们非亲非故,虽然是导师的导师,但是也从未见过面也没有过任何直接的交流——但是总还是觉得有些难过。其实今年年初听到 Sam Roweis 过世的消息(同样是英年早逝)时都还没有这样强烈的反应,但是后来屡屡在论文中看到 Roweis 的名字,想起来,也有些触动,所以大概这次才会倍感沉重吧!其实我昨天还在读 Niyogi 的一篇论文呢。 >_< 他现在才四十来岁,听说死因是 brain cancer ,我在看到相关的 blog 消息和后面许多认识他的人都说一些和他相处的经历,但是许多人似乎都不知道他原来一直在和如此严重的病魔搏斗。 其他的我也不知道说什么好了。各位各行各业的都要注意身体最要紧呀! >_<

You do (not) know

SPIEGEL: The genome project hasn’t just raised hopes — but also worries. Do you understand those concerns?

Venter: Yes. There are two groups of people. People either want to know the information or they prefer to live like an ostrich with their head in the sand, not knowing anything. The fear is based on the ill-founded […]