Categories

Calendar

April 2010
M T W T F S S
« Jan   May »
 1234
567891011
12131415161718
19202122232425
2627282930  

关于同行互审

搞科研学术的,对于大部分人来说,发论文就是必不可少的了。可是这个发论文不像平时上课交作业一样,有个老师或者至少是助教来帮你批改,特别是对于一些本身就已经是该领域的领军人物了的人,根本不存在比他们“更高层次”的人来做这种审核。这是一个没法避免的事实,所以学术界几乎都采用同行互审的方式。

其实学术界似乎远没有想象中的那么简单和纯粹,所以我在想是不是什么东西发展到这样一个规模之后必然会有一些诸如潜规则之类的东西出现?总之先不说这个,说 peer review ,其实太具体的东西我也还没有仔细了解过,不过大致的结构还是可以理解的,也就是会有一些比较有声望的人会被选作一个(比如)conference 的评委,然后投到这个会议的论文就(随机地,可能会有一些先验,比如相关研究方向等)分配给各个 reviewer 去审,中间有一些细节可能会有所不同,比如如果自己也投了这个会议的论文的话是不是就不能同时做 reviewer 了,以及 review 到最终决定的过程是否有和原作者之间的 feedback 互动等,但是整体上通常都是如此。不过通常也被划分陈两种比较大的变种,或者说,实际上是三种:

author 公开,reviewer 不公开:也就是最普通的方式了,reviewer 知道自己在审谁的 paper ,但是 author 不知道被谁审了。
author 不公开,reviewer 也不公开:也就是盲审,现在在很多会议上都实行这样的方式。
author 公开,reviewer 也公开:全部公开,似乎不是特别常见,但是也有一些试行。

我想应该第一种是以前最普遍的吧,但是后来人们发现了一个问题,就是如果你是一个很牛的人的话,你的论文或者你挂了名字的论文通常就几乎“百发百中”,一方面可能是大家看到你的名号都不得不给面子,另一方面是一看到你的名号,肯定就会以一种不同的态度(比如,一种仰慕的神色)去读你的论文,相比之下,那些名不见经传的作者通常就比较惨了。

如何生成随机数(上)

快三个月没有写日志了,大概是我开始认真写 blog 来第一次,也是因为发生了一些预料之外的事情,中断了许久,到后来又一直非常非常忙,不过我终于又爬上来冒个泡了,表明我还活着。

第二点要澄清的是,我这里并不是要讲“伪随机”、“真随机”这样的问题,而是关于如何生成服从某个概率分布的随机数(或者说 sample)的问题。比如,你想要从一个服从正态分布的随机变量得到 100 个样本,那么肯定抽到接近其均值的样本的概率要大许多,从而导致抽到的样本很多是集中在那附近的。当然,要解决这个问题,我们通常都假设我们已经有了一个生成 0 到 1 之间均匀分布的随机数的工具,就好像 random.org 给我们的结果那样,事实上许多时候我们也并不太关心它们是真随机数还是伪随机数,看起来差不多就行了。

现在再回到我们的问题,看起来似乎是很简单的,按照概率分布的话,只要在概率密度大的地方多抽一些样本不就行了吗?可是具体要怎么做呢?要真动起手来,似乎有不是那么直观了。实际上,这个问题曾经也是困扰了我很久,最近又被人问起,那我们不妨在这里一起来总结一下。为了避免一下子就陷入抽象的公式推导,那就还是从一个简单的具体例子出发好了,假设我们要抽样的概率分布其概率密度函数为 ,并且被限制在区间 上,如右上图所示。