Categories

Calendar

September 2017
M T W T F S S
« Jun    
 123
45678910
11121314151617
18192021222324
252627282930  

荐书:《女士品茶》

这本书的全名为《女士品茶:20世纪统计怎样变革了科学》,英文原名为 The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century 。从副标题已经可以看出来它讲的内容是什么了,而从主标题也可以看出这应该会是一本很有趣的书。事实也确实如此。

我最近发现这本书之后它就几乎占满了我所有的空余时间,本来准备看完以后再来推荐,但是现在看到一半已经实在是忍不住了。总的来说这是一本好书,我最开始发现它也是在 newsmth 的统计版上看到有人推荐,而且书的作者 David Salsburg 本身也是牛人,我们会发现并不是所有的科学家都是那种自己思维极度活跃跟正常人根本无法沟通的,其实有许多牛人写的科普类读物是非常易懂并且非常有趣的,并且这些看似随意的文字描述的背后其实有着坚实的理论基础,完全的外行人会觉得这是一本有趣的书,另一方面,在该领域有很深造诣的人,又会从字里行间读到其背后隐藏掉的复杂数学,可以看作对自己所学知识的一次整理。

当然我是属于前一类读者,虽然有听说过 Pearson 、Fisher 之类的名字,但是对于统计学的产生和发展以及一些更深层次的应用和理论并不是特别了解。所以我就完全把它当作一本休闲读物来看了——确实是非常有趣的。此外,我觉得等以后自己对这个领域有了更多的一些了解之后再回来看一遍这个书,估计又能尝到另一番味道呢。如果容许我剧透一下的话,里面会有各种 8g 趣闻,比如但凡学过“数理统计”这门课的人应该都知道有一个叫做“t 分布”的东西,如果不是特别死板的老师的话,通常会告诉大家叫 t 分布这个名字是因为发表该分别的家伙以 student 署名,不过如果你想知道这个以 student 署名的家伙到底是谁,以及为何要这样匿名来发表,就需要看这本书了。

上帝与新物理学

我想说的是:这无疑是一本非常不错的书,至少对于我这样需要被科普的人来说。

起因是程序员的十层楼 10层(下)这篇文章。且不论这文章原本是要说什么的,文中提到的宿命论的观点却是我一直都相信的,因为我自己之前偶尔也想过,我就觉得世界就应该是有一些绝对的真理,如果把整个宇宙看成一个大的系统的话,给它一个初始状态,它就能全自动地按照预定的规则精确地运行下去——也就是说,一切都是决定好了的。

不过即时如此,我们人却也不能完全地对世界的运行进行预测。不过我并不是从原文的“测不准原理”那里来想的,我只是觉得,我们人类现在所有处理问题的方式,都有一个归纳的过程,而归纳就代表着近视。类比到机器学习中的话,我们的算法要有一个归纳偏执,对于一个完全没有归纳偏执的算法来说,很容易就 overfit 到训练数据中去了—— overfitting 的结果就是在未知的数据上表现不佳,因此我们通过增强归纳偏执,用降低模型复杂度的代价来避免 overfitting ,这里就是一个近视——用相对简单的模型去近视原本比较复杂的模型。这里总有一个平衡的问题,bias 减小了,variance 就会增大,反之亦然。然而有一种情况可以完全避免 overfitting:那就是我们已知了所有数据的时候。(Over)fit 到所有数据上,这不正是我们说希望的吗?可是人的问题在于无法获取所有的数据,因此只能采取折衷的办法进行近视,做到在一定的时间或空间范围内近视地预测,受制于蝴蝶效应。