5

《女士品茶》中的零碎片断

 3 years ago
source link: https://yihui.org/cn/2007/12/stories-in-the-lady-tasting-tea/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

《女士品茶》中的零碎片断

谢益辉 / 2007-12-06


今晚索性把这本书从头到尾读一遍,顺便记录一些零碎片断:

  • Karl Pearson 本来叫 Carl,后来因为崇拜卡尔・马克思把自己的名字改成了 Karl。
  • 科学家在土壤肥力对农作物的影响上争吵了 20 年,被 Fisher 一篇论文用简单的数学公式结束了这场战争。后来 Fisher 还指出其实气象影响要远大于肥力影响。
  • 在 Fisher 的实验设计提出之前,科学家浪费了好几十年时间在无谓的实验和争论上。
  • Karl Pearson 最早提出了统计的参数(分布)体系,由四个 Moment(一到四阶矩)构成。
  • Biometrika 是世界上第一本印有全彩照片的期刊,Galton 他们那时候太有钱了。
  • Karl Peason 关于分布函数和参数的思想统治了 20 世纪的科学,并在 21 世纪初仍保持着优势。
  • 大名鼎鼎的 t 分布是 Gosset 拿笔算然后画图发现的。
  • Karl Peason 故意贬低 Fisher 的成果(嫉妒?),闹得二人彼此很不爽,Fisher 在 Biometrika 上发表了两篇文章时就闪人了,把自己的文章都发到别的刊物上。
  • Fisher 从小视力严重受损,不能在人工光线下看东西,因此只好凭几何思维在脑子里想象,从而发展出强大的几何直觉能力,这种能力帮他解决了大量的数理统计难题,这些难题难度之高,别人花几个月或几年时间才能证明,而他一想就想出来了。他教学生很没有耐心,因为他总是觉得问题很简单,但学生无法理解。
  • 当年 Fisher 的巨著都是拿一台原始的带有手摇曲柄的机械计算器摇着算出来的,据说光是一张表格就要花近 200 个小时去摇曲柄。(看样子那个年代写统计论文简直就是体力劳动)
  • Fisher 帮 Tippett 找到了极值分布的答案;1958 年 Gumbel 出版了关于极值的权威教材”Statistics of Extremes”(少有的经典教材)
  • Fisher 提出了一致、有效和无偏性三大准则。
  • Hoeffding 提出了 U 统计量,为中心极限定理的证明提供了间接而重要的支持。
  • 运筹学诞生于二战期间(军事需要)。
  • Pearson 提出了 Chi-square 拟合优度检验。
  • Neyman 和小 Pearson 合作(确切地说是前者给后者在数学上帮忙)诞生了假设检验中著名的 NP 引理,在此之前,首先是小 Pearson 对他爹的 Chi-square 检验提出了质疑(只有一个假设,没有备择)。
  • 大 Pearson 打压 Fisher,Fisher 一辈子攻击 Neyman,但 Neyman 态度非常好。
  • 置信区间的概念自打 Neyman 提出之时就让人找不着北(概率的北),直至今天人们仍然对这个概念有着极深的误解。
  • 贝叶斯定理的提出让统计学家们很恐慌,因为难以想象用后验概率推先验概率是一件多么可怕的事情。
  • 凯恩斯的博士论文是关于概率的研究。
  • 贝叶斯思想有两种:一种是贝叶斯层次模型(那个定理),另一种是个人概率(信仰),后者为凯恩斯所力挺。
  • 柯尔莫哥洛夫的 “概率论的公理化”(axiomization of probability theory),至今仍是学校中讲授概率论时采用的唯一方法。这种方法永久性地解决了有关概率计算有效性的所有问题。(若没有 Kolmogorov,我们搞统计的可能至今还处于被排斥的地位)
  • 弗洛伦斯・南丁格尔发明了饼图。
  • Wilcoxon 是化学家,由于实验中离群点的苦恼,产生了非参数的检验。
  • Pitman 解决了非参数统计的两大疑问:若本来有参数分布但仍然用非参方法会有多不好?数据应该多差才能体现非参的优势?(1948 年 Annals of Statistics,成名作)
  • Mahalanobis 家里非常有钱;他建立了印度统计研究所;Rao 是他的学生之一。
  • Wassily Leontief 计算 24*24 的矩阵的逆矩阵时,曾经向哈佛大学购买过一个 “逆矩阵”,主要原因是手工计算得花上几百年时间,而哈佛大学刚好发明了第一台原始的计算机,但是 Leontief 所在的政府部门却无法为此项服务付费,因为当时只有货物可以购买,服务不可以购买,这个会计问题后来就被作为固定资产处理了,购买发票上写着购买的固定资产是 “逆矩阵”。
  • George W. Snedecor 在 Iowa State College 创建了美国第一个统计系。
  • Gertrude Cox 是 Iowa State College 统计学系的第一个统计学硕士。
  • Grace Wahba 的样条拟合对后世的样条理论产生了重大影响,她也提出了 Log-linear 模型。
  • ETS 的评分系统与 Wilks 有关。
  • 计算机领域的两个基本术语 bit 和 software 竟然是 John Tukey 造出来的!(rootgram 和 boxplot 就不说了)
  • George Box 是 Fisher 的女婿。
  • W. Edwards Deming 重塑了日本的产业界。
  • Stella Cunliffe 说:“我们经常嘲笑社会学家的分析方法过于粗略,然而作为统计学家,除非我们能为他们提供一些更加科学、更易接受的思想,否则又有什么资格嘲笑他们呢?要实现这一点,我们之间应该是互动的。”(很中肯的话)
  • Levi 在探索中心极限定理中正态分布成立条件时创建了鞅的概念:1. 变异是有界的,因此个别值不可能是无穷大的,也不可能是无穷小的。2.下一个数字的最佳估计值必是它的前一个数值。Martingale 一词本身起源于法国一个小镇,镇上的人非常小气,据说他们下周要花的一点小钱,估计起来最有可能等于他们今天花的钱。
  • Fisher 在《统计方法和科学推论》(Statistical Methods and Scientific Inference)一书中建议,对于 P 值多大才有意义,最后结果应视情况而定。Fisher 从没有很明确地说明他怎么使用 P 值,他只是提供一些例子。
  • 1987 年 T. Yamakawa 将核回归(Kernel-based regression)应用到调焦照相机(“模糊系统”)

八卦笔记到此结束。

别拿管理员当干部 看书打岔:魔神英雄坛(神龙斗士)

Disqus Utterances Preferences

© Yihui Xie 2005 - 2020

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK