统计学家南丁格尔

每年5月12日被定为“国际护士节”,之所以选在这一天,和一位19世纪的杰出英国女性有关——弗洛伦斯·南丁格尔。她被认为是现代护理的开创者。也许是她夜间在战地医院巡查伤员的“提灯女神”形象太过深入人心,以至掩盖了她在历史上的另一个重要身份——一位做出了自己独特贡献的统计学家。

1820年5月12日,南丁格尔出生于英国一个上层家庭。父亲威廉·爱德华·南丁格尔毕业于剑桥大学三一学院,从家族继承了一大笔财富。母亲弗朗西斯·南丁格尔·史密斯是国会议员、废奴主义者威廉·史密斯的女儿。

在一个充满自由精神和人道主义情怀的富裕家庭长大,南丁格尔和姐姐从小就接受了那个时代大多数女性无法享有的全面教育,包括算术、植物学、法语、地理、绘画和钢琴。南丁格尔对数学情有独钟,在她的一再要求下,父亲聘请了一位很大牌的老师詹姆斯·约瑟夫·西尔维斯特来教她。西尔维斯特在矩阵理论上做过重要的工作,并发现了三次方程的判别式,被同行评价为“精通最现代的科学形式”。

对南丁格尔来说,统计学的进展对她产生了尤为重要的影响。1798年,苏格兰地主约翰·辛克莱爵士在他的《苏格兰统计报告》中,引入“统计”一词。在新发明的蒸汽印刷机的帮助下,大量数据可以被国家机构、组织和个人进行整理和传播,并用于社会实践。

一些讲统计学方法的着作也在当时的文化圈中流行。其中,比利时天文学家、气象学家和统计学家阿道夫·凯特勒的作品给了南丁格尔很大启发。凯特勒于1835年出版了《人类论》,描述了他所提出的“平均水平的人”这一概念,其特征是遵循正态分布的测量变量的平均值。我们熟悉的体质指数(BMI)量表也是凯特勒开发的。南丁格尔从他那里学到的是,要有条不紊地记录一切事实。1837年至1839年旅行期间,她对所经之处的法律、土地制度、社会条件和慈善机构做了细致的观察和记录。

1854年冬,当南丁格尔从慈善医院带着38名女性志愿护士赶到土耳其司库塔里的军营,发现那里的士兵因为营养不良、卫生奇差、空气污浊以及过度劳累而大批死去,导致其丧生概率远远高于阵亡时,她第一时间拿起她的统计学和统计图形学知识作为武器。

南丁格尔最早出版的书之一——《关于影响英国军队健康、效率和医院管理事项的说明》(1858年),就用翔实的统计数据表明,英军的高死亡率是由营地糟糕的卫生条件造成的。她以此告诫决策者,“我们的士兵应征入伍,在军营中被处死”。书中使用了后来被称为“南丁格尔玫瑰图”的极坐标区域图,来突出显示战争期间因疾病而死亡的人数。为了说明问题的严重性,在其中一个区域图中,她直接把军队中的死亡率与曼彻斯特(当时英国最不健康的地区之一)的平均死亡率进行比较,于中心位置用虚线标出。

玫瑰图是南丁格尔首创的一种数据表现手法,她也因此成为被《统计图形的黄金时代》致敬的统计图形开创者之一。传记作者休·斯莫在解读这张玫瑰图的时候表示,自己曾经试着把这张图改成柱状图,操作时才发现楔形在表达上要比柱状有力得多。原因主要有3点:首先,南丁格尔把第一年和第二年的数据分开,因为这当中体现了卫生委员会到来、死亡率下降的分割;其次,柱状图模糊了年份之间的对比和季节之间的对比,而楔形图既做到了把两个年份分开,又把它们排在一起比较;最后,1月的死亡率非常高,会让人以为这是寒冬的原因,而南丁格尔用面积取代长度来表示,平方根的转换会使这种效果变弱。体会到这些细节以后,你会惊叹,这真的只有极其深厚的学科功底和对素材有极深的理解才能实现。

南丁格尔的军队数据统计,最初是和苏格兰医生托马斯·格雷厄姆·巴尔弗合作完成的,后来也得到当时英国最重要的统计学家威廉·法尔的帮助。二人相识于1856年秋天的一个晚宴上。南丁格尔强烈意识到,这是她对英国军队做医疗改革所需要的有力帮手,于是邀请法尔来帮助自己整理从前线带回来的第一手资料。这开启了他们20多年的合作,她后来的重要着作《医院笔记》(1859年)和《疗养医院介绍笔记》(1871年)都得到了法尔的帮助。

南丁格尔于1858年入选英国皇家统计学会,1874年又被美国统计协会选为荣誉成员。后辈同行埃德温·科普夫在《美国统计协会会刊》(1916年)的纪念文章《作为统计学家的南丁格尔》中写道,从战场回来后,南丁格尔一直致力于医院统计的规范化。1861年,在都柏林召开的国家社会科学促进会议上,南丁格尔递交了一篇认真准备的论文《医院统计与医院规划》,其中,她强调医院疾病统计的7个主要制表要素分别是:每年第一天在院病人数;年内入院病人数;年内康复或病情缓解病人数;因无法治愈、未得到缓解、违规或自己要求而出院的病人数;年内死亡病人数;年末存留病人数;病例的平均持续时间。这些表格要素需汇编为7个单独的表格,每个表格按性别和年龄分类显示。她相信,这些补充表格将揭露败血症和坏疽等医院流行病的丑闻。

科普夫还举了一个例子,是南丁格尔在医院迁移中使用了统计方法。当时,东南铁路公司提议拆除圣托马斯医院,以便延伸从伦敦桥到查林克罗斯的路段。对此,南丁格尔分析了医院服务对象的来源,将辐射范围内的病例按比例制成表格,并显示了将医院迁往规划中的几个地点对病人可能产生的影响。

这种根据人口需求调整医院地址的方法,在近年重新得到重视,它代表了人口学原理在研究城市需求方面的合理应用。她在1861年英国的全国人口普查中也提出了很多建议。

南丁格尔生前曾极力促成在牛津大学建立统计系,但牛津大学直到1988年才把生物数学系更名为应用统计系,距离她去世已经超过了3/4个世纪。