唐宋韵_文学城博客

女子与数学（2）gender gap

写这篇文章的动机，并不是因为近来刷屏的姜萍，而是网友的一篇博文《数学，无关性别》。说的是她回国以后得知上初三的表哥的女儿，在数学上遇到了困难，尝试请一位重点中学数学老师帮忙，而这位老师冷淡地表示，女生数学掉链子，无能无力……

同作者一样，我不同意那位老师的态度，但我却这样回：

“数学有点不同于其他学科，事情真的比较复杂、难说。

在完全自由的选择和类似的努力下，性别差异的确明显。我曾经近距离、数年之间（因某种契机）深入了解过我们这个学区最好的约20多个 math kids，包括我自己的两个孩子，我觉得总体上性别差异明显。但这其中确有几个个女生数学也是优秀的，其中两个大学里继续学STEM。所以，对于个体来讲不一定。

数学上最优秀者，两性的比例大约是 1：10，这在任何别的学科都是没有的，不能被歧视、偏见、自信心不足等来充分解释。

…… 我可以写一篇说这个问题，但不愿意趟这涉嫌“歧视”的浑水，被人扔砖头。”

她的回答中有两点，我认为非常中肯：1. 就应付大学以前的数学考试而言，她觉得学习数学“开窍”很重要。2. 她不知道女孩是不是从小就被灌输了性别的差异，因而从思想深处就对数学生出了惰性和怯意。

此外，她鼓励我写有关此问题的文章，不要管别人说什么......

好吧，既然我有一些数据、观察和有关的一些思考，就写出来，言者无罪。

性别差异（gender gap）这种说法早就有，但经常是非常宽泛的，比如平均而言男人比女人力气大，暴力犯罪率高，从政人数多，这些都是gender gap。（BTW，两性的智商平均值没有差异，尽管两性在IQ测验的分项上各有所长。）这里，我们将“性别差异”范围仅限于数学的能力或特长。

2009年，总部设在巴黎的国际组织“经济合作与发展组织”（简称经合组织； Organisation for Economic Cooperation and Development，OECD）开始了一项为期3年，每三年重复的“国际学生评价计划”（Programme for International Student Assessment (PISA)），通过测验评价几十个国家的15岁学生的数学和语言能力。本计划的初衷主要是提供一个量化的、显示不同国家初等教育水平的可比较数据，从而帮助各国制定教育政策。

PISA测验的结果，除了反映各国的差距之外，也反映出了显著性的性别差异 — 1. 在大部分国家，女孩的数学分数低于男孩；2. 在所有国家，男孩的阅读水平低于女孩。这是其中一年的全部结果：

另一个反映性别差异的是SAT成绩。下图左侧是40年间的SAT数学成绩的对比。男生的平均成绩始终比女生高30-40分。（但注意y坐标是从450而不是0开始，在视觉上“放大”了差异。）右图是两性在不同分数段出现的频率，同样表明男生在高分段比例高。（在700分以上，男女比约3 ：2 ）。

然而，统计表明在SAT阅读考试上，两性是没有显著差异的，有的年份女生还略有优势。下图是纽约州的Vassar College跨越10年，对其入校新生SAT的统计结果。尽管这所学校比较好，SAT的平均分比美国平均值要高很多，但趋势是一样的，即SAT阅读两性没有显著差异，但数学成绩男性平均高15-25分。SAT两个项目的结果表明，不能把女生数学分数稍低归结为教育机会不均等。

现在我们已经知道有关现象了。为了更全面的分析，我们做一个简单的数学模型，并希望它与现实中的广泛的观察和测量相吻合。我尽量简单地说，争取解释清楚：

在自然界、人类社会、以及心理学和教育学中，大量测量值表现为正态分布（normal distribution），比如人的身高、寿命、血压、考试成绩、智商等。正态分布有严格的定义，这里不多说。正态曲线呈左右对称的钟型，两头低，中间高。均值附近出现的频率最高，离均值越远，出现频率越低。均值μ和标准差σ是正态分布的两个特别重要的参数。均值反映了分布在x轴的位置，标准差反映了离散的程度。如果σ 的值大，则分布比较发散，曲线比较扁平。

下图左显示了正态分布的特点，如在正负1个标准差之内，出现频率高达68.2%，而大于3个标准差出现的频率只有0.1%。举个例子：根据定义，标准智商测验的均值是100，标准差是15。因此智商在85-115的人占了68.2%。而智商超过145的人只有0.1% ，因为45是3倍的标准差。

上图右是理解gender gap的关键：红色虚线钟形图是整个人群（男女合并）的分布曲线。如果男性比女性有优势，那么男性的曲线将右移，而女性的曲线将左移。这个shift有多大呢，我对前面PISA和SAT的数据进行了分析（不细说了），我的计算结果是gender gap大约是0.3个标准差。也就是说男性的曲线较两性总和的曲线（红色虚线）右移0.15σ，而女性则左移0.15σ。

这样一个模型，它是不是大致准确呢？我们来看4种不同标准/水准下，两性究竟表现出什么样的gender gap：

A、基本水准：定义为-1.5 σ以上。即经过一定的努力，一般的数学课至少可以及格。（注意，A包含B，C和D，但上面的描述，是仅限于刨去B、C、D的情况）

B、优秀水准：定义为+1.5 σ以上。这样的学生数学考试经常能得A，可以选AP数学，SAT数学经一定准备，能考700分以上。他们可能参加数学竞赛，但获得优胜比较难。他们在大学里可以学STEM，但不是拔尖的学生。（B包含C和D，但上面的描述，是仅限于刨去C、D的情况。）

C、英才水准：定义为+3 σ以上。这是数学的精英，他们 AP数学和SAT数学都不费劲就能够获得接近满分的成绩，在低级别的数学竞赛中经常获奖。到大学里，他们也是STEM专业的优等生。

D、天才水准：定义为+6 σ以上。这是数学上的最尖端者，他们是在数学上有重大建树、获得数学大奖（包括菲尔兹奖）级别的天才。

好，现在我们来分别看。在下图中，我们着重看右边那个曲线下的绿色部分（大于z分值的发生概率），我用大字明确写在图的最右边。依照该模型，作为总体，有93.32%的学生数学可以基本合格（比如可以及格）。由于根据有关数据推算的正负0.15 σ的shift，相当于对男性而言，数字变成了-1.65 σ以上，而女性变更成了-1.35 σ，对应为男生95.05%和女生91.15%数学可以基本合格。也就是说，达到数学基本要求的比例为1.04 ：1，两性是很接近的，女生与男生达到数学基本要求的人数差不多。

再看看“优秀水准”的情况，这样的个体占整个人群中的6.68%。根据与上面同样的换算方式，男女的比例，实际上是比较1.35 σ以上的频数和1.65 σ以上的频数，这时男女比例比上面一个图增加了，大约是1.8 ：1。这个结果，与SAT数学考700分以上、数学课大多得A、选修数学AP等情况下，男女生的比例是基本吻合的。

【注：有关“C、英才水准”和“D、天才水准”的话题，我们留待下一篇再说。】

向看官致歉，本篇内容比较干，比较boring。而且在没有机理的情况下说数据，可能会被批评为有bias，甚至有“歧视”之嫌。这个问题的确比较复杂，男性比女性在数学上表现略强，可能是社会期待、个人信心以及生物原因综合的结果。当要求较低时，女生几乎与男生一样好，也许是因为努力和训练可以弥补轻微的劣势。看官去看第一张图，整个东亚地区，包括日，韩、新加坡、香港、上海，在那个比较简单的PISA数学测试下，gender gap都是比较小的，我猜想一个原因可能是东亚文化强调用功，而女孩比男孩更自控一些。然而，用功的作用，在需要天赋的一些高难度操作中，作用就有限了。在国际奥林匹克数学竞赛（IMO）选手中，男生比例很高，也许正是因为这个原因。

人做某件事情的动机的强弱，不仅取决于获得成功后的喜悦和回报，而且取决于对成算的判断和为获得成功所需付出的代价。因此，尽管桃子对所有人都是好吃的，“下山摘桃子”与“上山摘桃子”的劲头是不同的。假如那山有两千多米高，一名登山运动员飕飕就上去了，水蜜桃吃着舒坦！我老唐气喘吁吁，爬了不到五百米就give up了。你们说我没吃到桃子是因为自信心不够强？


	【女子与数学（2）gender gap】
	文章来源: 唐宋韵于 2024-06-30 13:49:06