在南非约翰内斯堡一个富裕的郊区,一个捡垃圾的人在一所有大门的住宅外整理一袋垃圾。

2019年,在南非约翰内斯堡富裕的郊区,一名男子在一所大门外的垃圾桶里翻找垃圾。图源:Waldo Swiegers/Bloomberg via Getty

在2019冠状病毒病大流行开始时,截至2020年4月初,英国17%的工人失业,英国女性失业的可能性比男性高4.8个百分点1.2017年,南非白人家庭的平均收入(根据家庭规模和组成进行调整)是非洲人家庭的5.6倍(“非洲人”是南非公认的种族分类)2).在美国,2018年的一份报告发现,上世纪80年代出生的人,如果父母的受教育年限分布在后一半,那么他们只有13%的机会进入他们那一代受教育年限分布的前四分之一3.

在所有这些情况下,群体之间的差距并不是由人们工作或学习的努力程度、储蓄的多少或负责任的程度来定义的。相反,这种差距完全取决于个人无法控制的特征:分别是性别、种族和教养。这些都是经济学家所说的机会不平等的例子。

各种证据表明,机会不平等是不平等中最不可接受、对社会危害最大的组成部分。然而,很少有经济学家或其他研究人员试图量化它在衡量一个人口在教育、收入、就业、健康或其他利益结果方面的不平等方面的贡献。

这样做需要尽可能多的关于人们环境的数据——他们的种族或民族、他们成长的社区、他们父母的教育水平等等。即使可以获得这样的数据,对于如何最好地量化由机会不平等造成的人口不平等的比例,也没有广泛的共识。这种情况需要改变。

鉴于机会不平等在公共话语和新兴经济研究中的重要性,政府和研究人员应该收集必要的数据,以构建对机会不平等的可信估计。经济学家和其他人应该开发更好的工具和方法来进行这些估计。

环境问题

机会均等的理想自十七、十八世纪启蒙运动以来就出现在西方政治话语中,直到今天依然突出。

例如,1936年6月10日,美国总统富兰克林·罗斯福在阿肯色州小石城的演讲中说:“我们知道个人能力的平等从来没有,将来也不会存在,但我们坚持仍然必须寻求机会的平等。”同样,美国哲学家约翰•罗尔斯(John Rawls)在其1971年极具影响力的论文中也提到了这一点正义论他解释说,公平的机会平等——即社会上的每个人都应该有同样的机会获得商品、服务和就业机会——是社会公正的两项原则之一。(另一个是所有公民都应该享有与其他人一致的最高程度的自由。)

然而,直到马克·弗勒贝(Marc Fleurbaey)、约翰·罗默(John Roemer)和德克·范德加尔(Dirk Van de gaer)等经济学家在20世纪90年代试图将这些概念正式化,这一概念才得以确立4- - - - - -6.他们认为,一个特定社会结果的所有决定因素(如收入)原则上可以分为个人可以控制和不能控制的因素。他们将第一类定义为一个人的努力,第二类定义为环境。这个简单的提法为机会不平等的经济学理论提供了基础。

随后的研究——主要是在行为经济学领域——表明,不仅仅是哲学家和经济学家关心环境和努力之间的区别。自21世纪初以来,在多个实验室和现场实验中,研究人员给了每个人真钱,并让他们以任何他们希望的方式分配——比如在他们自己和另一个参与者之间,或者在一群参与者之间。

在这种情况下,只有少数人会做出符合预期的选择。”经济人’——这是一种比喻性的物种,其特征之一是纯粹的利己主义偏好。例如,当参与者得到100美元时,他们更有可能放弃一大笔钱(30或50美元),而不是放弃1美元,留下99美元。更重要的是,如果分配钱的参与者提出的分配被认为太不公平,潜在的接受者通常会放弃获得真正金钱的机会来惩罚分配者7

简而言之,人类(甚至一些动物)表现出对公平和平等的内在偏好。

在英国伦敦,一名女子正在一家招聘机构的橱窗里查看招聘启事

在新冠肺炎大流行早期,英国女性比男性更有可能失业。图源:卢克·麦格雷戈/路透社

当经济学家深入研究这些行为时,很明显,人们最反感的不平等类型是由似乎超出个人控制的因素引起的。

例如,在2010年的一项研究中,经济学家雇佣了238名学生,让他们在10到30分钟的时间内尽可能多地打字8.每个学生可以选择短任务或长任务。他们根据答对单词的数量获得报酬,但是,随机的,一些人每答对一个单词得到0.08美元,另一些人得到0.16美元。

随后,学生们被分成两组,每组成员都被告知对方的工作时间、字数输出和报酬,每个学生都可以在组内提出一些收入重新分配的建议。大多数人选择给随机分配的参与者低工资。更少的人选择根据工作时间或质量来补偿,这两项都被认为是在个人的控制范围内8

一个社会弊端

也有越来越多的证据表明,机会不平等对经济增长等其他社会结果尤其有害。

自20世纪90年代以来,研究人员一直在调查收入不平等与暴力犯罪水平等因素之间的关系9或者疾病和死亡10.这项工作普遍发现,不平等导致更糟糕的健康和社会结果。但不平等与增长之间关系的证据远没有那么确凿,不同的数据集和方法会导致不同的结果1112

在过去十年中,由于研究人员将源于机会不平等的不平等比例分离出来,增长和不平等之间的联系变得更加清晰1314

例如,一项研究发现,在1970年至2000年期间,美国26个州的收入不平等程度与经济增长之间没有统计上的显著关联。但是,一旦总体不平等被分解为由预先确定的环境造成的部分(机会不平等)和由其他因素造成的部分,前者确实对增长产生了显著的负面影响13

其他研究支持这样一种观点,即当规模较大的群体仅仅因为其个人环境而被剥夺获得生产机会的机会时,对人类潜力的浪费就会导致经济效率和活力的降低。例如,2019年的一项研究调查了美国医生和律师中白人男性的比例,这一数字从1960年的94%下降到2010年的62%。研究发现,在这50年期间,这种下降(以及其他职业的类似下降)可能占人均国内生产总值(gdp)增长的20-40%。作者认为,这些收益可能来自更有效的人才配置,因为女性和黑人男性(研究的另外两个群体)越来越多地获得以前对他们关闭的职业机会15

但是,如果机会不平等确实构成了不平等的“积极成分”——这是最不受欢迎的部分,也是造成最有害的社会影响的原因——为什么在公开辩论中对这个概念的衡量仍然相对罕见?

数据缺失

“机会”指的是对一个人开放的一系列可能性。因此,这是一个很难量化的概念。然而,基于罗默、范德加尔和弗勒贝的研究成果,经济学家们提出了相对简单的方法来衡量机会不平等。

从本质上讲,这些指标试图量化利益结果(比如收入或教育)的不平等在多大程度上是由于人们无法控制的环境造成的,同时考虑到一个人的努力本身受到环境影响这一事实16- - - - - -18

获得这样的测量方法需要样本或总体中每个人尽可能多的预定环境变量的准确信息。有关种族、性别和出生地的数据相对容易获得。但理想情况下,量化机会不平等还需要一个人的家族史的详细、长期信息,包括他们父母的教育、收入和职业,甚至是养育子女的行为。

1968年,美国德克萨斯州休斯顿,贝勒大学医学院的外科医生在接受媒体采访。

20世纪60年代的外科医生罗伯特·布莱德韦尔、丹顿·库利和格雷迪·哈尔曼(左起),当时美国90%的医生和律师都是白人男性。信贷:美联社/上面

这样的数据在低收入和中等收入国家,甚至在一些富裕国家都很少见。然而,在一些高收入国家,如美国、德国、英国和斯堪的纳维亚半岛的大部分地区,这些问题确实存在。

最终,应该收集两种黄金标准类型的数据,并在所有国家提供给研究人员和政策制定者,以便更好地了解世界各地人们面临的不平等机会。

第一种来自详细的、纵向的家庭调查。例如,1968年开始的美国收入动态小组研究(Panel Study of Income Dynamics),以及1984年开始的德国社会经济小组(social - economic Panel)。这些小组提供了关于当今成年人的父母和育儿行为的丰富信息,并使经济学家能够将不同代人的信息联系起来。墨西哥和印度尼西亚等新兴经济体也开始了类似的举措,但它们在很大程度上仍然是例外。

第二类来自管理数据集,这些数据集将不同代人的个人标识符和人们生活的不同方面联系起来:教育结果可以与就业和健康史、社会保障缴款、纳税等联系起来。

为研究人员提供如此丰富而敏感的数据,也给隐私和保密带来了挑战。但丹麦和挪威等国的研究人员可以获得这些数据,但要遵守旨在保护人们隐私的程序限制。类似的进步在其他地方也在发生,包括智利。

简而言之,只要有足够的投资,就不难想象在全世界范围内如何加强对人们境况数据的收集。

统计难题

即使有最好的数据,经济学家也只能精确地计算出如何使用变量将人口划分为具有相同环境的群体,才能准确地评估机会不平等。

从理论上讲,当数据可用于整个群体时,应该使用这些数据中的所有环境变量。即使这样,一些变量也会被忽略。例如,研究人员可能有谁的父母上过大学的信息,但没有大学排名的信息。由于某些情况总是会被忽视,任何对机会不平等的估计都会被低估。

另一方面,当数据仅适用于总体的一个样本时(通常情况下),使用大量变量来划分样本可能会导致过度拟合。越细的子群体里的人就越少,这就导致了特定群体的估计是嘈杂的。这种抽样误差倾向于夸大由机会不平等所解释的变异份额。考虑到这两种相互矛盾的偏见,研究人员如何决定如何根据环境变量最好地将一个群体划分为子群体?

一种很有前途的方法是使用机器学习技术1920..给定一个具有一定数量的环境变量和子类别的数据集(例如,“种族”可以分为“黑人”、“白人”和“亚洲人”),算法会尝试各种可能的方法将样本分为两组,并使两组均值之间产生最显著的统计差异。然后对每个子组重复这一过程,直到没有发现进一步的显著差异(对于事先商定的统计显著性标准水平)。

在一项未发表的分析中,我和同事们将这种方法应用于6000多个南非家庭的样本,这些家庭的收入和其他数据是由该国的国民收入动态研究在2017年收集的。我们的样本包括自认为属于四个群体之一的人:非洲人、有色人种(南非公认的种族分类)、亚洲/印度人或白人。

我们使用一种算法来分割这个样本,在最后一组中至少留下100个观察值,并使用1%作为两组之间统计显著性的界限。给定这些参数,并仅使用预先确定的情况,如父母的教育程度和父母的职业来进行每次拆分,该算法将样本分为10个子组或类型。

接下来,我们给每个子组中的每个人的收入等于该子组的平均收入,并计算这个“平滑”分配的不平等程度,因此只剩下(子组之间)的机会不平等。

以0.61的基尼系数衡量,这样估计的机会不平等占南非整体收入不平等的66%至74%。(基尼系数衡量的是家庭收入分配的不平等程度,数值越低表明分配越平等。)使用我们的较低估计,0.61的66%为0.40,这与世界银行为美国报告的最新基尼系数相似(2019年为0.42;看到go.nature.com/3xpjmwp).换句话说,南非人口的这十个子群体之间的不平等本质上与整个美国的不平等是一样的。使用更保守的测量方法(平均对数偏差),份额从39%到48%不等。作为比较,2015年对南非进行的一项使用54种类型的研究发现,机会不平等仅占平均对数偏差的17-24%21

这种机器学习方法必须在许多环境中进行测试,以评估它是否真正代表了社会中机会不平等的程度。有些人可能会担心某些算法是方法论上的“黑盒”。但是,在没有因果假设得到检验的情况下,研究人员只是在寻找使用现有数据来衡量机会不平等的最有效方法,机器学习方法似乎很难被击败。

所有的人

机会不平等是不平等在代际间重现的渠道。结合改进的数据收集工作,新的计算统计方法可以帮助量化其在世界各地区域和国家的真实程度。

这些信息将补充经济流动性(成年人收入与其父母收入之间的关系)的衡量标准,后者依赖于一个单一的环境变量:父母收入。它还可以补充衡量收入、财富或教育等总体不平等程度的指标。

事实上,机会和结果最好被看作是同一枚硬币的两面:一个家庭今天的结果有助于塑造他们孩子明天的机会,而这些机会反过来又有助于决定这些孩子未来的结果。