Douglas Guilbeault1,* ,Solène Delecourt2 ,Bhargav Srinivasa Desikan3,4
(1. Graduate School of Business, Stanford University, Stanford, CA, USA,
2. Haas School of Business, University of California, Berkeley, Berkeley, CA, USA,
3. Autonomy Institute, London, UK,
4. Oxford Internet Institute, University of Oxford, Oxford, UK
编者按:
本文聚焦一个长期被讨论却缺乏系统量化证据的关键问题——年龄与性别刻板印象究竟是现实的反映,还是被网络媒体持续放大的社会性扭曲。Guilbeault 等在 Nature 发表的这项研究,通过构建跨图像、视频与文本的大规模多模态数据分析框架,首次将“年龄”这一具有客观锚点的变量引入刻板印象研究之中,为评估性别偏见的真实性与失真程度提供了坚实的实证基础。研究发现,尽管美国人口普查数据显示女性与男性在劳动力市场中的年龄分布并无系统性差异,但在主流互联网平台与大语言模型中,女性却被一致性地呈现为“更年轻”,且这一偏差在高地位、高收入职业中最为显著。该工作不仅揭示了数字媒介中年龄—性别联合偏见的普遍存在,也指出主流算法在无意中放大这种偏见的风险,对理解智能系统中的结构性不公平具有重要启示意义。
在人类社会中,刻板印象往往以统计关联的形式潜移默化地影响认知与决策,但其是否真实反映社会结构,始终存在争议。以往研究受限于样本规模、单一模态或缺乏客观参照,难以在文化表征与现实数据之间建立直接比较。本文从这一瓶颈出发,系统整合了来自 Google、Wikipedia、IMDb、Flickr、YouTube 等平台的逾百万张图像与视频数据,并结合多种主流语言模型的文本表征,刻画了互联网文化中性别与年龄的联合分布特征。通过与美国人口普查数据进行对照,作者清晰地表明:数字空间中的性别—年龄关系并非现实的简单映射,而是一种被系统性夸大的文化失真。
更进一步,研究并未止步于描述性分析,而是通过预注册的全国代表性实验与对 ChatGPT 的审计实验,揭示了这种失真如何通过搜索引擎与大模型被“算法性放大”,并进而影响个体信念与招聘决策。实验结果显示,接触职业图像会显著强化“女性更年轻、男性更年长”的认知预期,而在简历生成与评估任务中,大模型倾向于将女性设定为更年轻、经验更少,并对年长男性给予更高评价。这些发现表明,年龄与性别并非独立维度,其交叉偏见可能在智能系统中形成隐蔽却影响深远的决策倾向。
总体而言,本文在方法上实现了三方面突破:其一,提出以客观人口统计数据为参照,系统评估刻板印象“准确性—失真性”的研究范式;其二,通过多模态、大规模数据揭示年龄—性别偏见的文化广泛性;其三,直接连接在线表征、算法放大与现实决策后果,为算法公平与AI治理研究提供了可操作的实证路径。该研究不仅深化了我们对数字时代刻板印象生成机制的理解,也为未来在智慧治理、算法审计与公平导向的模型设计中,如何识别并缓解交叉偏见提供了重要理论与实践依据。
资料来源:
根据Douglas Guilbeault等于2025年发表在Nature题目为《Age and gender distortion in online media and large language models》的文章缩写整理而成。
(本文责任编辑:蒋新宇)