一名莫桑比克护士在健康点聚会上与当地妇女交谈。

研究可以产生重大的社会影响,特别是在低收入国家。

每个研究人员都希望自己的工作有价值,而日益激烈的资金竞争正迫使科学家们展示自己的价值。但是,一个实验、一个发现或一次公开演讲的真正价值是什么?

荷兰莱顿大学(Leiden University)的政策研究员Ingeborg Meijer说,科学和科学家影响着社会的许多方面,捕捉它们的全部影响是一项复杂的任务。尽管如此,她说,充分认识和奖励科学家的贡献是至关重要的。在她看来,对研究影响有一个更广泛的认识是确保科学家履行其社会契约的唯一途径。她说:“社会对大学寄予厚望,希望它们帮助解决重大问题。”“如果你想做到这一点,你必须确保科学在早期阶段就与社会联系起来。”

然而,德国慕尼黑马克斯·普朗克学会的科学政策研究员Lutz Bornmann说,可能最有意义的影响是那些最难以衡量的影响。他说:“很难找到或产生衡量社会影响的良好指标。”但这并没有阻止过去几年来衡量影响的许多尝试,比如癌症药物延长了人们的生命;儿童发展理论为学校政策提供信息;或者包括ChatGPT在内的人工智能机器人,重新定义了社会对创意写作的看法。在影响因子和引用数比以往任何时候都受到更严格的审查的时候,人们正在寻找更多的方法来衡量社会影响,并帮助加强公共科学投资的理由。

质量评估

政府和资助机构在过去十年中为更好地了解其研究投资回报所做的努力,为更全面地评估影响奠定了基础。例如,英国研究卓越框架(REF)于2014年启动,并于2021年重复推出,通过对影响进行评分来衡量英国大学研究贡献的质量,它将影响定义为对“经济、社会、文化、公共政策或服务、健康、环境或学术界以外的生活质量”的任何影响或收益。这比它的前身“研究评估活动”(Research Assessment Exercise)更进了一步,后者从1986年到2008年定期评估英国的研究,但没有单独考虑社会影响。对于2021年REF,专家小组考虑了近6800个影响案例研究(大多数可在可搜索数据库中查询;看到go.nature.com/3y6rs),由大学院系整理的文件,试图解释他们的研究在学术界之外的影响。以伦敦大学学院(University College London)的危机解决团队优化和复发预防项目为例,该项目旨在为应对严重危机的心理健康专业人员提供循证指导。案例研究认为,该计划改变了英国国家卫生服务体系“在精神健康危机护理方面的国家和国际政策和实践,为患者带来了好处(特别是减少了住院拘留的使用),并大大节省了成本”。

2016年,荷兰应用科学大学协会(NAUAS)在一份名为《科学贡献》的文件中对科学贡献进行了广泛的审视Onderzoek遇到了Impact(影响研究)(见go.nature.com/3wtq3).该报告概述了大学研究应影响的十个社会领域,包括健康和活力、教育和人才发展、社会复原力、可持续交通、可持续农业和负责任的企业。这份文件强调了NAUAS对证明研究价值的兴趣,但是,正如梅杰解释的那样,它没有包括任何实际跟踪影响的方法。

然而,在表达衡量广泛影响的意图和实际创建一个这样做的系统之间往往存在很大的差距。英国布莱顿萨塞克斯大学的科学政策研究员保罗·南丁格尔说:“评估文化对科学的影响还没有达到它可能达到的程度。”当政府把钱花在道路、教育或福利计划上时,它很清楚从社会和经济价值的角度来看,其投资回报可能是多少。“在英国,科学是唯一一个没有适当影响评估的重要公共资金领域。”

评估影响是具有挑战性的,但仍然有一个很好的理由去尝试,南丁格尔说:“如果你能进行适当的评估,(对科学的)投资回报将非常高。”过去几年里,波恩曼、梅杰和其他人所做的努力正在为更全面地评估科学及其对政策、经济和其他领域的影响奠定基础。

政策的影响

伦敦的自由数据科学家Martin Szomszor说,理论上,系统地跟踪研究和政策之间的联系应该是可能的,包括政府政策和临床指南。Szomszor于2022年11月共同撰写了一篇论文1调查从政府、智库、政府间组织和慈善机构收集的政策文件数据库。正如Szomszor解释的那样,政策文件中的引用可能比阅读量高的期刊中的引用更有意义。他说:“这是证明研究确实改变了行为的重要方式。”

Szomszor和合著者Euan Adie发现,发表在社会科学和人文科学期刊上的文章特别有可能在政策文件中被引用。Euan Adie是创建该数据库的伦敦公司Overton的创始人和董事。根据该数据库,2010年在这些领域发表的近3.7万篇文章在接下来的十年中产生了近26万次政策引用,几乎每篇文章有7次政策引用。相比之下,2010年在物理科学和工程期刊上发表了近1.8万篇文章,但这些文章在同一时间段内产生了大约6.3万次政策引用,即每篇文章约3.5次政策引用。大量的可用数据增加了创建类似于政策影响指标的可能性h-指数,一个衡量研究质量和生产力的数字,Szomszor说。“决策者喜欢有一个单一的数字。它很便宜,而且流程更直接。”

但是,这样的分数可能会过于简化研究的影响,而未能认识到真正改变了政府、医学学会或其他机构行为的科学家。Szomszor和Adie将特定大学的政策引用得分与2014年REF影响数据库中的得分进行了比较。他们的分析表明,政策引用最多的机构往往会被REF的同行评议者给予更高的分数,但这种相关性并不是特别强。一个重要的教训是:从政策数据库中得出的简单分数很可能达不到要求,Szomszor说。包括某种形式的同行评议,“这将使你能够判断政策影响的价值”将是更好的。

不过,他说,收集和分类政策引用将有助于拓宽研究影响的图景。他说:“这类数据库为研究提供的政策影响的证据将变得非常重要。”“它提供了一个更全面的研究贡献观点。看看事态如何发展将会很有趣。”

创新和经济影响

总部位于瑞士日内瓦的联合国机构世界知识产权组织(World Intellectual Property Organization)的经济学家文施-文森特(Sacha Wunsch-Vincent)说,研究往往会推动新技术和新产品的发展,但追踪某个研究人员的创新影响可能是一个棘手的过程。该组织编制了年度全球创新指数(GII),该出版物考虑了包括政治环境、科学和教育资源以及专利创造在内的一系列领域的大约80个指标,对132个经济体的创新影响进行排名。瑞士在最新一期排名中得分最高2但越南和卢旺达等创新表现良好的欠发达国家也受到了重视。

潜水员在珊瑚监测站进行一般保养工作。

一位海洋生态学家在监测气候变化对红海珊瑚影响的观测站工作。图源:Lukasz Larsson Warzecha/Getty

Wunsch-Vincent说,创新对科学和社会都是必不可少的,而确定最重要的项目和研究人员正变得越来越重要。但衡量创新的最简单的指标可能并不是最具启发性的。他说:“我们在衡量中间创新产出方面做得特别好,比如专利或引用。”“但也有严重的负面影响。”就像研究人员经常在他们的出版物中引用自己来提高自己的影响因子一样,发明家也经常在专利申请中引用自己的工作。他说,在许多国家,专利不成比例地引用同一国家的其他专利是很常见的,这种倾向被称为本国偏见。

南丁格尔说,大学研究可以产生广泛的经济影响,远远超出专利或衍生公司的范围,首先是培养一支熟练的劳动力队伍。“我们从研究和教学中培养出的最重要的东西是学生。如果你考虑未来收入,这是一笔巨大的价值。”他指出了经济研究的深远影响:上世纪70年代和80年代的工作帮助英国政府采取了针对通胀的新战略,这大大增强了英国经济。

总部位于华盛顿特区的非营利组织AUTM进行了一项调查3.衡量197家研究机构2020财年的创新产出。这些机构公布了超过2.7万项“发明披露”,这是迈向作为创新信号的专利的初步步骤。学术研究中心的发现直接催生了1000多家初创企业。Wunsch-Vincent说,在单个研究人员的层面上跟踪这些结果将有助于确定科学领域的主要创新者。他补充说,根据他的经验,瑞士——全球创新指数中排名第一的经济体——的教授们无论以何种标准衡量,通常都得分很高。他表示,苏黎世的一位机器人或生物技术教授拥有一家分拆出来的公司,并吸引谷歌或诺华(Novartis)等有影响力的公司提出收购要约,这种情况很常见。

社会和环境影响

南丁格尔说,研究的巨大社会影响比经济影响更难衡量,但这并不削弱它们的重要性。他说:“非经济研究产生了惊人的影响。”“研究人员在人文和社会科学领域开展了批判性工作,促使我们重新思考我们所重视的东西,并呼吁不平等现象。”例如,他说,在女权主义方面的学术研究可以说有助于促进社会和工作场所的公平。

在更广泛的层面上,科学有潜力通过解决气候变化等全球环境危机来改变地球,并改善贫困社区的福祉。联合国可持续发展目标(SDGs)由17个目标组成,旨在解决包括贫困、饥饿和清洁能源在内的全球最大挑战。该目标正越来越多地被用来衡量这种影响。

大学和研究人员通常会吹捧他们对可持续发展目标的承诺,但2022年的报告4由苏塞克斯大学、伦敦大学学院和联合国开发计划署的研究人员组成的一个联盟,总部设在纽约市,他们提出,研究在很大程度上未能实现这些目标。报告发现,95-98%的专利和发明以及60-80%的学术出版物“与可持续发展目标不一致”。该报告发现,在高收入或中等收入国家进行的研究中,只有约30-40%与可持续发展目标有任何联系——远低于低收入国家的60-80%——报告还描述了缺乏数据和对可持续发展相关研究资金实际使用情况的了解,以及这些研究的影响如何扩散到学术界之外。报告的结论是,“还需要进行重大投资,以收集有关所有背景和部门的知识和创新投资及生产的数据”。

文化影响

替代指标(Alternative metrics)或“altmetrics”试图通过社交媒体、新闻网站和其他渠道跟踪研究的影响力,而不是通过学术引用。它们的创建是为了更全面地讲述研究影响的故事,但Bornmann说,到目前为止,它们还没有达到这一目标。例如,他说,计算一篇论文在社交媒体上的提及量并不能揭示它的真正意义:任何人都可以在社交媒体上分享一篇论文,包括那些不相信结果的人,他们这样做是为了批评研究,或者传播关于其发现的虚假信息。他说:“如果你看看论文上的推文,很明显,在大多数情况下,人们对论文没有深入的理解或深入的阅读。”“人们真的可以质疑这样的数据如何用于研究人员的评估。”

波恩曼与人合著了一项2020年的研究5该研究调查了约200名申请苏黎世瑞士联邦理工学院环境与可持续能力中心(Competence Center Environment and Sustainability)资助的研究人员的altmetric得分——由数据公司altmetric收集的基于社交媒体帖子、新闻提及和维基百科条目的数据。该研究发现,另类指标得分与获得资助的可能性之间只有微弱的相关性,这表明分数并不能很好地代表研究质量。

Bornmann说,如果要让替代指标成为融资决策的可靠基础,就需要改进和验证它们。他补充说,如果在“不清楚它们是否有效”的情况下仍在使用此类指标,那将是“一种糟糕的情况”。他说:“需要对这些指标进行更长时间的研究,然后它们才能用于评估。”

全体人员就位

尽管面临着许多挑战,但充分利用研究的影响远不是一项失败的事业。受到影响研究计划的雄心勃勃的目标的启发,Meijer一直在探索可以衡量荷兰大学研究人员的各种影响的框架。在论文中6她在2021年与人合著的一份报告中指出,任何成功的方法都必须包括研究人员以及支持这项工作的行业、政府和资助者的投入。

在这篇论文中,Meijer指出了一种很有前途的“贡献映射”方法,这种方法使用结构化访谈来跟踪单个科学家和非科学家之间的联系。映射是实时进行的,从项目开始开始,一直到项目管理,这是一个时间和劳动密集型的过程,根据定义,它跨越了学术界和工业界。但她表示,只有在所有参与者都愿意参与评估的情况下,这种方法才会奏效。事实证明,对于大学以外的部门来说,这很难做到。“外部用户更难找到,也更难吸引,”她说。“他们要么想要报酬,要么根本不感兴趣。”这或许说明了衡量社会影响的一个主要障碍。在国际上达成一致的跟踪影响力的方法之前——就像那些用于量化学术影响力的方法一样——已有的有前景但耗时且复杂的解决方案需要不断完善。