笔记本电脑屏幕上图书馆

一些人工智能工具旨在帮助研究人员总结科学发现。来源:迪米特里奥蒂斯/盖蒂

作为大型语言模型(llm)开始,包括GPT-4疾驰,OpenAI背后的最新技术ChatGPT——科学家们开始利用他们的权力。爆炸的工具由人工智能(AI)包括几个搜索引擎,目的是使研究人员更容易掌握的科学论文或总结字段的主要发现。他们的开发者声称应用将民主化和简化访问研究。

但是一些工具需要更多的改进之前,研究人员可以使用它们来帮助他们的研究中,科学家尝试用他们说。克莱门泰Fourrier是拥抱巴黎的研究员评估llm的脸,一个公司在纽约开发开源AI平台。她使用了一种被称为引起人工智能搜索引擎,利用LLM工艺其答案,帮助找到报纸对她的博士论文。引起语义学者数据库中搜索报纸广告标识顶部通过比较研究论文的标题和摘要搜索问题。

变量的成功

Fourrier说,根据她的经验,引起不总是选择最相关的论文。工具有利于建议论文”,你可能不会看了”,她说。但其论文摘要是“无用”的,“它也会提出很多东西并不直接相关”,她补充道。“很有可能,你会犯很多错误,如果你只用这个。”

Jungwon Byun,首席运营官,该公司在旧金山,加州,建造引出,表示:“我们目前有成千上万的用户提供多样化的专门化所以引起人们必然会弱一些查询。“这个平台的作用不同于其他搜索引擎,Byun说,因为它更少关注关键字匹配,引用计数和时效性。但是用户可以过滤这些东西。

其他研究人员有更多积极的体验与工具。“Elicit.org是迄今为止我最喜欢的搜索,“亚伦泰说,新加坡管理大学的图书管理员。“这是接近取代谷歌学术搜索我的第一首选搜索学术搜索,”他说。“在相关性方面,我所经历的情况恰恰相反(Fourrier)引起。我通常得到大致相同的相关性作为谷歌学者,但偶尔,它解释我的搜索查询更好。”

这些差异可能field-dependent,泰建议。Fourrier补充道,在她的研究领域中,时间是至关重要的。“一年机器学习是一个世纪在其他任何领域,”她说。“任何之前五年完全无关,”,引起不接,她补充道。

全文搜索

基于另一种工具,scite的开发人员在纽约市,使用一个LLM组织论文引文(包括添加上下文,何时以及如何通过另一篇论文被引用论文。而ChatGPT是臭名昭著的“幻觉”-发明引用不存在scite及其“助理”工具去除头痛、scite首席执行官杰克·尼科尔森说。“最大的区别在于,我们从ChatGPT输出,对我们的数据库搜索,然后匹配语义对真正的引用。“尼克尔森说scite与30多个学术出版商合作包括威利等主要公司和美国化学学会和签署了一系列索引协议——给工具访问数以百万计的学术文章的全文。

尼科尔森说,scite也是合作与共识——一个工具,使用人工智能提取和蒸馏结果”直接从研究——2022年由程序员埃里克·奥尔森和基督教礼拜堂,在马萨诸塞州的波士顿。共识是建立对那些不是他们寻找专家萨勒姆说。“但我们实际上有很多的研究人员和科学家们使用该产品,”他补充道。

使用语义学者数据引出,共识。“我们有一个数据库1亿- +声称我们从文件中提取。然后当你搜索时,你实际上搜索这一说法,”奥尔森说。共识人员手动国旗有争议或证明索赔——例如,疫苗导致自闭症,奥尔森说。“我们要去一个国家,所有的自动化,”萨勒姆说,“复制一个专家在这个领域会检测一些劣质的研究。”

改进的余地

梅根·Azad,儿童健康儿科医生在温尼伯马尼托巴大学的加拿大,问共识疫苗导致自闭症,不相信的结果,说,70%的研究说,疫苗不会引起孤独症。“是关于词的一条引用的父母相信疫苗导致自闭症吗?”,用这个来计算其共识。这不是研究提供证据,是或不是,它只是要求人们相信什么。”

Mushtaq Bilal,博士后在欧登塞的南丹麦大学的,人工智能工具和测试微博如何最有效地使用他们。他喜欢引出,看着共识。“他们正在试图做的是非常有用的。如果你有一个是/否的问题,它会给你一个共识,基于学术研究,”他说。“这给了我文章的列表,它穿过到达这个共识,“Bilal解释道。

Azad认为人工智能搜索引擎的作用在未来的学术研究中,例如更换所需的几个月的工作和资源整合系统回顾。但是现在,“我不知道有多少我可以相信他们。我只是玩,”她说。