• 我的订阅
  • 科技

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

类别:科技 发布时间:2024-11-27 09:58:00 来源:量子位

只需几秒钟,开源模型检索4500篇论文,比GPT-4o还靠谱!

这就是由华盛顿大学和艾伦人工智能研究所(Ai2)打造的最新模型OpenScholar。

它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

在由20位专家进行的500次对比实验中,72%的情况下他们都觉得OpenScholar的输出结果超越了人类。

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

而且OpenScholar还会附上参考文献列表,非常贴心:

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

它的功能也非常丰富。

你可以询问OpenScholar某个研究课题的现状:“有没有人尝试过将检索增强型LM的检索库扩大到万亿级tokens?”

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

寻找最新的数据集:

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

针对某篇论文询问技术细节:

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

或者询问算法的细节,比如机器人算法/ReLU算法等等:

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

有多位网友使用过后表示:做复杂课题也能快速搜集有用的资料,真是科研神器!

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

仅调用8B模型

一句话总结:它存储了4500万篇论文的大规模数据,并使用自定义训练的检索器、重排器和8B参数语言模型进行检索,并根据最新的科学文献内容回答问题。

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

具体来说,OpenScholar-8B(OS-8B)系统包括以下组件:

1.开放学者数据存储:包含超过4500万篇论文、以及对应的约2.5亿段落嵌入。底层论文数据截止到2024年10月。

2.专业检索器和重排序器:这些工具专门用于从科学文献数据存储库中识别相关段落。

3.专业8B语言模型:这是一个针对科学文献综合任务优化的8B参数语言模型,在性能与计算效率之间取得了很好平衡。团队基于来自迭代自我反馈生成管道生成的合成数据训练并微调了Llama 3.1 8B。

4.迭代自我反馈生成:在推理过程中,团队使用迭代自我反馈来通过自然语言反馈精炼模型输出。每次迭代都额外检索更多论文,使模型能够提高回答质量并缩小引用差距。

为了评估 OpenScholar,团队还开发了ScholarQABench——一个专门用于评估从多篇论文中综合信息以解决开放式科学问题的基准。

ScholarQABench包含七个数据集:三个专注于单篇论文评估的现有数据集,以及四个需要跨多篇论文综合的新收集数据集。

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

最终在实验自动评估以及人工评估中,OpenScholar模型的表现优于很多主流模型,包括GPT-4o和Llama 3.1 70B。

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

搜索的可靠性方面,OpenScholar更是远超GPT-4o。

GPT-4o在90%以上的情况下都引用了不存在的论文,而OpenScholar的结果都是来自确定来源。

以及在信息覆盖率、实用性、相关性等多个维度方面,OpenScholar撰写的结果都优于GPT-4o。

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

运营成本便宜100倍

对比基于OpenAI的GPT-4o和Anthropic的Claude的科研模型可以发现,它们虽然性能很强,但价格昂贵、而且工作原理也不透明。

而OpenScholar正是为了挑战这些现有的大模型玩家入局的!

据开发人员称,OpenScholar是首个完全开源的科学助手语言模型——从数据到训练食谱再到模型检查点,全部公开!

研究人员可以非常清除地看到模型的训练过程和数据集的内容等,也可以根据自己的工作进行调整。

这样一来,规模较小、架构简单的OpenScholar-8B的运营成本比基于GPT-4o构建的同期系统PaperQA2便宜100倍。

对于小型机构、资金不足的实验室以及发展中国家的研究人员来说,这样的运营成本非常有吸引力。

不过,目前OpenScholar也有很多局限,比如:

1.OpenScholar可能会引用不那么具有代表性的论文。

例如,在描述特定方法时,它可能未能引用提出该方法的原始论文,而是引用了提及该方法的另一篇论文。

2.OpenScholar有时可能会生成没有参考文献支持的响应,或者检索到该领域不是最相关或最新的论文。

例如:当被问及机器人学中的大型基础模型时,此响应引用了一篇具有3.07亿参数模型的论文,而截至2024年11月,机器人学中当前最大的基础模型(RT-2)具有550亿参数。

3.OpenScholar可能仍然可能生成带有幻觉的结果,而不是依赖于它检索到的真实论文。

4.许多科学论文都设置了付费墙。

目前出于对版权的尊重,OpenScholar数据存储库仅包含公开的论文。这可能会降低模型在较封闭领域回答问题的能力。

团队表示,未来他们会纳入更多论文、升级检索增强算法,也会对各个领域的经典研究问题和论文进行深入整合,增强OpenScholar的专业程度。

不过,从实验结果来看,OpenScholar已经是目前表现最好的AI学术研究助理之一啦,感兴趣的小伙伴可以直接戳下面的公开资料进行尝试!

超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答

Demo:https://openscholar.allen.ai/论文:https://openscholar.allen.ai/paperOpenScholar代码:https://github.com/AkariAsai/OpenScholarScholarQABench数据集代码:https://github.com/AkariAsai/ScholarQABench更多测试code:https://github.com/AkariAsai/OpenScholar_ExpertEval

参考链接[1]https://venturebeat.com/ai/openscholar-the-open-source-a-i-thats-outperforming-gpt-4o-in-scientific-research/[2]https://allenai.org/blog/openscholar

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-27 12:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
【新智元导读】Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最新的OpenScholar系统,使用检索增强的方法帮助科学家进行文献搜索和文献综述工作,而且做到了数据、
2024-11-27 13:33:00
20分钟搞定论文初稿!6款AI神器拯救你的学术写作
...教你如何用AI工具在20分钟内搞定论文初稿!这几款AI写作神器,不仅能帮你节省时间,还能提升论文质量,让你轻松告别写作焦虑!一、首推神器:云笔AI推荐理由:功能全面,效果惊人
2025-03-20 23:01:00
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...行严格比较。这三个任务有关搜索整个文献以回答问题;生成一篇有引用的、维基百科风格的科学主题文章;从论文中提取所有主张,并检查它们与所有文献之间的矛盾。 这可能是第一个在多个
2024-09-13 13:33:00
论文拖延症有救了!AI自动生成选题+大纲+初稿,白嫖,速存!
...,再百度刷到一则消息吸引了我“知渊AI论文写作AI辅助神器,免费选题,免费生成大纲,10分钟生成初稿,可无限改稿!查重超过15%必退款!”我抱着试一试的想法,真的实现了,你给
2025-04-08 14:37:00
ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
...的小伙伴终于有了一个用起来顺手、且靠得住的 AI 搜索神器。为了打造出这样一个专业、智能和高效的 AI 解答机器,昆仑万维在背后投入了很多。除了信源和数据方面的优势,天工 A
2024-11-06 09:44:00
大学生论文“AI味儿”渐浓 多所高校为AI工具使用立规矩
...如今,AI工具兴起,成为不少大学生完成报告、论文的“神器”。这是某高校大一年级英语作业群里的一份通告,老师将利用AI工具直接生成的作文全部判了零分。某高校学生:有些同学可能图
2025-02-26 18:41:00
杜绝代写、检测超40%发警示 多所高校规范大学生用AI写论文
...年不少国内高校先后发文,就学生如何在毕业论文中使用生成式AI、AI代写在论文中的比例等问题作出规范。有不少学生表示,他们在论文创作中会使用AI来搜集文献、处理数据、书写代码等
2024-05-13 16:40:00
英文论文翻译,4个科研利器
...手写批注等等,是研究生科研人员都非常喜欢的文献阅读神器。关于英文论文翻译的分享就到这里啦,4款翻译工具各有特色,有这方面需求的小伙伴一定要去试试
2022-12-23 11:17:00
...往年,今年不少高校发文,就学生如何在毕业论文中使用生成式AI、AI代写在论文中的比例等问题作出规范。毕业论文,是大学生修完规定学习年限,所学专业的学术水平的集中反映和检验,通
2024-05-15 06:43:00
更多关于科技的资讯:
1月8日,贵州省商务厅发布《关于发放家电产品以旧换新、数码和智能产品购新活动补贴券相关事项的公告》(下称《公告》),明确2026年贵州家电产品以旧换新
2026-01-09 23:02:00
人工智能、物联网与5G技术的成熟迭代,让智能家居家电产品从高端小众走向大众消费,成为现代家庭标配。近日,江苏省消费者权益保护委员会发布专项调查报告
2026-01-09 17:10:00
动漫周边衍生品热销
动漫周边行业作为文化产业的重要组成部分,近年来呈现出快速发展的态势。近日,记者走访位于北京王府井的一家大型动漫主题实体店发现
2026-01-09 17:10:00
“冻鲜互变”仍保鲜 保税区进口牛肉凭啥这么牛?
大河网讯 进口冰冻牛肉,由冻转鲜,再由鲜转冻……虽经多次变身,仍然“鲜”活诱人,这里的牛肉凭啥这么牛?1月8日,记者走进郑州新郑综合保税区首个生鲜产品加工项目——省重点项目南洋优鲜超级工厂
2026-01-09 17:18:00
《文旅短剧活力城市指数》年度报告日前发布,太原和重庆、大同、东莞等8座城市入选“最具创新价值城市”榜单。《文旅短剧活力城市指数》(简称《指数》)由中国人民大学新闻学院
2026-01-09 17:58:00
张宣科技:智维创新赋能氢冶金高效运行
河北新闻网讯(郭晓通、王杨、范俊慧)全球首例120万吨氢冶金示范工程一期项目高效运行,背后有着设备维护创新硬核支撑的努力
2026-01-09 18:13:00
贵定税务:“全链条服务”点亮眼镜零售行业“睛”彩路
多彩贵州网讯 “现在付款后消费者自己在手机上动动手指就能收到发票,节省了消费者的时间,也节约了我们的人力,税务部门的管理服务让我们经营更便捷了
2026-01-09 17:23:00
【劲牌故事荟 大家谈友好】“四个友好”引领劲牌构建健康可持续新生态
□谭金山(湖北省社科联“文安平”团队、宜昌市西陵区市场监管局)企业的发展如同时代浪潮中的一叶扁舟,既需乘风破浪,更需掌舵定向
2026-01-09 14:15:00
UU远程2026远程协助重磅升级:被控免登录、自定义验证码等率先上线
引言:网易UU远程2026年即将迎来远程协助升级三连,远程协助功能实现多场景全面升级近日,网易 UU 远程迎来 2026 年首次重磅版本更新
2026-01-09 14:18:00
清华大学携手阿里巴巴共筑AI安全防线 启动大模型与智能体安全研究
近日,阿里巴巴集团与清华大学签订协议,启动智能体与多模态安全产学研深度融合专项合作。双方此次合作为期5年,聚焦中国AI用户在真实应用场景中面临的核心安全挑战
2026-01-09 14:23:00
中国故事海外热播、“泰国模式”全球复制,爱奇艺探索流媒体出海的“长期主义”
2025年,是爱奇艺海外业务进入稳定期之后,增速最高的一年。第三季度,爱奇艺国际版日均会员数创下历史新高,海外会员收入同比增长超过40%
2026-01-09 14:53:00
为进一步优化知识产权服务供给,打通创新成果转化通道,提升知识产权公共服务效能,上饶市“人工智能+”知识产权大数据服务平台(http://shr
2026-01-09 15:04:00
从五金功能件制造者到智能睡眠守护者,喜安思“守护狮”的觉醒之路!
在珠江之畔制造业奔腾的脉搏里,总有一群敢想敢干敢拼的人,让这片沃土跃动出一个又一个传奇,而喜安思智能床垫就是其中之一,喜安思创始人梁富城与陈傲鹏更是其中佼佼者
2026-01-09 15:35:00
近日,【同程商旅】联合【曹操出行】,聚焦国内企业差旅交通全景,重磅发布《2026中国企业差旅交通出行数据研究报告》。发现价值“新流向”国际出行逆势增长
2026-01-09 15:35:00
悍高集团股份有限公司接待44家机构调研,战略清晰彰显经营韧性
随着家居行业逐步从增量市场迈向存量市场,家居五金企业如何找到新的增长曲线,成为考验企业战略定力与运营能力的关键。近期,悍高集团股份有限公司(董事长为悍高欧锦锋)接受包括百嘉基金
2026-01-09 15:35:00