• 我的订阅
  • 科技

没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

类别:科技 发布时间:2024-08-02 09:41:00 来源:机器之心Pro

来自上海人工智能实验室。

有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。

OpenAI 首先瞄准的是谷歌 1750 亿美元的搜索业务市场。7 月 25 日,OpenAI 带着 AI 搜索引擎——SearchGPT 高调入场。在演示 demo 中,搜索引擎的使用体验不再像以往一样,需要我们逐个点开网页链接,判断信息有没有用。SearchGPT 像端上了一桌精美的套餐,所有答案都帮你总结好了。

在演示 demo 中,SearchGPT 分析了在应季最适合种植哪种品种的番茄。

不过,鉴于年初发布的 Sora 到目前都还未正式开放,估计很多人排上 SearchGPT 的体验名额也遥遥无期。

然而,有一款国产的开源平替,在和能联网的 ChatGPT 和专攻 AI 搜索引擎的 Perplexity.ai 的 PK 中,它的回答在深度、广度和准确度方面都都秒了这两款明星产品。

它甚至可以在不到 3 分钟内收集并整合 300 多页相关信息。这换成人类专家,需要大约 3 小时才能做完。

没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

这款「国货」就是多智能体框架 MindSearch(思・索),由来自中科大和上海人工智能实验室的研究团队联合研发。正如其名,MindSearch 是一个会「思索」的系统,面对你输入的问题,它将先调用负责充分「思」考问题的智能体,再启用全面搜「索」的智能体,这些智能体分工合作,理解你的需求,并为你呈上从互联网的五湖四海搜罗来的新鲜信息。

没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

论文链接:https://arxiv.org/abs/2407.20183 项目主页:https://mindsearch.netlify.app/

那么,MindSearch 是凭什么打败 ChatGPT 和 Perplexity.ai 的呢?和别的 AI 搜索引擎相比,MindSearch 有什么独到之处吗?

答案还得从它的名字说起。MindSearch 的核心竞争力在于采用了多智能体框架模拟人的思维过程。

如果向 Perplexity.ai 提问「王者荣耀当前赛季哪个射手最强?」它会直接搜索这个问题,并总结网上已有的回复。把这个问题交给 MindSearch,它会把这个问题拆解成一个逻辑链:「当前赛季是哪个赛季?」,「从哪些指标可以衡量王者荣耀的射手的强度?」,再汇总所能查询到的答案。

技术实现

WebPlanner:基于图结构进行规划

仅依靠向大型语言模型输入提示词的方式并不能胜任智能搜索引擎。首先,LLM 不能充分理解复杂问题中的拓扑关系,比如前一段挂在热搜上的大模型无法理解 9.9 和 9.11 谁大的问题,就是这个问题的生动注脚。字与字之间的关系,LLM 都很难在简单对话中理解,那么「这个季节种哪个品种的番茄最合适?」这种需要深入思考,分解成多个角度来回答的问题,对于 LLM 就更难了。换句话说,LLM 很难将用户的意图逐步转化为搜索任务,并提供准确的响应,因此它总是提供一些模版式的知识和套话。

基于此,研究团队设计了高级规划器 WebPlanner,它通过构建有向无环图(DAG)来捕捉从提问到解答之间的最优执行路径。对于用户提出的每个问题 Q,WebPlanner 将其解决方案的轨迹表示为 G (Q) = ⟨V, E⟩。在这个图中,V 代表节点的集合,每个节点 v 代表一个独立的网页搜索任务,包括一个辅助的起始节点(代表初始问题)和一个结束节点(代表最终答案)。E 代表有向边,指示节点之间的逻辑和推理关系。

研究团队进一步利用 LLM 优越的代码能力,引导模型编写代码与 DAG 图交互。为了实现这一点,研究团队预定义了原子代码函数,让模型可以在图中添加节点或边。在解答用户问题的过程中,LLM 先阅读整个对话,还有它在网上搜索到的信息。阅读完这些信息后,LLM 会根据这些信息产生一些思考和新的代码,这些代码将通过 Python 解释器添加在用于推理的图结构中。

一旦有新节点加入图中,WebPlanner 将启动 WebSearcher 来执行搜索任务,并整理搜索到的信息。由于新节点只依赖于之前步骤中生成的节点,所以这些节点可以并行处理,大大提高了信息收集的速度。当所有的信息收集完毕,WebPlanner 将添加结束节点,输出最终答案。

WebSearcher:分层检索网页

由于互联网上的信息实在太多,就算是 LLM 也不能一下子处理完所有的页面。针对这个问题,研究团队选择了先广泛搜索再精确选择的策略,设计了一个 RAG 智能体 ——WebSearcher。

首先,LLM 将根据 WebPlanner 分配的问题,生成几个类似的搜索问题,扩大搜索的范围。接下来,系统将调用不同搜索引擎的 API 查询问题,例如分别在 Google、Bing 和 DuckDuckGo 查一下,得到网页的链接、标题和摘要等关键信息。接着,LLM 将从这些搜索结果中选出最重要的网页来仔细阅读,汇总得出最终答案。

没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?

MindSearch 中,LLM 如何管理上下文

作为一个多智能体框架,MindSearch 为如何管理长上下文提供了全新尝试。当需要快速阅读大量网页时,由于最终答案只依赖 WebSearcher 的搜索结果,WebPlanner 将专注于分析用户提出的问题,不会被过长的网页信息分心。

这种明确的分工也大大减少了上下文计算量。如何在多个智能体之间高效共享信息和上下文并非易事,研究团队在实证中发现,如果只依靠 WebPlanner 的分析,有可能会在信息收集阶段由于 WebSearcher 内部的局部感知场丢失有用的信息。为了解决这个问题,他们利用有向图边构建的拓扑关系来简化上下文如何在不同智能体间传递。

具体来说,在 WebSearcher 执行搜索任务时,它的父节点以及根节点的回答将作为前缀添加在其回答中。因此,每个 WebSearcher 可以有效地专注于其子任务,同时不会丢失之前的相关上下文或者忘记最终的查询目标。

本地部署

7 月初,上海人工智能实验室已经开源了搭载 MindSearch 架构的 InternLM2.5-7B-Chat 模型。

除了直接点击链接,跳转到体验 Demo 试玩。研究团队还公开了 MindSearch 的完整前后端实现,基于智能体框架 Lagent,感兴趣的朋友可以在本地部署模型。

在线 Demo:https://mindsearch.openxlab.org.cn/ 开源代码:https://github.com/InternLM/mindsearch

在 GitHub 下载 MindSearch 仓库后,输入如下命令就可以打造属于自己的 MindSearch 了:

# 启动服务

python -m mindsearch.app --lang en --model_format internlm_server

## 一键启动多种前端

# Install Node.js and npm

# for Ubuntu

sudo apt install nodejs npm

# for windows

# download from https://nodejs.org/zh-cn/download/prebuilt-installer

# Install dependencies

cd frontend/React

npm install

npm start

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-02 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

夯实智算基础  赋能千行百业
...的一项挑战是软硬件适配难问题。很多企业反映,在使用国产芯片和软件做集群式大模型训练时,偶尔会出现未知错误,需要产业链上下游协同攻克。燧原科技公共政策研究院副院长徐愚同样认为,
2023-10-23 05:50:00
...什么各家纷纷布局AI搜索?AI搜索与常规搜索有何不同?国产搜索引擎是否能转型AI化?这些都是人们关心的问题。并非传统搜索引擎升级随着生成式AI在2023年突破性发展,AI工具
2024-11-16 11:04:00
ChatGPT搜索搞不定勾股定理新证明 但国产AI可以!
万万没想到,现在的国产AI搜索,竟然让我成功读懂了陶哲轩推荐的论文。事情是这样的。前几天陶哲轩在自己的主页上推荐了一篇关于勾股定理新证明的研究,引发了一波不小的讨论。毕竟2500
2024-11-06 08:39:00
国产大模型的100种可能
...@视觉中国文 | 明晰野望4月以来,市场几乎每天都有各种国产大模型的新信息,一众科技大厂、创业公司陆续公布相关进展,加速入场。争相涌现的国产大模型,特别是科技大厂基于投入、算
2023-04-24 11:00:00
ChatGPT搜索引擎体验:太颠覆!新一轮搜索大战正式爆发?
...用户进一步追问,才会给出精准的餐厅推荐。一些用惯了国产AI的朋友或许会问:国产AI在制定旅游计划也可以精准到餐厅,那么ChatGPTSearch的区别在哪?区别就在于国产AI
2024-11-04 22:04:00
微算法科技(NASDAQ:MLGO)通过蚁群算法求解资源分配的全局最优解,实现低能耗的区块链资源分配
...的迫切需求。微算法科技(NASDAQ:MLGO)利用蚁群算法来优化节点间的资源分配,以达到全局最优解,从而实现更低的能耗和更高的效率。蚁群算法是一种基于群体智能的优化算法,其
2025-08-13 17:07:00
再抢搜索入口,字节仍坚定入场,胜算几何?
...ChatGPT”,并自封为“中国第一个真正实现智能涌现”的国产大语言模型。这种现象的持续迸发,很大程度上也是源于如今通用搜索正面临局限性。毕竟,移动互联网时代中的App常伴有
2023-10-01 17:01:00
西工大建立无人机自主“聊天群”
...学龙教授和同事们在机器交互方面取得了创新进展:基于国产大模型,研发了“群聊式”无人机控制框架,给每架无人机装上了“大脑”,让无人机集群在语言沟通中动态协同,实现了开放环境下“
2023-10-29 02:46:00
对标o1,Kimi放出了最能打的国产模型
AI 领域正在经历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前
2024-11-19 09:50:00
更多关于科技的资讯:
三联家电章丘世茂店盛大开业:抢抓“春日经济”,助力市民“焕新家”
鲁网3月13日讯春风送暖,万象更新。在这生机盎然的春日里,三联家电章丘世茂店于3月13日盛大开业。正值“春日经济”消费热潮
2026-03-13 17:40:00
一场对话 “对”出了什么?
鲁网3月13日讯“我们依托 AI 工具实现了内容快速生产,但算力成本高、高端人才缺,政策层面有什么支持?”“有支持的,我们推出了‘算力券’政策
2026-03-13 18:14:00
新华保险河北分公司以高品质服务守护千家万户
近年来,新华保险河北分公司持续推动服务升级,以高品质服务守护千家万户。在今年3·15国际消费者权益日到来之际,新华保险河北分公司党委书记
2026-03-13 20:25:00
中新经纬3月13日电 据国家金融监管总局13日消息,近日,针对互联网助贷业务问题,金融监管总局对分期乐、奇富借条、你我贷借款
2026-03-13 21:29:00
马嘉良 河北公安警察职业学院摘要:自动驾驶技术的演进对传统静态交通管理体系提出了适应性变革要求,为保障混合交通流的安全与效率
2026-03-13 21:36:00
邹宇摘要:随着电子商务平台和移动互联网的发展,消费者在网络环境中的行为逐渐被记录并形成大规模数据资源,为利用统计方法研究消费者购买行为提供了新的数据集
2026-03-13 21:36:00
行业唯一控轴专利!海尔发布中科桌面大路灯Z5 Max,定义护眼新标杆
当前,消费者愈发重视用眼健康,尤其是青少年用眼问题,带动了护眼灯消费。京东去年1-8月数据显示,“护眼灯”类目搜索同比增长42%
2026-03-13 21:49:00
第4届国际文创新品及潮玩(上海)展览会开幕 AI玩具成新风口
3月12日,第4届国际文创新品及潮玩(上海)展览会、第13届上海国际IP授权产业博览会在上海新国际博览中心开幕。本届展会为期3天
2026-03-13 22:19:00
2026年英语口语练习APP推荐!星空外语帮你攻克雅思口语,畅享英语自由!
在雅思考试里,口语是许多考生感到头疼的科目。要在口语部分取得高分并非易事,它要求考生具备扎实的语言基础、流利的表达能力和灵活的应变思维
2026-03-13 21:52:00
海尔AI智能锁Q600Pro斩获AWE艾普兰“创新奖”
3月12日,2026年中国家电及消费电子博览会(AWE2026)在上海启幕,全球最夯的智能家电与智慧生活解决方案悉数亮相
2026-03-13 21:48:00
中国网3月13日讯电 据市场监管总局网站消息,近日,市场监管总局印发《关于强化广告中提示性用语监管工作的通知》(以下简称《通知》)
2026-03-13 19:05:00
近日,国家药监局批准了博睿康医疗科技(上海)有限公司植入式脑机接口手部运动功能代偿系统创新产品注册申请,实现脑机接口医疗器械全球首发上市
2026-03-13 19:45:00
3月12日,在2026年中国家电及消费电子博览会(AWE)上,矿业智能化成为展会关注的焦点之一。一家名为“深脉控股”的企业展示了其通过人工智能技术介入矿产资源勘探与开发的全链条解决方案
2026-03-13 19:46:00
京东自营家装全新亮相 用AI把智能化“好房子”带给更多家庭
3月13日,京东全新发布AI智慧家装品牌——京东家装,通过自营模式入场重新定义家装新标准,并以 AI及超级供应链能力驱动家装行业智能化与标准化升级
2026-03-13 19:46:00
从智能出行到智能家电,探路生态携智能空间全栈产品矩阵亮相AWE
AWE2026上,全球智能空间科技品牌探路首次以覆盖三维立体出行、户外移动空间、生活智能家电与智能空间系统四大方向的全生态阵容亮相
2026-03-13 14:21:00