• 我的订阅
  • 社会

OpenAI o1 拉开与国产大模型差距?360集结16家国产大模型可以匹敌

类别:社会 发布时间:2024-09-16 17:42:00 来源:缘之心

日前,OpenAI 发布 o1-preview,问鼎最强大语言模型,引发业内轰动。也正因如此,国内也产生了质疑的声音:为何大模型领域国内追赶了一两年,差距好像没见缩小,甚至是扩大了。

差距真的是在扩大吗?事实可能并非如此。

根据行业专家张俊林的观点,o1-preview 之所以能够更强,其方法本质上是思维链(Chain-of-Thought, CoT)的自动化。通过 CoT 把一个复杂问题拆解成若干简单步骤,这有利于大模型解决复杂逻辑问题,但之前这个过程主要靠人工来达成。o1 采用的这种方法,将使得 Prompt 工程逐渐消亡,也就是说所有复杂人工环节的自动化成为了大势所趋。

但其实,这种思想和方法并非 OpenAI 的首创,更非独创。早在 7 月底的 ISC.AI2024 大会上,360集团创始人周鸿祎就宣布,“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力”,并且此后多次强调类似观点。这种方法的技术和产品应用上,国内也已经走在前面:还是在 ISC.AI 上 360 发布的CoE(Collaboration-of-Experts,专家协同)技术架构及混合大模型,就是该方法的产物;并且,该技术架构已经落地到了多个产品中,比如360AI搜索、360AI浏览器。

值得一提的是,在大模型技术前沿,国内比 OpenAI 在开放协作的道路上走的更远,更加“open”。比如 CoE 架构并非只接入了一家企业的模型,而是由 360 牵头,百度、腾讯、阿里巴巴、智谱AI、Minimax、月之暗面等 16 家国内主流大模型厂商合作打造的,目前已经接入了这些企业的 54 款大模型产品,未来预计会全量接入 100 多款大模型产品。

更进一步的是,CoE 技术架构不仅接入了“大模型”,还接入了很多十亿甚至更小参数的专家模型,这使得整个系统更加智能。CoE 架构在实现“让最强的模型回答最难的问题”的同时,还能在回答简单问题时调用更精准的“小模型”,在获得高质量回答的同时,节约推理资源、提升响应速度。

有了上述的多种底层技术创新,基于CoE 架构的混合大模型在翻译、写作等 12 项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分;特别是在“弱智吧”和“诗词赏析”这类比较具有中文特色的问题上,该架构的领先优势更加明显。即使是对于最新发布的 o1-preview,CoE 架构在未经专门优化的情况下也展现出了优势。

拥有了底层技术创新的情况下,国内在做应用和产品层面的优势更大。CoE 架构和混合大模型没有止步于技术创新,而是比OpenAI更快一步地进入了实际应用领域。

一方面,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款大模型,进行多模型协作,以此达成比单个大模型回答问题好得多的效果。

另一方面,CoE 还成为了支撑360AI搜索的底层技术架构。正是由于全球领先的技术架构的支撑,和国内多家主流大模型厂商的通力协作,让360AI搜索能够让360AI搜索能够在2024年1月诞生后八九个月的时间里,就超越 Perplexity AI。

我国基于高素质的工程师人才优势和时代创新精神,完全有可能让AI大模型赛道,成为继新能源汽车之后的又一个领跑国际前沿的重要科技创新领域。【编辑:邵婉云】

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-16 20:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,方法
2024-09-21 09:50:00
GPU受限,国内AI大模型能否交出自己的答卷?
...,百度飞浆已完成和包括百度昆仑芯、华为昇腾在内的22家国内外硬件厂商,31种芯片的适配和优化,基本覆盖国内主流芯片。昆仑芯和飞浆完成3级兼容性适配,登临科技和飞浆也完成2级适
2023-04-14 18:02:00
11项指标击败GPT-4o!360攒局让16家大模型联手作战
...合战队”的方式迎战GPT-4o。结果,基于360 CoE架构的、由16家国产大模型组成的混合大模型在12项指标的测试中取得了80
2024-08-06 09:27:00
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
国产大模型首次在公开榜单上超过GPT-4o!就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Lightning(闪电)
2024-10-17 09:48:00
智谱AI总裁王绍兰:大模型技术进步的陡峭曲线没有放缓迹象
...界数字健康论坛”上,智谱AI总裁王绍兰发表了题为“大模型时代的探索和思考”的主旨演讲。《每日经济新闻》记者从论坛现场获悉,智谱AI为本次中关村论坛年会提供了大模型技术支持,打
2024-05-07 09:25:00
“国产Sora”Vidu全球上线,中国视频大模型支棱起来了?
...这大半年来,小雷已经记不清自己体验过多少视频生成大模型产品了,但有一个名词已经深深印在我的脑海中。因为国内每当有一个新产品出现,就会被无数媒体冠以“国产Sora”的头衔,所以
2024-08-01 09:58:00
AI大算力芯片行业报告:百舸争流,创新者先
...国文|偲睿洞察从2022.11.30的ChatGPT,到2023.6.13的360智脑大模型2.0,全球AI界已为大模型持续疯狂了七个多月
2023-06-20 20:00:00
通信效率超98%!壁仞科技实现中国首个三种异构芯片混训技术
...重要课题之一。以上海临港的一个集群为例,其使用了22家国产芯片公司的58款 AI 芯片产品,通过多样芯片扩大算力供给,使得适配训练框架消耗较长,总投入成本达到约10000人天
2024-09-06 10:03:00
从狂热到理性:大模型训练三堵墙,一场少数人的游戏 | 钛媒体深度
...芯片还没有对标到英伟达最高端的产品,比如A100。有几家国产芯片厂商已经预备在今年晚些时候,推出类似的对标产品。不论是训练还是推理,国产芯片的发展或多或少有一些滞后。与之对应
2023-06-29 12:00:00
更多关于社会的资讯: