• 我的订阅
  • 科技

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

类别:科技 发布时间:2024-09-17 22:51:00 来源:浅语科技

发布不到1周,OpenAI最强模型o1的护城河已经没有了。

有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

这项研究表明,增加测试时(test-time)计算比扩展模型参数更有效。

基于论文提出的计算最优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在一些任务上可以超越一个14倍大的模型。

网友表示:

这几乎就是o1的原理啊。

众所周知,奥特曼喜欢领先于谷歌,所以这才是o1抢先发preview版的原因?

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

有人由此感慨:

确实正如谷歌自己所说的,没有人护城河,也永远不会有人有护城河。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

就在刚刚,OpenAI将o1-mini的速度提高7倍,每天都能使用50条;o1-preview则提到每周50条。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

计算量节省4倍

谷歌DeepMind这篇论文的题目是:优化LLM测试时计算比扩大模型参数规模更高效。

研究团队从人类的思考模式延伸,既然人面对复杂问题时会用更长时间思考改善决策,那么LLM是不是也能如此?

换言之,面对一个复杂任务时,是否能让LLM更有效利用测试时的额外计算以提高准确性。

此前一些研究已经论证,这个方向确实可行,不过效果比较有限。

因此该研究想要探明,在使用比较少的额外推理计算时,就能能让模型性能提升多少?

他们设计了一组实验,使用PaLM2-S*在MATH数据集上测试。

主要分析了两种方法:

(1)迭代自我修订:让模型多次尝试回答一个问题,在每次尝试后进行修订以得到更好的回答。

(2)搜索:在这种方法中,模型生成多个候选答案。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

可以看到,使用自我修订方法时,随着测试时计算量增加,标准最佳N策略(Best-of-N)与计算最优扩展策略之间的差距逐渐扩大。

使用搜索方法,计算最优扩展策略在初期表现出比较明显优势。并在一定情况下,达到与最佳N策略相同效果,计算量仅为其1/4。

在与预训练计算相当的FLOPs匹配评估中,对比PaLM 2-S*(使用计算最优策略)一个14倍大的预训练模型(不进行额外推理)。

结果发现,使用自我修订方法时,当推理tokns远小于预训练tokens时,使用测试时计算策略的效果比预训练效果更好。但是当比率增加,或者在更难的问题上,还是预训练的效果更好。

也就是说,在两种情况下,根据不同测试时计算扩展方法是否有效,关键在于提示的难度。

研究还进一步比较不同的PRM搜索方法,结果显示前向搜索(最右)需要更多的计算量。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

在计算量较少的情况下,使用计算最优策略最多可节省4倍资源。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

对比OpenAI的o1模型,这篇研究几乎是给出了相同的结论。

o1模型学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。并且随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高。

不过OpenAI更快一步发布了模型,而谷歌这边使用了PaLM2,在Gemini2上还没有更新的发布。

网友:护城河只剩下硬件了?

这样的新发现不免让人想到去年谷歌内部文件里提出的观点:

我们没有护城河,OpenAI也没有。开源模型可以打败ChatGPT。

如今来看,各家研究速度都很快,谁也不能确保自己始终领先。

唯一的护城河,或许是硬件。

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

(所以马斯克哐哐建算力中心?)

有人表示,现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河

值得一提的是,前段时间OpenAI首颗芯片曝光,将采用台积电最先进的A16埃米级工艺,专为Sora视频应用打造。

显然,大模型战场,只是卷模型本身已经不够了。

参考链接:

https://www.reddit.com/r/singularity/comments/1fhx8ny/deepmind_understands_strawberry_there_is_no_moat/

责任编辑:鹿角

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-18 05:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

在ChatGPT浪潮下,产品人如何打造自己护城河
...普及开。本文聊聊在ChatGPT浪潮下,产品人如何打造自己护城河?一起来看看吧。当下ChatGPT作为其中一种生成式AI模型
2023-04-19 16:00:00
绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU
...国内媒体报道称,DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这让美国不少巨头们感到了很大的威胁,而现在这件事才刚刚开始
2025-02-02 08:10:00
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...价值,这些也是零一万物在大模型预训练阶段的核心技术护城河。“在大量训练实验过程中,由于实验执行的需要对代码做了更名,我们尊重开源社区的反馈,将代码进行更新,也更好的融入Tra
2023-11-14 17:11:00
程一笑:私域和社交依然是快手的“护城河”
...快手上关注了上千位创作者,私域和社交依然是快手的“护城河”。但是私域变得拥挤后,公私域流量如何分发好是快手的一个重要课题。程一笑认为,对于创作者来说,流量密码是公域和私域的正
2024-08-29 10:01:00
极越AI Day,科技实力才是真护城河
...真的就是落后了。 只有最坚实的科技实力,才是真正的护城河,这句话确实很有力量,百度的技术实力还是毋庸置疑的,百度如果能在极越01上OTA更多的能力,相信更多的科技爱好者会买
2024-03-26 13:47:00
“DeepSeek甚至绕过了CUDA”!论文细节再引热议 工程师灵魂提问:英伟达护城河还在吗
...交易员。一位亚马逊工程师提出灵魂质问:CUDA是否还是护城河?这种顶尖实验室可以有效利用任何GPU。甚至有网友开始畅想
2025-01-29 18:07:00
...融的戏份下降,科技、人文和ESG的戏份增加。一款工具的护城河能有多宽?说蚂蚁,绕不开核心应用支付宝。它为解决网购信用问题而生,不仅打通了淘宝的任督二脉,还催生了蚂蚁的金融业务
2023-09-10 08:17:00
...及其成果转化,要继续加码科技创新,筑牢知识产权的“护城河”,不断推出更多优质产品和解决方案以服务客户、开拓市场。具体来说,是要在三件事上下功夫:第一是技术创新。我们会在保持现
2023-11-30 06:26:00
AI会杀死“美图秀秀们”吗?
...基数,在美颜修图上建立起的用户心智,也许会给其筑起护城河,但在今天,技术祛魅,流量的走向谁都难以预估。真正的较量,不在于技术,而在于运用技术,在于审美的独特性,在于更懂用户。
2023-04-14 08:51:00
更多关于科技的资讯: