• 我的订阅
  • 科技

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

类别:科技 发布时间:2024-08-08 15:11:00 来源:浅语科技

OpenAI神秘新模型,真的藏不住了!

先是有匿名聊天机器人现身lmsys竞技场,声称自己是GPT-4系列模型一部分,吊足了大家的胃口。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

随后奥特曼又发了一个浮想联翩的推文,正是他花园里的草莓照片,并配文:i love summer in the garden。

上个月OpenAI正好被曝正在开发新一代基础模型“草莓”,前身据说是之前神秘兮兮的Q*。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

不知是有意还是无意,但感觉就是有意,网友们就当奥特曼变相承认了。(Doge)

这就是对草莓计划的引用!发布时间就是在夏天。(美国的秋天从9月22日开始)

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

就在刚刚,ChatGPT官方推文开始走起了“

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

”的队形,更显得“有理有据”了。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

新模型现身竞技场,网友第一波实测

最早在昨天下午,有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型系列一部分。

所以不少人怀疑OpenAI新模型要来了,也许就是草莓计划或者Q*。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

网友进行了第一波实测。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

像「9.11和9.9哪个大」这个“难题”也没有挑战成功。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

而让它倒着写单词,同样也没回答出来。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

诶不过,说草莓这个单词有多少个r倒是答对了。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

还有河流“难题”,也直接轻松解决,而不像之前其他大模型回答得过于复杂。

如果一个人和一只狗要过河,但有个船只能承载一个人和一只动物,请问怎么过去?

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

最早在今年5月,OpenAI就被爆出正在开发“草莓”项目。

据今年7月路透社消息称,多个内部人士透露,这个项目会让公司的AI系统不仅能生成查询的答案,而且能够提前规划,自主可靠地浏览互联网,从而执行OpenAI 所称的“深度研究”(deep research)。

比如通过CUA(一种计算机代理)的帮助来自动浏览网页,该代理可以根据发现内容采取行动。

这也是迄今一众AI模型尚未解决的问题和难点。

草莓计划前身是Q*

在众多猜测中,草莓项目的前身极有可能是Q*。

去年11月,Q*首次被曝出,被认为过于强大,可能是通往AGI或超级智能的关键一步。

它被指具有这些特性,比如在数学和推理能力方面有很大的提升,突破了人类数据的限制,可以自己生产巨量训练数据,有自主学习和自我改进的能力等等。

在草莓项目正式被曝光的前几天,OpenAI科学家Noam Brown发了一条推特,感慨OpenAI总是会坚定地在重大研究方向上持续押注。

而这位科学家去年才跳槽到OpenAI,主要负责研究模型推理能力,之前一直被认为在研究Q*。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

最新曝光显示,“草莓”使用的推理方法和2022年斯坦福发表的一种方法相似。

当时他们提出了一个自学推理(Self-Taught Reasoner,简称STaR)的方法。今年,斯坦福团队又基于STaR,提出了一种名为Quiet-STaR的推理方式,也就是Q*了

知情人士表示,OpenAI希望通过该项目大幅提升AI模型的推理能力,“草莓”已经在非常大的数据集上完成预训练,并使用了一种专门的处理方法,比如post-training等。

另外,内部之前也有过一次神秘模型的测试,当时数学测试成绩超过90%,不过也没法确认是否是Q*。

对此,OpenAI并没有直接回应。声明中表示:

We want our AI models to see and understand the world more like we do. Continuous research into new AI capabilities is a common practice in the industry, with a shared belief that these systems will improve in reasoning over time.

(我们希望我们的AI模型能像我们一样看待和理解世界。对新的人工智能能力的持续研究是该行业的常见做法,人们普遍认为这些系统随着时间的推移在推理方面会有所改进。)

不过确实要说的是,距离OpenAI发布上一个重要基础模型,也就是GPT-4,已经过去了近17个月的时间。差不多一年半了,也该来新一代模型了。

结果奥特曼现在又发一些云里雾里的推文。网友大开脑洞:

如图所示这张图有五个草莓,但第五个还没有熟。而草莓成熟的时间在4-6周内,说明GPT-5也将在那时候发布。

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

好好好,我信了。

参考链接:[1]https://x.com/apples_jimmy/status/1821047312673890694[2]https://x.com/flowersslop/status/1821054928275533900[3]https://x.com/sama/status/1821207141635780938

责任编辑:随心

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-08 17:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

奥特曼小时候啥样,赛文调皮玩摔跤,艾斯将手含嘴里,奥父不容易
大家好,我是小飞,我们每个人都有自己的童年,奥特曼也不例外,别看如今的佐菲赛文初代他们在光之国都威风的很,个个都披上了象征长者的红色奥特披风,但他们童年的时候同样非常的可爱,曾经
2023-03-19 12:45:00
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
...“刷题”来走捷径,因此更为真实。这个成绩一出,连CEO奥特曼都激动起来了:面对评估成绩,我们本来是尽量矜持的,但是看到GPT-4o mini表现和满血版一样,价格却只有1/2
2024-07-25 09:31:00
GPT-4omini为啥登顶竞技场?OpenAI刷分秘诀被扒,奥特曼早有暗示
...捏住了人类的心理啊。实际上,在GPT-4o mini刚刚发布时,奥特曼就暗示了这次特意的优化:大家一定会非常非常喜欢用这个新模型
2024-07-30 09:30:00
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...末,OpenAI 突然爆发了宫斗级别的管理层震荡,CEO 山姆·奥特曼(Sam Altman)被董事会短暂罢免,而直接导火索正是「Q*」项目的安全风险与争议
2024-09-12 09:49:00
万代又出奥特曼软胶,艾克斯曝出混合装甲,捷德竟然藏有暴走形态
万代又出奥特曼软胶,艾克斯曝出混合装甲,捷德竟然藏有暴走形态近日,奥特曼迷们迎来了一波又一波的惊喜。万代公司再次推出了新一款奥特曼软胶玩具,不仅外形精美,而且实力强大,让人眼前一
2023-11-12 20:42:00
Sora正式发布!奥特曼说它是“视频版GPT-1”,最长可生成20秒视频
...工作日,Sora终于发布! 当地时间12月9日,OpenAI CEO山姆·奥特曼(Sam Altman)与Sora团队负责人比尔·皮布尔斯(Bill Peebles)
2024-12-10 08:42:00
o1满血版最鲜测!这¥1500花得值吗?
...有前景的研究方向 最后建议用户寻求更专业的咨询正如奥特曼强调的:Pro模式的优势在于,它可以更加努力地去思考最困难的问题
2024-12-07 09:53:00
36氪首席内容官李洋:勇敢站在新周期的起点上|WISE2023 商业之王大会
...情几次翻转。有人在追剧、看热闹,有人可能根本不知道奥特曼是谁,而我们在场的所有人,关心未来的人,36氪所粘合的这个群体应该知道,热闹的背后意味着什么。OpenAI发生的事情用
2023-12-02 23:21:00
2023好玩新手游推荐 2023火热新手游排行榜
...一块。好了,现在小编就给大家推荐2023好玩的新手游:1奥特曼:集结一款奥特曼题材的手游,虽然是披着仙侠的奥特曼手游,可是还是非常好玩的手游,里面有着我们小时候看到的所有奥特
2023-01-30 21:42:00
更多关于科技的资讯: