我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测来了

类别：科技发布时间：2024-08-08 15:11:00 来源：浅语科技

OpenAI神秘新模型，真的藏不住了！

先是有匿名聊天机器人现身lmsys竞技场，声称自己是GPT-4系列模型一部分，吊足了大家的胃口。

随后奥特曼又发了一个浮想联翩的推文，正是他花园里的草莓照片，并配文：i love summer in the garden。

上个月OpenAI正好被曝正在开发新一代基础模型“草莓”，前身据说是之前神秘兮兮的Q*。

不知是有意还是无意，但感觉就是有意，网友们就当奥特曼变相承认了。（Doge）

这就是对草莓计划的引用！发布时间就是在夏天。（美国的秋天从9月22日开始）

就在刚刚，ChatGPT官方推文开始走起了“

”的队形，更显得“有理有据”了。

新模型现身竞技场，网友第一波实测

最早在昨天下午，有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。

之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型系列一部分。

所以不少人怀疑OpenAI新模型要来了，也许就是草莓计划或者Q*。

网友进行了第一波实测。

像「9.11和9.9哪个大」这个“难题”也没有挑战成功。

而让它倒着写单词，同样也没回答出来。

诶不过，说草莓这个单词有多少个r倒是答对了。

还有河流“难题”，也直接轻松解决，而不像之前其他大模型回答得过于复杂。

如果一个人和一只狗要过河，但有个船只能承载一个人和一只动物，请问怎么过去？

最早在今年5月，OpenAI就被爆出正在开发“草莓”项目。

据今年7月路透社消息称，多个内部人士透露，这个项目会让公司的AI系统不仅能生成查询的答案，而且能够提前规划，自主可靠地浏览互联网，从而执行OpenAI 所称的“深度研究”（deep research）。

比如通过CUA（一种计算机代理）的帮助来自动浏览网页，该代理可以根据发现内容采取行动。

这也是迄今一众AI模型尚未解决的问题和难点。

草莓计划前身是Q*

在众多猜测中，草莓项目的前身极有可能是Q*。

去年11月，Q*首次被曝出，被认为过于强大，可能是通往AGI或超级智能的关键一步。

它被指具有这些特性，比如在数学和推理能力方面有很大的提升，突破了人类数据的限制，可以自己生产巨量训练数据，有自主学习和自我改进的能力等等。

在草莓项目正式被曝光的前几天，OpenAI科学家Noam Brown发了一条推特，感慨OpenAI总是会坚定地在重大研究方向上持续押注。

而这位科学家去年才跳槽到OpenAI，主要负责研究模型推理能力，之前一直被认为在研究Q*。

最新曝光显示，“草莓”使用的推理方法和2022年斯坦福发表的一种方法相似。

当时他们提出了一个自学推理（Self-Taught Reasoner，简称STaR）的方法。今年，斯坦福团队又基于STaR，提出了一种名为Quiet-STaR的推理方式，也就是Q*了

知情人士表示，OpenAI希望通过该项目大幅提升AI模型的推理能力，“草莓”已经在非常大的数据集上完成预训练，并使用了一种专门的处理方法，比如post-training等。

另外，内部之前也有过一次神秘模型的测试，当时数学测试成绩超过90%，不过也没法确认是否是Q*。

对此，OpenAI并没有直接回应。声明中表示：

We want our AI models to see and understand the world more like we do. Continuous research into new AI capabilities is a common practice in the industry, with a shared belief that these systems will improve in reasoning over time.

(我们希望我们的AI模型能像我们一样看待和理解世界。对新的人工智能能力的持续研究是该行业的常见做法，人们普遍认为这些系统随着时间的推移在推理方面会有所改进。)

不过确实要说的是，距离OpenAI发布上一个重要基础模型，也就是GPT-4，已经过去了近17个月的时间。差不多一年半了，也该来新一代模型了。

结果奥特曼现在又发一些云里雾里的推文。网友大开脑洞：

如图所示这张图有五个草莓，但第五个还没有熟。而草莓成熟的时间在4-6周内，说明GPT-5也将在那时候发布。

好好好，我信了。

参考链接：[1]https://x.com/apples_jimmy/status/1821047312673890694[2]https://x.com/flowersslop/status/1821054928275533900[3]https://x.com/sama/status/1821207141635780938

责任编辑：随心

文章内容举报

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-08-08 17:45:11

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于奥特,奥特曼,一波,实测,竞技场,草莓的资讯：

奥特曼小时候啥样，赛文调皮玩摔跤，艾斯将手含嘴里，奥父不容易

大家好，我是小飞，我们每个人都有自己的童年，奥特曼也不例外，别看如今的佐菲赛文初代他们在光之国都威风的很，个个都披上了象征长者的红色奥特披风，但他们童年的时候同样非常的可爱，曾经

2023-03-19 12:45:00

GPT-4o mini登顶大模型竞技场，奥特曼：两个月内微调

...“刷题”来走捷径，因此更为真实。这个成绩一出，连CEO奥特曼都激动起来了：面对评估成绩，我们本来是尽量矜持的，但是看到GPT-4o mini表现和满血版一样，价格却只有1/2

2024-07-25 09:31:00

GPT-4omini为啥登顶竞技场？OpenAI刷分秘诀被扒

...捏住了人类的心理啊。实际上，在GPT-4o mini刚刚发布时，奥特曼就暗示了这次特意的优化：大家一定会非常非常喜欢用这个新模型

2024-07-30 09:30:00

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...末，OpenAI 突然爆发了宫斗级别的管理层震荡，CEO 山姆·奥特曼（Sam Altman）被董事会短暂罢免，而直接导火索正是「Q*」项目的安全风险与争议

2024-09-12 09:49:00

万代又出奥特曼软胶，艾克斯曝出混合装甲，捷德竟然藏有暴走形态

万代又出奥特曼软胶，艾克斯曝出混合装甲，捷德竟然藏有暴走形态近日，奥特曼迷们迎来了一波又一波的惊喜。万代公司再次推出了新一款奥特曼软胶玩具，不仅外形精美，而且实力强大，让人眼前一

2023-11-12 20:42:00

Sora正式发布！奥特曼说它是“视频版GPT-1”，最长可生

...工作日，Sora终于发布！当地时间12月9日，OpenAI CEO山姆·奥特曼（Sam Altman）与Sora团队负责人比尔·皮布尔斯（Bill Peebles）

2024-12-10 08:42:00

o1满血版最鲜测！这¥1500花得值吗？

...有前景的研究方向最后建议用户寻求更专业的咨询正如奥特曼强调的：Pro模式的优势在于，它可以更加努力地去思考最困难的问题

2024-12-07 09:53:00

Meta被曝重金抢AI人才，奥特曼：曾出1亿美元挖角，但..

...的AI人才“招聘潮”。当地时间6月17日，OpenAI的CEO萨姆·奥特曼（Sam Altman）在一期播客节目中证实称

2025-06-18 19:25:00

36氪首席内容官李洋：勇敢站在新周期的起点上｜WISE202

...情几次翻转。有人在追剧、看热闹，有人可能根本不知道奥特曼是谁，而我们在场的所有人，关心未来的人，36氪所粘合的这个群体应该知道，热闹的背后意味着什么。OpenAI发生的事情用

2023-12-02 23:21:00

更多关于科技的资讯：

都市丽人——加拿大鹅绒保暖衣背后的战略咨询公司

当都市丽人的加拿大鹅绒保暖衣在冬日市场中掀起热潮，新品订货会上取得经销商5亿订单销量的数据。这个经典内衣品牌的华丽转身背后

2025-10-17 13:41:00

秋补正当红｜邂逅秋补热潮，抖音生活服务一站式解锁多元滋补新体

转眼秋意渐浓，中秋、国庆双节余温未散，团圆出游的热潮与“应季而食、适时而补”的传统饮食文化相互交织，共同点燃了金秋时节的滋补消费热情

2025-10-17 13:56:00

江西热敏灸机器人获批上市赋能百亿产业链提速

本报讯(全媒体记者李芳)10月9日，省药监局正式批准热敏灸机器人第二类医疗器械上市。这标志着江西热敏灸产业进入数智化时代

2025-10-17 07:10:00

无人机运动相机大幅降价摄入正是良机

厦门网讯（厦门日报记者薛尧）无人机、运动相机迎来降价潮！近日有市民发现相关热门产品价格跳水，记者走访了解到，我市多家大疆授权体验店中

2025-10-16 08:38:00

助力视弱群体畅行公交视弱辅助系统“喊”您上车

视弱人士庄先生在公交视弱辅助系统的帮助下乘车。厦门网讯（文/图厦门日报记者林钦圣通讯员江安娜） “我们先找到并打开公交App

2025-10-16 08:38:00

迎接2025世界航海装备大会，福州夜景强势刷屏！

10月15日晚，福州金融街商务区“亮灯”，迎接2025世界航海装备大会。

2025-10-16 08:59:00

石油工程设计公司自主研发系统，提高管道“诊断”效能

近日，中石化石油工程设计有限公司自主研发的“管道环焊缝射线检测缺陷智能辅助评判系统”，顺利完成准确率测试。本次测试中，该系统总计检查了210张油气长输管道环焊缝射线检测底片

2025-10-16 09:03:00

微评｜警惕网络依赖“偷走”青少年的思考能力

当“遇到问题先到社交媒体上搜索”成为一代青少年的本能反应，当班级群、兴趣圈与直播平台深度嵌入他们的日常生活，社交网络正构成这代“数字原住民”成长的基本环境

2025-10-16 09:16:00

大模型时代医学智能化的融合之道——经典算法与前沿技术共促健康

在人工智能技术飞速发展的今天，大模型以其强大的信息处理与泛化能力，正深刻改变医学领域的科研与临床实践。与此同时，以聚类分析

2025-10-16 09:57:00

人去世了朋友圈会消失吗？微信：对长时间不使用账号已不再回收

10月15日，“微信派”微信公众号发布最新一期播客，聊到了“真的很多人不发朋友圈了吗？”“人去世后，朋友圈会被回收吗?”等话题

2025-10-16 10:13:00

日日佳携手企知道，共同推动智能显示技术科技创新

近日，深圳日日佳显示技术有限公司（以下简称“日日佳”或“公司”）正式签约入驻企知道科创空间。作为专注于TFT-LCD模组制造的细分领域的国家高新技术企业和深圳市专精特新中小企业

2025-10-16 10:18:00

汽车测评全球协同 | 解码C-NCAP——护航公众出行安全

当汽车从单纯的“交通工具”升级为承载多元需求的“出行载体”，是什么力量在守护这场变革的安全底线？2025世界NCAP大会即将在中国上海启幕

2025-10-16 10:50:00

花田玑密入选“2025山东省优秀兴农电商企业案例”

2025年10月16日，由山东省商务厅主办的“数商兴农庆丰收暨九九网购节”电商促消费活动在青岛莱西市人民广场隆重启动。花田玑密品牌创始人

2025-10-16 10:53:00

香港金管局公布生成式AI沙盒名单，蚂蚁数科入选技术合作伙伴

10月15日，香港金融管理局（HKMA）与香港数码港管理有限公司联合公布第二期生成式AI沙盒参与者名单。蚂蚁银行、中银香港

2025-10-16 11:24:00

卢伟冰官宣REDMI K90系列明天见！不排斥和小米直接竞争

10月16日，小米集团合伙人、总裁卢伟冰微博正式官宣，REDMI K90系列明天见。他发文透露，本次发布会是小米手机业务在旗舰新品发布季的第二篇章

2025-10-16 12:00:00

头条订阅服务

奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了

奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测来了