我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

号称博士生水准！OpenAI最新模型仍分不出9.11和9.8哪个大

类别：科技发布时间：2024-09-14 10:18:00 来源：浅语科技

快科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。

按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页游戏。

这个游戏的目标是控制一只考拉躲避不断增加的草莓，并在3秒后找到出现的松鼠。这类游戏的逻辑相对复杂，更考验OpenAI o1的逻辑推理能力。

官方还表示，相较于GPT-4o等现有的大模型，OpenAI o1能够解决更加困难的推理问题，同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理，在着手写代码前，把整个回答的流程全部思考完一遍，再动手输出代码。

不过，经过实测，OpenAI o1依然无法解决“9.11和9.8哪个大”的经典难题，严重扣分。

因为9.11和9.8哪个大这个问题，之前AI大模型集体失智，所以....

【本文结束】如需转载请务必注明出处：快科技

责任编辑：雪花

文章内容举报

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-09-14 11:45:07

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于博士生,水准,模型,博士,推理,模型的资讯：

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...到的“思考”过程，来源：OpenAI）认知将跃升至“理科博士生水准”OpenAI曾解释过，2023年发布的GPT-4类似于高中生的智能水平

2024-09-13 13:34:00

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...授，阿兰・图灵研究所 Turing Fellow，其指导的 UCL 一年级博士生宋研。利物浦大学助理教授方蒙。上海交通大学 Apex 和多智能体实验室张伟楠教授（上海交通大学计算机系教授

2024-10-15 09:56:00

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

...人工智能。袁洋袁洋是清华大学交叉信息学院助理教授，博士生导师。2012年毕业于北京大学计算机系；2018年获美国康奈尔大学计算机博士学位；2018-2019年前往麻省理工学院

2024-09-24 13:36:00

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

北京大学王选计算机研究所研究员、博士生导师赵东岩出品｜搜狐科技作者｜张雅婷随着DeepSeek的爆火，公众对AI幻觉的担忧也日益加剧

2025-03-05 15:54:00

清华团队提出新型光计算架构，光训练速度提升1个数量级

...for optical neural networks）为题，发表于 Nature[1]。清华大学博士生薛智威

2024-08-09 09:57:00

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...理、化学和生物学这些具有挑战性的基准任务上的表现与博士生相似。OpenAI 还发现它在数学和编码方面表现出色。在国际数学奥林匹克（IMO）资格考试中

2024-09-13 16:42:00

MIT最新研究：多个AI协作有助提高大模型推理能力和准确性

...提高自己的回答。”麻省理工学院电气工程和计算机科学博士生、CSAIL附属成员以及论文的首席作者之一Yilun Du说道

2023-09-20 13:42:00

年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

...副主任张奇张奇，复旦大学计算机科学技术学院教授、博士生导师。兼任上海市智能信息处理实验室副主任，中国中文信息学会理事、CCF 大模型论坛常务委员、CIPS 信息检索专委会常

2024-11-26 09:38:00

大语言模型逻辑推理“很糟糕”

...了人类的性别、伦理和道德偏见。伦敦大学学院信息学系博士生奥利维娅·麦克米伦-斯科特问道：“它们是否也反映了人类在推理测试中的认知偏差？”她总结自己的研究成果称，这些大语言模型

2024-06-12 18:15:00

更多关于科技的资讯：

稳” “进” “新” ——3个关键词读懂南京经济前三季度“成

□南京日报/紫金山新闻记者张甜甜通讯员夏俊林娜10月31日，南京市统计局、国家统计局南京调查队发布南京经济“三季报”

2025-11-01 09:44:00

上海虹桥医院癫痫专病诊疗新高度：个性化方案，全程化守护

癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响，构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失

2025-11-01 10:05:00

第十季炒股大赛冠军诞生：光伏逆变器行业龙头涨幅登顶

在《大众证券报》读者俱乐部第十季炒股比赛中，选手“馨小憩”以159.84元/股推荐的阳光电源(300274)，荐股涨幅19

2025-11-01 11:00:00

秦皇岛经开区：国内首款真空高压铸造人形机器人骨骼零部件下线

近日，国内首款真空高压铸造人形机器人腿部骨骼零部件在中信戴卡股份有限公司研制成功并生产下线，首批20件量产产品已发往国内客户

2025-11-01 11:10:00

爆款AI笔记本是如何“炼成”的？双十一，记者带你探厂

视频制作：陈希河北新闻网讯（记者李春炜）随着AI技术飞速发展，在今年的双十一期间，AI笔记本也成为爆款产品。近日，记者走进安徽合肥的联想PC设备研发和制造基地

2025-11-01 15:39:00

版权赋能创新发展 “版权强企燕赵行”活动走进高阳

10月30日，“版权强企燕赵行”活动走进保定市高阳县。活动通过进企问需、校企对接、版权法律法规科普、版权服务平台及版权区块链平台推介等方式

2025-11-01 15:47:00

荣膺金辑奖双料大奖东软赋能全球汽车产业智能化变革

10月30日，在由盖世汽车主办的2025第七届“金辑奖”颁奖盛典上，东软集团凭借在智能汽车互联领域持续的产品创新与卓越的全球化实践

2025-11-01 16:16:00

钻戒定制怎么选？2025五大宝藏品牌全解析，一篇避坑

准备结婚选钻戒，却被天然钻的高价劝退？想入手培育钻戒，又怕遇到“参数虚标”“售后无保障”的问题？2025年培育钻石市场规模突破300亿元

2025-11-01 16:17:00

第三十七届中国仿真大会在合肥市庐阳区召开

大皖新闻讯 11月1日，第三十七届中国仿真大会在合肥市庐阳区召开，大会以“数智仿真、新质发展”为主题，吸引全国约千名学者与业界代表

2025-11-02 00:04:00

“科大讯飞1024科博展”亮点抢先看！现场黑科技拉满，免费开

大皖新闻讯想让AI陪你对弈吗？想穿越时空与孙悟空来场“智慧交锋”吗？第八届世界声博会暨2025科大讯飞全球1024开发者节科博展将于11月2日至6日在合肥体育中心启幕

2025-11-02 00:04:00

出海再提速！锦江酒店（中国区）宣布旗下7天酒店出海，同日签约

锦江酒店（中国区）规模化出海再次迎来关键节点。10月31日，其于深圳正式宣布，国民品牌7天酒店将进军东南亚市场。这是继今年8月底

2025-11-01 10:02:00

拓宽合作渠道深化技术创新山西电机亮相亚洲国际展会

10月28日，亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚

2025-11-01 07:03:00

正式发布！视源股份牵头制定《娱乐用车载显示系统图像质量技术规

2025年10月23日，在全国音频、视频及多媒体系统与设备标准化技术委员会（SAC/TC 242）商用显示标准研究组第六次全会暨标准研讨会上

2025-10-31 08:20:00

中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展，以系统性

在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上，中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注

2025-10-31 08:51:00

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰

2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&

2025-10-31 08:51:00

头条订阅服务

号称博士生水准！OpenAI最新模型仍分不出9.11和9.8哪个大