• 我的订阅
  • 科技

号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大

类别:科技 发布时间:2024-09-14 10:18:00 来源:浅语科技

快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。

按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1来编写一个找松鼠的网页游戏。

这个游戏的目标是控制一只考拉躲避不断增加的草莓,并在3秒后找到出现的松鼠。这类游戏的逻辑相对复杂,更考验OpenAI o1的逻辑推理能力。

号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大

官方还表示,相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。

不过,经过实测,OpenAI o1依然无法解决“9.11和9.8哪个大”的经典难题,严重扣分。

因为9.11和9.8哪个大这个问题,之前AI大模型集体失智,所以....

号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大

【本文结束】如需转载请务必注明出处:快科技

责任编辑:雪花

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-14 11:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...到的“思考”过程,来源:OpenAI) 认知将跃升至“理科博士生水准”OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平
2024-09-13 13:34:00
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...授,阿兰・图灵研究所 Turing Fellow,其指导的 UCL 一年级博士生宋研。利物浦大学助理教授方蒙。上海交通大学 Apex 和多智能体实验室张伟楠教授(上海交通大学计算机系教授
2024-10-15 09:56:00
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...人工智能。袁洋袁洋是清华大学交叉信息学院助理教授,博士生导师。2012年毕业于北京大学计算机系;2018年获美国康奈尔大学计算机博士学位;2018-2019年前往麻省理工学院
2024-09-24 13:36:00
清华团队提出新型光计算架构,光训练速度提升1个数量级
...for optical neural networks)为题,发表于 Nature[1]。 清华大学博士生薛智威
2024-08-09 09:57:00
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...理、化学和生物学这些具有挑战性的基准任务上的表现与博士生相似。OpenAI 还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中
2024-09-13 16:42:00
MIT最新研究:多个AI协作有助提高大模型推理能力和准确性
...提高自己的回答。”麻省理工学院电气工程和计算机科学博士生、CSAIL附属成员以及论文的首席作者之一Yilun Du说道
2023-09-20 13:42:00
...了人类的性别、伦理和道德偏见。伦敦大学学院信息学系博士生奥利维娅·麦克米伦-斯科特问道:“它们是否也反映了人类在推理测试中的认知偏差?”她总结自己的研究成果称,这些大语言模型
2024-06-12 18:15:00
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...副主任 张奇张奇,复旦大学计算机科学技术学院教授、博士生导师。兼任上海市智能信息处理实验室副主任,中国中文信息学会理事、CCF 大模型论坛常务委员、CIPS 信息检索专委会常
2024-11-26 09:38:00
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
日前,美国罗格斯大学博士生金明宇和所在团队,通过引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM
2024-03-15 10:41:00
更多关于科技的资讯: