• 我的订阅
  • 科技

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

类别:科技 发布时间:2025-02-19 16:05:00 来源:大众报业·齐鲁壹点

2月18日,马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。然而,被马斯克称为“地球上最聪明人工智能”的Grok 3,似乎也翻车了。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

昨日在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。

发布会后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

遗憾的是,号称目前最聪明的 Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。

据第一财经此前报道,就此问题,记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

此外,在 xAI 发布会直播中,在分析游戏《流放之路 2》的职业与升华效果时,Grok 3 也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

马斯克在社交媒体上表示,“Grok 3版本本周每天都会快速改进”,并邀请用户反馈使用问题。

(齐鲁晚报·齐鲁壹点客户端编辑石卉 综合IT之家、第一财经、快科技等)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:人工智能可以“加速”太空探索进程
...肯全球大会,在谈话中,这位特斯拉和SpaceX的CEO表达了对人工智能(AI)的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能“加速”
2024-05-07 19:25:00
马斯克抢的10000块GPU,终于有用武之地
...其抢购的一万块GPU找到了用武之地,专门成立了一家专注人工智能的新公司,xAI。在长达90分钟的Twitter Spaces音频聊天中
2023-07-19 19:00:00
马斯克担心AI会失控:除非我们建立防火墙,否则AI可能取代人类
...克对于AI的相关看法的内容。对此,我们做了一些摘录。人工智能OpenAIPayPal 的联合创始人、SpaceX 的投资人彼得·蒂尔每年都会与他的创始人基金投资的公司的领导人一起开个会
2023-09-11 17:35:00
马斯克认为人工智能具有“摧毁人类”的潜力
...通讯社华盛顿4月18日电美国亿万富翁埃隆·马斯克表示,人工智能在具有“摧毁人类”潜力的同时将不可避免地进行自我控制,尽管这将与《终结者》的情节不同。马斯克在接受福克斯新闻电视
2023-04-18 12:12:00
我国人工智能产业规模将超1万亿元!马斯克夸赞:中国AI能力很
在宣布正式进军人工智能行业之后,马斯克对人工智能的态度也发生了180度的大转弯。从最开始声称这是一项危险的技术,并呼吁暂停AI研究,到现在对其又展现出肯定的态度。马斯克近日表示,
2023-07-14 14:33:00
马斯克私生双胞胎首曝光!Neuralink女高管陪同,边遛娃边忧心AI末日
...Strider和Azure,现在已经16个月了。马斯克谈道:「如何使人工智能安全?我一直在为此苦苦挣扎。我们可以采取什么行动来最小化人工智能的危险,并且确保人类意识的生存?」
2023-09-08 17:08:00
马斯克:大约在今年年底 就能实现全面自动驾驶 | 2023世界人工智能大会
... 新民晚报记者 陈梦泽 摄新民晚报讯(记者 郜阳)世界人工智能大会的老朋友,特斯拉创始人兼首席执行官埃隆·马斯克来了,他通过视频致辞的方式谈论了当下人工智能的发展。“生成式人
2023-07-06 12:22:00
马斯克“过山车般的一周”都经历了啥?
...得信赖的顾问提出一个问题:他是否应该把更多时间花在人工智能、脑机等个人宠爱的项目上?在马斯克看来,在人工智能与人类大脑同样强大、甚至更强大的未来,这二者是两位一体的,这样的前
2024-02-07 18:08:00
马斯克说AI很快就要比人更聪明,靠谱吗?
...斯克8日在社交媒体上表示,到明年年底或者2026年,新的人工智能(AI)模型可能将超越人类的智力,“比最聪明的人还聪明”。马斯克的这一预测靠谱吗?人工智能高速发展,人类能不能
2024-04-11 09:57:00
OpenAI CEO:当年马斯克骂我们都是蠢货,然后就离开了
8月22日消息,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)最近接受采访时,谈及了埃隆·马斯克(Elon Musk)于2018年宣布退出带来的影响
2023-08-22 09:16:00
更多关于科技的资讯:
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00