• 我的订阅
  • 科技

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

类别:科技 发布时间:2025-02-19 16:05:00 来源:大众报业·齐鲁壹点

2月18日,马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。然而,被马斯克称为“地球上最聪明人工智能”的Grok 3,似乎也翻车了。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

昨日在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。

发布会后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

遗憾的是,号称目前最聪明的 Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。

据第一财经此前报道,就此问题,记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

此外,在 xAI 发布会直播中,在分析游戏《流放之路 2》的职业与升华效果时,Grok 3 也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

马斯克在社交媒体上表示,“Grok 3版本本周每天都会快速改进”,并邀请用户反馈使用问题。

(齐鲁晚报·齐鲁壹点客户端编辑石卉 综合IT之家、第一财经、快科技等)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:人工智能可以“加速”太空探索进程
...肯全球大会,在谈话中,这位特斯拉和SpaceX的CEO表达了对人工智能(AI)的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能“加速”
2024-05-07 19:25:00
马斯克抢的10000块GPU,终于有用武之地
...其抢购的一万块GPU找到了用武之地,专门成立了一家专注人工智能的新公司,xAI。在长达90分钟的Twitter Spaces音频聊天中
2023-07-19 19:00:00
马斯克担心AI会失控:除非我们建立防火墙,否则AI可能取代人类
...克对于AI的相关看法的内容。对此,我们做了一些摘录。人工智能OpenAIPayPal 的联合创始人、SpaceX 的投资人彼得·蒂尔每年都会与他的创始人基金投资的公司的领导人一起开个会
2023-09-11 17:35:00
马斯克认为人工智能具有“摧毁人类”的潜力
...通讯社华盛顿4月18日电美国亿万富翁埃隆·马斯克表示,人工智能在具有“摧毁人类”潜力的同时将不可避免地进行自我控制,尽管这将与《终结者》的情节不同。马斯克在接受福克斯新闻电视
2023-04-18 12:12:00
我国人工智能产业规模将超1万亿元!马斯克夸赞:中国AI能力很
在宣布正式进军人工智能行业之后,马斯克对人工智能的态度也发生了180度的大转弯。从最开始声称这是一项危险的技术,并呼吁暂停AI研究,到现在对其又展现出肯定的态度。马斯克近日表示,
2023-07-14 14:33:00
马斯克私生双胞胎首曝光!Neuralink女高管陪同,边遛娃边忧心AI末日
...Strider和Azure,现在已经16个月了。马斯克谈道:「如何使人工智能安全?我一直在为此苦苦挣扎。我们可以采取什么行动来最小化人工智能的危险,并且确保人类意识的生存?」
2023-09-08 17:08:00
马斯克:大约在今年年底 就能实现全面自动驾驶 | 2023世界人工智能大会
... 新民晚报记者 陈梦泽 摄新民晚报讯(记者 郜阳)世界人工智能大会的老朋友,特斯拉创始人兼首席执行官埃隆·马斯克来了,他通过视频致辞的方式谈论了当下人工智能的发展。“生成式人
2023-07-06 12:22:00
马斯克“过山车般的一周”都经历了啥?
...得信赖的顾问提出一个问题:他是否应该把更多时间花在人工智能、脑机等个人宠爱的项目上?在马斯克看来,在人工智能与人类大脑同样强大、甚至更强大的未来,这二者是两位一体的,这样的前
2024-02-07 18:08:00
马斯克说AI很快就要比人更聪明,靠谱吗?
...斯克8日在社交媒体上表示,到明年年底或者2026年,新的人工智能(AI)模型可能将超越人类的智力,“比最聪明的人还聪明”。马斯克的这一预测靠谱吗?人工智能高速发展,人类能不能
2024-04-11 09:57:00
OpenAI CEO:当年马斯克骂我们都是蠢货,然后就离开了
8月22日消息,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)最近接受采访时,谈及了埃隆·马斯克(Elon Musk)于2018年宣布退出带来的影响
2023-08-22 09:16:00
更多关于科技的资讯:
11月8日,在以“AI共生、光启未来”为主题的“互联网之光”博览会现场,全球600多家企业带来的1000多项人工智能前沿技术产品纷纷亮相
2025-11-09 15:58:00
2025雷达无线电产业大会在宁落幕“空中卫士”筑起低空防线配套设备穿上“防护铠甲”南报网讯(记者张甜甜曹丽珍)11月8日
2025-11-09 09:34:00
小米Hyper AI获2025“直通乌镇”全球互联网大赛智能终端赛道特等奖
11月9日,2025“直通乌镇”全球互联网大赛智能终端赛道成绩揭晓。Xiaomi HyperAI获得该赛道特等奖。“直通乌镇”全球互联网大赛是世界互联网大会乌镇峰会标杆性赛事
2025-11-09 18:10:00
11月8日下午,在2025年全球互联网大会“互联网之光”博览会现场,各类机器人成为最耀眼的明星,它们既是舞台上的表演者
2025-11-09 10:23:00
日常生活中,电梯是高层楼宇里不可或缺的垂直交通工具。超过80%的电梯在发生故障前都会释放“求救信号”。这些容易被忽视的异常现象
2025-11-08 05:24:00
进博会上,南京“买手团”大逛“世界超市”全球直采,优品好物装进“购物车”□南京日报/紫金山新闻记者 黄琳燕11月7日,第八届进博会7
2025-11-08 09:31:00
八赴进博彰显深耕决心!凯克携 77 年加拿大真洋牌伟博天然,以全维优势点亮健康新生态
2025 年第八届中国国际进口博览会(进博会)盛大启幕,凯克集团再度携手 webbernaturals 伟博天然荣耀参展
2025-11-08 14:40:00
双11调研:家庭日用类消费成65.89%人大促固定选择,京东成消费者下单日百和服务首选平台
双11已步入第十七个年头,消费者的心态与行为模式也发生了深刻变化。越来越多的中国家庭将双11视为进行生活规划与品质升级的关键节点
2025-11-08 14:42:00
从巴黎歌剧院到家庭客厅,海信激光电视携手 DEVIALET 帝瓦雷开启“家庭影院新世代”
法国当地时间11月4日,全球显示领军品牌海信与知名高端音响品牌 DEVIALET 帝瓦雷在巴黎举办了一场科技与艺术的跨界盛宴
2025-11-08 14:43:00
双11囤货别忘囤“快乐”!华为应用解锁花式娱乐新体验
这个双11,你的购物车是不是已经塞满了心仪的好物?从智能家电到秋冬新装,从母婴用品到家居日用。在忙着为全家人囤货的同时
2025-11-08 14:44:00
在乌镇遇见更懂你的AI,科大讯飞携星火大模型及全场景应用亮相2025世界互联网大会
当千年舟楫摇橹的乌镇,再次成为全球互联网的焦点,一场关于未来的想象正在这里变为现实。2025年11月6日至9日,以“AI共生
2025-11-08 14:44:00
工厂数智化升级,安全建设别再原地踏步!深信服安全托管常态守护
某全球知名的智能制造企业拥有多个生产基地,高智能化产线7*24H运转,而随之而来的安全挑战,却成了企业信息部门“心病”
2025-11-08 14:44:00
双11“精神囤货”指南:华为音乐、视频、阅读,承包你的快乐源泉
又是一年双十一,当购物车被各种生活好物填满,你是否想过,也该为自己的休闲娱乐体验升个级?无论是上下班通勤路上、午休小憩时刻
2025-11-08 14:44:00
11月7日,在2025年世界互联网大会“互联网之光”博览会现场,两位机器人乐手用灵巧的双手演奏钢琴,引人驻足。“我很想去拍拍他们手的细节
2025-11-08 15:52:00
蚂蚁集团CEO韩歆毅:AQ承载蚂蚁健康新使命,让看病更简单、生活更健康
11月8日,乌镇峰会上,蚂蚁集团CEO韩歆毅作为企业代表分享了在AI医疗健康领域的思考与实践。此前,继旗下AI健康应用AQ月活用户突破千万后
2025-11-08 17:00:00