• 我的订阅
  • 科技

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

类别:科技 发布时间:2025-02-19 16:05:00 来源:大众报业·齐鲁壹点

2月18日,马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。然而,被马斯克称为“地球上最聪明人工智能”的Grok 3,似乎也翻车了。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

昨日在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。

发布会后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

遗憾的是,号称目前最聪明的 Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。

据第一财经此前报道,就此问题,记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

此外,在 xAI 发布会直播中,在分析游戏《流放之路 2》的职业与升华效果时,Grok 3 也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

马斯克在社交媒体上表示,“Grok 3版本本周每天都会快速改进”,并邀请用户反馈使用问题。

(齐鲁晚报·齐鲁壹点客户端编辑石卉 综合IT之家、第一财经、快科技等)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:人工智能可以“加速”太空探索进程
...肯全球大会,在谈话中,这位特斯拉和SpaceX的CEO表达了对人工智能(AI)的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能“加速”
2024-05-07 19:25:00
马斯克抢的10000块GPU,终于有用武之地
...其抢购的一万块GPU找到了用武之地,专门成立了一家专注人工智能的新公司,xAI。在长达90分钟的Twitter Spaces音频聊天中
2023-07-19 19:00:00
马斯克担心AI会失控:除非我们建立防火墙,否则AI可能取代人类
...克对于AI的相关看法的内容。对此,我们做了一些摘录。人工智能OpenAIPayPal 的联合创始人、SpaceX 的投资人彼得·蒂尔每年都会与他的创始人基金投资的公司的领导人一起开个会
2023-09-11 17:35:00
马斯克认为人工智能具有“摧毁人类”的潜力
...通讯社华盛顿4月18日电美国亿万富翁埃隆·马斯克表示,人工智能在具有“摧毁人类”潜力的同时将不可避免地进行自我控制,尽管这将与《终结者》的情节不同。马斯克在接受福克斯新闻电视
2023-04-18 12:12:00
我国人工智能产业规模将超1万亿元!马斯克夸赞:中国AI能力很
在宣布正式进军人工智能行业之后,马斯克对人工智能的态度也发生了180度的大转弯。从最开始声称这是一项危险的技术,并呼吁暂停AI研究,到现在对其又展现出肯定的态度。马斯克近日表示,
2023-07-14 14:33:00
马斯克私生双胞胎首曝光!Neuralink女高管陪同,边遛娃边忧心AI末日
...Strider和Azure,现在已经16个月了。马斯克谈道:「如何使人工智能安全?我一直在为此苦苦挣扎。我们可以采取什么行动来最小化人工智能的危险,并且确保人类意识的生存?」
2023-09-08 17:08:00
马斯克:大约在今年年底 就能实现全面自动驾驶 | 2023世界人工智能大会
... 新民晚报记者 陈梦泽 摄新民晚报讯(记者 郜阳)世界人工智能大会的老朋友,特斯拉创始人兼首席执行官埃隆·马斯克来了,他通过视频致辞的方式谈论了当下人工智能的发展。“生成式人
2023-07-06 12:22:00
马斯克“过山车般的一周”都经历了啥?
...得信赖的顾问提出一个问题:他是否应该把更多时间花在人工智能、脑机等个人宠爱的项目上?在马斯克看来,在人工智能与人类大脑同样强大、甚至更强大的未来,这二者是两位一体的,这样的前
2024-02-07 18:08:00
马斯克说AI很快就要比人更聪明,靠谱吗?
...斯克8日在社交媒体上表示,到明年年底或者2026年,新的人工智能(AI)模型可能将超越人类的智力,“比最聪明的人还聪明”。马斯克的这一预测靠谱吗?人工智能高速发展,人类能不能
2024-04-11 09:57:00
OpenAI CEO:当年马斯克骂我们都是蠢货,然后就离开了
8月22日消息,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)最近接受采访时,谈及了埃隆·马斯克(Elon Musk)于2018年宣布退出带来的影响
2023-08-22 09:16:00
更多关于科技的资讯:
前瞻布局未来产业 新奥以智能助力高质量发展
河北新闻网讯(张新)日前,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布,将“构建以先进制造业为骨干的现代化产业体系”列为核心任务之一
2025-11-03 18:04:00
中央音乐学院发布音乐脑机接口“央音一号”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)音乐脑机接口“央音一号”,近日在中央音乐学院发布。中央音乐学院音乐人工智能与音乐信息科技系主任李小兵表示
2025-11-03 16:52:00
11.11提前抢!三联家电折扣让利,家电焕新正当时
鲁网11月3日讯随着11.11购物节的脚步日益临近,全国家电消费市场热度持续攀升,山东地区更是提前进入 “焕新倒计时”
2025-11-03 15:52:00
安徽牧羊人可持续时尚工业园项目开工 致力打造羊毛针织行业的佼佼者
大皖新闻讯 11月3日,安徽牧羊人可持续时尚工业园项目开工奠基仪式举行。项目建成后,将形成年产1000万件成衣,7200吨纺纱
2025-11-03 16:11:00
“景德镇鸡排哥”用一碗香辣鸡排撬动全网关注,这座千年瓷都再次被推上流量风口。草根摊主的日常片段在网络掀起打卡热潮,小众街巷因一条短视频迎来客流井喷
2025-11-03 12:25:00
乘AI之势,筑电子产业之基,CPCA Show Plus 2025 圆满闭幕,2026再相见!
2025年10月28日-30日,电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会(以下简称:CPCA Show Plus)在深圳国际会展中心(宝安)盛大举办
2025-11-03 12:43:00
培育钻值得购买吗?超全选购攻略一篇搞定,附头部品牌深度测评
当越来越多的年轻人开始琢磨“如何高性价比的结个婚”,培育钻石凭借着价格优势、环保理念,正成为暗潮涌动的钻戒市场的新宠。据统计
2025-11-03 12:45:00
未来,AI有望打造口感逼真的植物蛋白
大河网讯 “人工智能(AI)正以前所未有的速度加速食品创新,它不仅能打造口感逼真的植物蛋白、通过文本生成全新食品配方,还能辅助设计个性化营养食品
2025-11-03 13:10:00
2025 年,Facebook 依托 Meta 生态的 29.8 亿全球月活用户(Statista 数据),仍是企业海外拓客的关键阵地
2025-11-03 12:46:00
彰显国际范科技范 第十七届厦门国际动漫节圆满落幕
角色扮演者在金海豚动漫游戏嘉年华现场打卡。厦门游戏企业展台带来多样互动活动。游路演活动现场,企业展开对接。(动漫节组委会 供图) 厦门网讯(文/厦门日报记者 林露虹 通讯员 洪慧敏 图/厦门日报记者 林铭鸿 除署名外)昨日傍晚
2025-11-03 08:55:00
报告:亲身体验“在地风物”成年轻人出行新理由
近日,中国旅游研究院(文化和旅游部数据中心)与马蜂窝联合召开“旅游目的地探索系列报告发布会”,发布该系列最新研究成果——《中国风物报告》
2025-11-03 09:28:00
几何之厦落子广州白云机场T3,以“文化坪效”重塑机场商业价值
(2025年10月30日,广州电) 今日,广州白云国际机场T3航站楼正式通航,与这座未来年客流量超千万级航空枢纽一同启幕的
2025-11-03 09:59:00
固安:“共享工厂”赋能特色产业集群高质量发展
河北新闻网讯(万倩、王智钢)走进汉旗电子科技(固安)有限公司的生产车间,企业新升级的智能化生产线正在高效运转。这里不仅是企业自身的生产基地
2025-11-03 10:00:00
梦启未来!2025年“兴火·燎原”创新马拉松公开赛火热报名中
创新驱动发展澎湃潮涌,“数字中国”建设如火如荼。年年相约,再启新程,2025年“兴火·燎原”创新马拉松公开赛正式开放报名
2025-11-03 10:29:00
阿宽食品以品类创新引领发展:从红油面皮到土豆泥泥面、魔芋系列
10月27日至28日,四川省预制食品产业高质量发展推进会在眉山市召开。当天,阿宽食品作为代表企业设展,重点展示了包括红油面皮
2025-11-03 10:29:00