• 我的订阅
  • 科技

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

类别:科技 发布时间:2025-02-19 16:05:00 来源:大众报业·齐鲁壹点

2月18日,马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。然而,被马斯克称为“地球上最聪明人工智能”的Grok 3,似乎也翻车了。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

昨日在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。

发布会后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

遗憾的是,号称目前最聪明的 Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。

据第一财经此前报道,就此问题,记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

此外,在 xAI 发布会直播中,在分析游戏《流放之路 2》的职业与升华效果时,Grok 3 也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

马斯克在社交媒体上表示,“Grok 3版本本周每天都会快速改进”,并邀请用户反馈使用问题。

(齐鲁晚报·齐鲁壹点客户端编辑石卉 综合IT之家、第一财经、快科技等)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:人工智能可以“加速”太空探索进程
...肯全球大会,在谈话中,这位特斯拉和SpaceX的CEO表达了对人工智能(AI)的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能“加速”
2024-05-07 19:25:00
马斯克抢的10000块GPU,终于有用武之地
...其抢购的一万块GPU找到了用武之地,专门成立了一家专注人工智能的新公司,xAI。在长达90分钟的Twitter Spaces音频聊天中
2023-07-19 19:00:00
马斯克担心AI会失控:除非我们建立防火墙,否则AI可能取代人类
...克对于AI的相关看法的内容。对此,我们做了一些摘录。人工智能OpenAIPayPal 的联合创始人、SpaceX 的投资人彼得·蒂尔每年都会与他的创始人基金投资的公司的领导人一起开个会
2023-09-11 17:35:00
马斯克认为人工智能具有“摧毁人类”的潜力
...通讯社华盛顿4月18日电美国亿万富翁埃隆·马斯克表示,人工智能在具有“摧毁人类”潜力的同时将不可避免地进行自我控制,尽管这将与《终结者》的情节不同。马斯克在接受福克斯新闻电视
2023-04-18 12:12:00
我国人工智能产业规模将超1万亿元!马斯克夸赞:中国AI能力很
在宣布正式进军人工智能行业之后,马斯克对人工智能的态度也发生了180度的大转弯。从最开始声称这是一项危险的技术,并呼吁暂停AI研究,到现在对其又展现出肯定的态度。马斯克近日表示,
2023-07-14 14:33:00
马斯克私生双胞胎首曝光!Neuralink女高管陪同,边遛娃边忧心AI末日
...Strider和Azure,现在已经16个月了。马斯克谈道:「如何使人工智能安全?我一直在为此苦苦挣扎。我们可以采取什么行动来最小化人工智能的危险,并且确保人类意识的生存?」
2023-09-08 17:08:00
马斯克:大约在今年年底 就能实现全面自动驾驶 | 2023世界人工智能大会
... 新民晚报记者 陈梦泽 摄新民晚报讯(记者 郜阳)世界人工智能大会的老朋友,特斯拉创始人兼首席执行官埃隆·马斯克来了,他通过视频致辞的方式谈论了当下人工智能的发展。“生成式人
2023-07-06 12:22:00
马斯克“过山车般的一周”都经历了啥?
...得信赖的顾问提出一个问题:他是否应该把更多时间花在人工智能、脑机等个人宠爱的项目上?在马斯克看来,在人工智能与人类大脑同样强大、甚至更强大的未来,这二者是两位一体的,这样的前
2024-02-07 18:08:00
马斯克说AI很快就要比人更聪明,靠谱吗?
...斯克8日在社交媒体上表示,到明年年底或者2026年,新的人工智能(AI)模型可能将超越人类的智力,“比最聪明的人还聪明”。马斯克的这一预测靠谱吗?人工智能高速发展,人类能不能
2024-04-11 09:57:00
OpenAI CEO:当年马斯克骂我们都是蠢货,然后就离开了
8月22日消息,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)最近接受采访时,谈及了埃隆·马斯克(Elon Musk)于2018年宣布退出带来的影响
2023-08-22 09:16:00
更多关于科技的资讯:
双轮驱动,智启未来:刘晓春与AI智能体×机器人“姊妹组合战略”的全球布局
2026,智能时代的分水岭2026年的春天,马年春晚的舞台上,一场科技盛宴惊艳了全球观众——30多台国产机器人协同起舞
2026-02-22 12:05:00
新春走基层丨厦企加快数字化转型步伐 提前返岗忙生产赶订单
明翰电气的工人春节期间坚守岗位。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)放置材料、调试机台……正月初五,厦门明翰电气股份有限公司(以下简称“明翰电气”)已忙碌起来
2026-02-22 08:50:00
新春走基层 | 森一量子为赶订单全员在线 生产线满负荷运转
昨日记者走进森一量子,这一企业春节期间全员加班加点。厦门网讯(厦门日报记者 李晓平)长晶、 切割、减薄、抛光、镀膜……当大多数人还沉浸在春节的喜庆中
2026-02-22 08:50:00
我带着一款AI眼镜回家过年
记者带回家的AI眼镜二伯买的宇树机器狗Go2今年的春晚有一个格外醒目的变化——“AI含量”明显提升。年夜饭桌上,亲戚们都在聊各自手机里的各种“AI”App
2026-02-22 07:49:00
中国科大实现碳化硅改性双空位色心的电荷态调控
大皖新闻讯 2月21日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在碳化硅改性双空位色心电荷态调控的研究中取得了新进展
2026-02-21 16:48:00
戛纳世界人工智能大会探讨“音乐人工智能”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)2026戛纳世界人工智能大会(WAICF 2026),近日在法国戛纳举办
2026-02-21 12:10:00
杭州一家高科技创业公司员工 每人领一个陪伴机器人回家过年
春节去各地见见世面长长“脑子”这个春节,大多数打工人都卸下KPI返乡团聚。杭州一家名为镭萌科技的创业公司,却有一群特殊的“员工”在忙着长“脑子”
2026-02-21 08:11:00
建设一流创新生态 激发创新投资需求杭州日报讯 日前,浙江(杭州)知识产权创新产业园内,一场旨在连接技术与资本的专利产业化投融资专项对接活动火热举行
2026-02-21 08:11:00
新春佳节,浙江不少企业春节“不打烊”,抢订单、赶交付、跑海外,把年过在了车间里和海外展台前。走进宁波这家科技企业,工作人员正紧盯屏幕
2026-02-20 15:04:00
马年春节,杭城消费市场持续升温。一批全国首店、浙江首店、杭州首店密集登陆湖滨、武林、钱江新城、奥体等核心商圈,覆盖潮玩
2026-02-20 07:31:00
大年初三,杭州苏宁易购庆春路店暖意融融。大厅里“焕新幸福年”的红色标语格外醒目。店内客流平稳,多为全家同行的家庭顾客,虽不似年前拥挤
2026-02-20 08:01:00
“库迪咖啡竟然涨价了,9.9元的咖啡以后还能闭眼冲吗?”春节前最后一个工作日,东北姑娘小乔中午赶到杭州火车东站,准备坐高铁回老家
2026-02-20 08:01:00
潮声丨从“Made in”到“Design by”,浙江品牌出海记
新春,义乌老板们已经忙碌起来。这几天,24家义乌企业亮相2026年美国拉斯维加斯服装服饰及面料展,带着新品抢订单、拓市场
2026-02-19 16:24:00
新春走基层|“解码”潮玩盲盒:Z世代用情绪消费点亮团圆年
中青报·中青网记者沈杰群余冰玥李怡蒙见习记者蒋欣雨95后北京职员王之怡在新加坡休假时,特意去了环球影城附近的泡泡玛特,店内挤满了年轻人
2026-02-19 12:05:00