• 我的订阅
  • 科技

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

类别:科技 发布时间:2025-02-19 16:05:00 来源:大众报业·齐鲁壹点

2月18日,马斯克及其 xAI 团队在直播中正式发布了 Grok 3,此前马斯克通过持续的预热宣传,将外界对 Grok3 的期待值推向了前所未有的高度。然而,被马斯克称为“地球上最聪明人工智能”的Grok 3,似乎也翻车了。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

昨日在发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。

发布会后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

遗憾的是,号称目前最聪明的 Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。

据第一财经此前报道,就此问题,记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

此外,在 xAI 发布会直播中,在分析游戏《流放之路 2》的职业与升华效果时,Grok 3 也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。

“最聪明人工智能”Grok 3竟答不出9.11和9.9哪个大?马斯克:会快速改进

马斯克在社交媒体上表示,“Grok 3版本本周每天都会快速改进”,并邀请用户反馈使用问题。

(齐鲁晚报·齐鲁壹点客户端编辑石卉 综合IT之家、第一财经、快科技等)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-19 17:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克:人工智能可以“加速”太空探索进程
...肯全球大会,在谈话中,这位特斯拉和SpaceX的CEO表达了对人工智能(AI)的看好,认为“追求真理”的人工智能可以“促进人类文明发展”。然而,当被问及人工智能是否能“加速”
2024-05-07 19:25:00
马斯克抢的10000块GPU,终于有用武之地
...其抢购的一万块GPU找到了用武之地,专门成立了一家专注人工智能的新公司,xAI。在长达90分钟的Twitter Spaces音频聊天中
2023-07-19 19:00:00
马斯克担心AI会失控:除非我们建立防火墙,否则AI可能取代人类
...克对于AI的相关看法的内容。对此,我们做了一些摘录。人工智能OpenAIPayPal 的联合创始人、SpaceX 的投资人彼得·蒂尔每年都会与他的创始人基金投资的公司的领导人一起开个会
2023-09-11 17:35:00
马斯克认为人工智能具有“摧毁人类”的潜力
...通讯社华盛顿4月18日电美国亿万富翁埃隆·马斯克表示,人工智能在具有“摧毁人类”潜力的同时将不可避免地进行自我控制,尽管这将与《终结者》的情节不同。马斯克在接受福克斯新闻电视
2023-04-18 12:12:00
我国人工智能产业规模将超1万亿元!马斯克夸赞:中国AI能力很
在宣布正式进军人工智能行业之后,马斯克对人工智能的态度也发生了180度的大转弯。从最开始声称这是一项危险的技术,并呼吁暂停AI研究,到现在对其又展现出肯定的态度。马斯克近日表示,
2023-07-14 14:33:00
马斯克私生双胞胎首曝光!Neuralink女高管陪同,边遛娃边忧心AI末日
...Strider和Azure,现在已经16个月了。马斯克谈道:「如何使人工智能安全?我一直在为此苦苦挣扎。我们可以采取什么行动来最小化人工智能的危险,并且确保人类意识的生存?」
2023-09-08 17:08:00
马斯克:大约在今年年底 就能实现全面自动驾驶 | 2023世界人工智能大会
... 新民晚报记者 陈梦泽 摄新民晚报讯(记者 郜阳)世界人工智能大会的老朋友,特斯拉创始人兼首席执行官埃隆·马斯克来了,他通过视频致辞的方式谈论了当下人工智能的发展。“生成式人
2023-07-06 12:22:00
马斯克“过山车般的一周”都经历了啥?
...得信赖的顾问提出一个问题:他是否应该把更多时间花在人工智能、脑机等个人宠爱的项目上?在马斯克看来,在人工智能与人类大脑同样强大、甚至更强大的未来,这二者是两位一体的,这样的前
2024-02-07 18:08:00
马斯克说AI很快就要比人更聪明,靠谱吗?
...斯克8日在社交媒体上表示,到明年年底或者2026年,新的人工智能(AI)模型可能将超越人类的智力,“比最聪明的人还聪明”。马斯克的这一预测靠谱吗?人工智能高速发展,人类能不能
2024-04-11 09:57:00
OpenAI CEO:当年马斯克骂我们都是蠢货,然后就离开了
8月22日消息,人工智能研究公司OpenAI首席执行官萨姆·奥特曼(Sam Altman)最近接受采访时,谈及了埃隆·马斯克(Elon Musk)于2018年宣布退出带来的影响
2023-08-22 09:16:00
更多关于科技的资讯:
从代表委员热议的AI开源,看杭州“魔搭社区”
1月12日,省政协委员、之江实验室党委副书记袁继新,前往省人民大会堂参加相关会议。随身的公文包里,装着打印好的提案。“全球人工智能竞争已进入‘开源驱动’的新阶段
2026-01-13 08:24:00
厦门网讯(厦门日报记者 林露虹)近日,国内高端传感器领域领军企业——厦门乃尔电子有限公司(以下简称“乃尔电子”)完成D轮融资
2026-01-13 09:09:00
产业炬光灯聚焦高格服饰 拥抱智能制造\
“产业炬光灯”系列短视频聚焦高格服饰,看这家服装企业如何通过升级设备、打磨技术,在竞争激烈的市场中“织”出发展新优势。扫码观看视频
2026-01-13 09:10:00
深耕三维动画十五载 数字星尘赋能企业视觉营销新生态
深耕三维动画十五载 数字星尘赋能企业视觉营销新生态在数字化浪潮席卷各行各业的今天,视觉化表达已成为企业技术传播、产品推广与品牌营销的核心载体
2026-01-13 09:35:00
“马”力全开 2026一起轻松跑“厦”去
新年伊始,我们再度于晨光中奔赴热爱之约!2026厦门马拉松于1月11日圆满落下帷幕。作为世界田联白金标赛事与开年重磅赛事
2026-01-13 09:35:00
长白时评评论员 久泰平近日,2026首届净月机器人冰雪趣味赛鸣锣开赛。当双足机器人在-20℃的雪道上蹒跚前行,机械臂在寒风中精准投出雪球
2026-01-13 10:51:00
近年来,随着大模型技术快速发展,国内外科技公司陆续推出AI(人工智能)伴侣产品和服务,这些产品通过文字、语音、图像等交互模式
2026-01-13 07:17:00
王永昌:青年杭商要主动拥抱智能体浪潮
“AI世界澎湃汹涌,我是开疆拓土的先锋……”在1月9日举行的“微光如炬”2026杭州日报财经年会暨二届天下杭商总会年会上
2026-01-13 07:22:00
跨境电商企业在蓬勃发展的同时,也面临着日益复杂的法律风险。为破解行业发展难题,丰富跨境电商法治服务供给,强化企业出海法治指引
2026-01-13 07:22:00
日前,“AI赋能・产业新程”行业大模型概念验证中心首场路演沙龙活动在浙工大人工智能创新研究院(以下简称“浙工大智研院”)举行
2026-01-13 07:23:00
佛山正视利怎么样?品牌硬实力与全民口碑给出答案
在全民视力健康危机日益严峻的当下,我国视力问题人群已高达 7.8 亿,儿童青少年总体近视率近 60%,其中高中生近视率更是飙升至 87
2026-01-12 21:03:00
安建大教师最新研究成果破解心脏病变分割难题
大皖新闻讯 近日,安徽建筑大学陈永麟老师联合南京林业大学、安徽大学及武汉市第三人民医院的专家们,创新性地提出了DAF-Mamba的高性能分割模型
2026-01-12 22:22:00
迪士尼限定快闪登陆马来西亚,杰森娱乐“生态出海”加速市场开拓
2026年1月9日,马来西亚吉隆坡核心商业地标LaLaport BBCC的ACG BASE正式上演为期一个多月的大型主题快闪——这是杰森娱乐集团携手迪士尼以及国际知名插画师Mik
2026-01-12 17:34:00
网络视听向何处发展?第五届网络视听创新发展论坛举办
中国青年报客户端讯(中青报·中青网记者余冰玥沈杰群)近日,“新大众文艺·新视听使命”第五届网络视听创新发展论坛在北京举办
2026-01-12 17:34:00
打开手机,刷几条短视频,准能看见一条养生秘籍;翻几页朋友圈,也少不了长辈们转发的健康预警。从“吃木薯助眠”到“冷冻馒头会长黄曲霉毒素”
2026-01-12 18:18:00