• 我的订阅
  • 科技

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

类别:科技 发布时间:2024-08-15 09:56:00 来源:搜狐科技

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

马斯克看来是不服谷歌抢风头,旗下公司xAI抓紧来凑热闹。

北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)。

xAI直接揭秘,前一阵子出现在Lmsys大模型竞技场上的神秘模型“sus-column-r”就是Grok-2。

在xAI给出的大模型排行榜中,Grok-2的评分优于GPT-4o-mini和Claude 3.5 Sonnet。

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

从xAI内部测试结果来看,相较于上一代模型,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。

值得一提的是,Grok-2在数学推理(MathVista)方面表现登顶测试榜首。

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

但细心网友不难发现,即便是Grok-2,在其他方面与前沿模型GPT-4o或Claude 3.5 Sonnet相比都稍显不足。这张图不得不说排版是费了心机(把GPT-4o和Claude 3.5 Sonnet安排得远远的)。

即便是这样的结果,马斯克还是对xAI的研发进度表示了肯定,“Grok推进速度如火箭。”

攻克经典难题

目前,Grok-2和Grok-2 mini在 X 平台处于测试阶段,X Premium和Premium+用户已经可以体验,模型将在本月晚些时候通过企业 API 的方式提供。

xAI表示,Grok-2的API将基于新的定制技术栈。

一方面是支持多区域推理部署,实现全球范围的低延迟访问。另一方面是增强安全功能。

模型刚发布不到半天,已有不少网友迫不及待玩了起来。

有人试了试,给前天马斯克和特朗普的公开对话配张图。

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

还有人试了试让特朗普和奥巴马一起在中国长城上吃烤肉。

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

不得不说,Grok-2生成图片的色彩饱和度还挺高,但图片细节处理仍有待改进(奥巴马的手为啥大一圈?)。

对于很火的“9.9和9.11比大小”的问题,难倒了GPT-4o,但没难住Grok-2(sus-column-r)。

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

意外收获是,经典的“strawberry”数“r”难题,也被Grok-2顺利攻克。

马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题

对xAI的偏爱

xAI 是由马斯克于 2023 年 7 月创立的一家公司,其目的是发展人工智能技术,构建安全的AI模型以帮助人类解决复杂的任务和挑战。

马斯克对xAI寄予厚望,甚至不惜牺牲特斯拉为xAI提供资源,以此帮助他实现在今年年底构建世界上最强大AI的目标。

xAI除了直接从特斯拉招募做软件研发的优秀员工,马斯克更是要求把预留给特斯拉的GPU转移到xAI。

“特斯拉收集的大量视觉数据可以作为xAI的训练资源。”马斯克说。

他在最近一次访谈中谈到,“追求深层次地理解事物是人工智能发展的目标,Grok也正在朝这个方向做出努力。

现在来看,Grok-2似乎只是小露锋芒,Grok-3才是马斯克憋的大招。

他透露,Grok-3正在孟菲斯数据中心同步训练推进中,大概会在3至4个月内完成训练,再进行微调和修错,希望能在12月前发布,Grok-3或将成为世界上最强大的AI大模型。

据悉,孟菲斯数据中心拥有全球最大的超算集群,10万块液冷H100助阵。从算力上来看,大约是OpenAI用于训练GPT4的25000块A100的20倍左右。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-15 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
作者:机器之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’
2024-03-18 11:51:00
AI春晚:黄仁勋称需要更强大的GPU,马斯克吹捧英伟达最适合AI
...段时间的研发,机器人的“ChatGPT时刻”或许近在咫尺。 马斯克吹捧:英伟达最适合AI这场座无虚席的演讲让黄仁勋被网友笑称为“AI界的泰勒·斯威夫特”,也再次打响英伟达作
2024-03-19 21:04:00
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚
2024-08-13 09:50:00
埃隆・马斯克发布grok-2和grok-2mini模型
8月14日消息,埃隆・马斯克(ElonMusk)旗下xAI公司昨日(8月13日)以Beta版本的形式,发布了Grok-2和Grok-2mini两款AI模型
2024-08-15 01:43:00
马斯克发布新模型 称能力超DeepSeek
...初创公司xAI直播发布Grok3大模型,并同步进行现场演示。马斯克称其为“地球上最聪明的人工智能”,他表示,Grok3具备强大的推理能力
2025-02-18 17:50:00
马斯克梦想AI超算霸权,旗下公司却\
3月22日消息,尽管埃隆·马斯克(Elon Musk)致力于打造能与英伟达抗衡的超级计算机,但他旗下公司与英伟达的关系却日益紧密
2024-03-22 16:44:00
估值180亿美元,马斯克造了一家“AI独角兽”
...一天文数字。而xAI才仅仅成立不到一年的时间,它无疑是马斯克的又一个“造富神话”。根据有关消息,考虑参与此轮融资的投资方包括风投公司Gigafund和投资人Steve Jurvetson
2024-04-10 11:26:00
马斯克抢的10000块GPU,终于有用武之地
...觉中国文 | 贝克街探案官,作者 | 车行运7月14日,埃隆·马斯克为其抢购的一万块GPU找到了用武之地,专门成立了一家专注人工智能的新公司
2023-07-19 19:00:00
古早费曼论文手写公式也能转LaTeX,马斯克Grok功能上线就火了
...,它更标志着知识管理和信息传播方式的一次重大变革。马斯克旗下的人工智能公司 xAI 发布的 Grok 大模型有助于实现这一目标 —— 在经历了最近的一次更新后
2024-10-30 09:54:00
更多关于科技的资讯:
近日,国际顶级学术期刊《自然》发表了我国科学家在储热技术领域的一项重要突破。浙江大学能源工程学院研究员范利武团队与其合作者提出全新的“滑移强化接触熔化”机制
2026-01-12 08:22:00
企业深度访谈对象:北京分形科技有限公司媒体:企业家日报在数字化转型浪潮中,高端网站建设已从单纯的信息展示,升级为集品牌形象
2026-01-12 08:56:00
我用AI造轮胎——“车间里的AI”系列报道之一
在中策橡胶临江制造工厂,轮胎生产制造全程由机器人完成。 本报记者 曹坚 摄当你走进一家传统的轮胎制造工厂,会看到什么?可能是轰鸣的机器
2026-01-12 09:23:00
双十一卖爆,连续五年天猫销冠!这个国货卸妆凭什么?
近年来,随着护肤步骤精细化与彩妆使用日常化,卸妆已成为中国美妆市场中增长最为迅猛的赛道之一。在这一充分竞争的市场中,衡量品牌实力的标尺日益清晰
2026-01-12 09:26:00
烟台毓璜顶医院专家直播1月15日开讲:直面卵巢功能减退,科学助力好孕梦想
胶东在线1月12日讯(记者 栾雪 通讯员 李成修 王婧)备孕路上,你是否也曾被“卵巢功能减退”的诊断打乱节奏?是否一边焦虑卵子质量
2026-01-12 10:37:00
超清晰视觉,全球共鉴,高德智感ApexVision闪耀CES 2026
冬日的拉斯维加斯星光熠熠,全球目光持续聚焦一年一度的科技盛会——CES美国国际消费电子展。来自中国的红外热成像领军企业高德智感Guide Sensmart(展位号
2026-01-12 09:26:00
近日,苹果应用商店一款名为“死了么”的App受到关注,据悉,该应用是为独居人群打造的轻量化安全工具,用户需要设置紧急联系人并签到
2026-01-12 09:28:00
因为AI的快速发展,过去一年里内存、硬盘和显卡都经历了显著上涨,对硬件终端的影响也终于爆发。开年以后,许多人发现多个品牌的笔记本电脑迎来了意想不到的涨价
2026-01-12 07:52:00
贯通生态,链接未来:ISPO Beijing 2026在京盛大开幕
2026年1月9日,亚太地区运动生活方式产业的开年风向标,ISPO Beijing 2026亚洲运动用品与时尚展于北京国家会议中心隆重启幕
2026-01-12 07:56:00
新年伊始,奋进正当时,在“十五五”开局的关键节点,山西转型综改示范区锚定发展目标抢订单、抓生产、拓市场,全力冲刺第一季度“开门红”
2026-01-12 07:05:00
近年来,音效设计行业在技术介入程度上的讨论不断增加。机器学习、区块链等技术的应用,使行业内部出现了关于“声音设计是否需要标准化
2026-01-09 14:49:00
“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛作品火爆征集中,入围即享孵化赋能!
鲁网1月9日讯在黄海之滨、崂山脚下,千年文脉与现代潮流在此交融共生。为推动中华优秀传统文化创造性转化、创新性发展,助力崂山文旅高质量发展提质增效
2026-01-09 16:45:00
安徽人文讲坛丨人工智能:向新、向深、向未来
大皖新闻讯 人工智能正以前所未有的速度重塑人类社会,成为驱动全球科技革命、产业变革与国家竞争的核心力量。从历史纵深审视
2026-01-11 17:59:00
“返本还原第四回——小尺幅版画作品展”在省美术馆展出
江南时报讯(记者 钱海盈)由江苏省美术馆主办、江苏版画院(水印版画材料与技术研究文化和旅游部重点实验室)承办的“返本还原第四回——小尺幅版画作品展”正在江苏省美术馆展出
2026-01-11 15:13:00
邦德激光SK高速款激光切管机,引领高效切割技术新高度
在金属管材加工中,如何让设备在真正“高速”运行时,仍能保持“高精度”与“高稳定性”?单纯提升单项参数往往顾此失彼。邦德激光认为
2026-01-11 15:47:00