• 我的订阅
  • 科技

马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?

类别:科技 发布时间:2024-08-13 09:50:00 来源:雷科技

继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。

当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Grok-2将于8月发布,在回应用户关于训练数据的提问时,他表示该模型将在这方面做出“巨大改进”。

马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?

图源:X

今年三月,马斯克曾表示Grok-2将在“所有指标”上超越当前一代的AI 模型。

作为一个由xAI从头开始训练的混合专家(MoE)模型,Grok自2023年11月推出第一版以来,于今年3、4月陆续推出了Grok-1.5大语言模型和首个多模态模型Grok-1.5 Vision,整体迭代速度已足够惊人。

但要超越当前所有AI大模型,Grok-2要面对的问题或许远没想象中简单。

所有指标超越当前AI大模型,真的假的?

2023年11月,xAI推出其第一代大语言模型Grok时表示,Grok的设计灵感来源于《银河系漫游指南》,最初主要为X上的Grok聊天机器人提供支持,用于包括问答、信息检索、创意写作和编码辅助在内的自然语言处理任务。

最初版本Grok-0仅拥有330亿参数,经过数次改良后的Grok-1拥有3140亿参数,是当时全球参数量最大的开源大语言模型。

即便这些参数在给定token上的激活权重仅为25%,Grok-1的激活参数数量也有860亿,这比LIama-2的70B参数还多,这意味着其在处理语言任务时具备广阔的潜在能力。

Grok-1采用了混合专家系统的设计,每个token从8个专家中选择2个进行处理。在该架构下,根据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。

根据xAI公布的数据,在GSM8K、HumanEval和MMLU等一系列基准测试中,Grok-1的表现超过了Llama-2-70B和GPT-3.5,不过与第一梯队的GPT-4差距还很明显。

图源:xAI

来到Grok-1.5,情况已大为改观。Grok-1.5不仅具有改进的推理能力和128k的上下文长度,其在编码和数学相关任务中的表现也得到显著提升。

在官方测试中,Grok-1.5在MATH基准上取得了50.6%的成绩,在GSM8K基准上取得了90%的成绩,这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外,它在评估代码生成和解决问题能力的HumanEval基准测试中得分为74.1%。

马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?

图源:xAI

基准测试中的整体表现与GPT-4已十分接近,甚至在HumanEval测试上实现了超越。

紧接着xAI发布的多模态模型Grok-1.5V,号称能连接数字世界和物理世界。不仅多项基准测试可以和GPT-4V、Claude 3 Sonnet、Claude 3 Opus等这些最顶尖的多模态模型对打,还能处理文档、图标、屏幕截图和照片之类的各种视觉信息,支持读懂梗图、写Python代码的操作。

尽管马斯克和xAI目前尚未公布关于Grok模型的详细信息,但按照该模型的迭代趋势,马斯克口中将在“所有指标”上超越当前一代AI模型的Grok-2,看来也不是空口无凭。

更大的参数量、更强的性能和速度这些几乎是板上钉钉的升级,当然最让我期待的,或许还是年底左右推出的Grok-3,毕竟马斯克表示该模型的水平将“达到或超越”尚未发布的OpenAI GPT-5,后者被认为是大语言模型领域的下一个重大突破。

马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?

图源:微博

如果Grok-3真能达到上述水平,那对马斯克旗下公司的影响将是巨大的,比如陷入用户增长停滞的X和专注于FSD的特斯拉,前者可以借助大模型为用户提供更智能的聊天机器人,打造社交平台的差异化;后者则可以使用大模型语言进行“思维链”处理,帮助汽车“端到端”分解视觉复杂场景,解决当前自动驾驶的某些局限。这点在Grok-1.5时,就传出应用在特斯拉FSD V13的消息。

但不论如何,Grok接下来很可能改变大模型的迭代和应用方式,更可以确定的是,以Grok为代表的开源大模型,与闭源大模型之间的竞争还在继续加剧。

开源VS闭源,大模型路线之争

马斯克是开源的坚定支持者,其曾多次公开表达对OpenAI闭源商业路线的不满,并向法院提起诉讼,以违反合同为由起诉OpenAI及其CEO Sam Altman,要求恢复开源。

xAI的诞生,很大程度上就是为阻止人工智能领域出现“一家独大”的局面。讽刺的是,OpenAI的"Open"程度真不如xAI。马斯克如期开源了3140亿参数的Grok-1,遵守Apache 2.0许可证允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。

OpenAI是AI领先者,要求其开源ChatGPT背后模型代码不太现实——除非它自身愿意。但不可否认,无论是国内还是海外,大模型开源都已成为一大趋势。

海外,去年7月Llama2宣布免费可商用后,一举成为了全球开发者首选的开源大模型。不久后,谷歌也通过发布Gemma开始进入开源大模型的竞争,凭借70亿参数碾压 Llama2-13B(130亿参数);国内市场,阿里宣布开源720亿参数的大语言模型通义千问Qwen-72B,性能超越标杆Llama2-70B,号称最强中文开源模型。

大模型开源、闭源的路线之争向来是热点话题,不少行业大佬也发表了自己的观点。百度CEO李彦宏是“闭源派”,其认为在同样的参数规模下,开源模型的能力不如闭源,如果开源模型想要在能力上追平闭源模型,就需要更大的参数规模,这将导致更高的推理成本和更慢的反应速度。

马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?

图源:2024世界人工智能大会

“大模型五虎”之一百川智能的CEO王小川,则是开源派的拥趸,其认为开源与闭源并非对立关系,两者并存互补或许才是更优解。他预计,未来80%的企业会用到开源大模型,因为闭源没办法对产品做更好的适配,或者成本特别高。

李彦宏和王小川的观点没有对错之分,只是不同的选择,大模型开源与闭源的路线本质上是由商业模式决定的。

闭源大模型在保护知识产权、确保数据安全合规等方面具有优势,但在灵活性和可定制方面可能会受到限制;开源大模型是互联网成熟的商业模式,尽管最终目的也是变现,但因为有多方参与,更像是一个整体推动生态前进,比如快速迭代、快速试错、共创共担等等。

个人认为谷歌高级软件工程师Luke Sernau的表述十分准确:开源模式的迭代进步速度已经威胁到了部分闭源模型的生存,因为开源方相当于获得了整个星球的免费劳动力。

这正是开/闭源大模型之争的根源:不管开发者还是用户,都更倾向于最好的开源项目,群聚效应可能远比闭源大模型来得明显。

写在最后

按照马斯克的理念,接下来发布的Grok-2大概率也会开源。面对日益加剧的开源大模型战争,不管是xAI、谷歌、Meta、阿里,还是Mistral AI、Databricks以及更多的开源大模型厂商,都还在继续进行迭代,提高性能、提高效率。毕竟谁也无法笃定在这场快速变化的技术革命中,能不能守住甚至扩大优势。

马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?

图源:特斯拉

马斯克给xAI带来的影响力只是短期的,真正决定xAI未来的还得看Grok的实际表现,它或许可与X、特斯拉业务结合打造AI大模型标杆杀手锏应用,也可能只是“纸面参数”甚至Sora这样的“技术期货”,一切问题,都要等到Grok-2发布那天,才会有更明确的答案。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-13 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

马斯克xAI新计划:人工智能模型Grok 2测试版即将发布
特斯拉CEO马斯克在X平台上表示,人工智能模型Grok 2测试版即将发布。Grok,作为xAI公司的明星大语言模型,其首代产品Grok 1已凭借神经演化计算与深度学习技术的深度融
2024-08-12 10:14:00
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
马斯克看来是不服谷歌抢风头,旗下公司xAI抓紧来凑热闹。北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)
2024-08-15 09:56:00
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
作者:机器之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’
2024-03-18 11:51:00
“地球上最聪明人工智能”Grok 3答不对9.11和9.9谁大:马斯克回应
...,被网友戏称为“天才不愿意回答简单问题”。不过对此马斯克并不以为然,其公开回应称,当前的Grok 3仅是测试版,这个阶段错误越多越好,而完整版将在未来几个月推出,并邀请用户反
2025-02-19 12:56:00
特斯拉CEO埃隆·马斯克周末表示,该公司的全自动驾驶(FSD)软件测试版暂时会将安全性置于舒适性之上。 马斯克补充称,当特斯拉对FSD测试版的安全性充满信心时,舒适性也会随之而来
2023-06-05 23:31:00
曝特斯拉重大更新:FSD测试版入华准备,影子模式先行
...SD即将进行最后一次更新,要把Beta版的后缀摘掉的前夕,马斯克在推特上表示:“我们正在拼凑与特斯拉FSD应用的人工智能技术相关的最后一个拼图,那就是车辆控制技术。”这将使原
2023-08-13 13:35:00
乘风AI大模型 全面自动驾驶加速兑现 马斯克再放豪言的底气从何而来?
在今日的2023世界人工智能大会上,特斯拉CEO马斯克表示,随着人工智能技术快速发展,预计大约在今年年末,便有望实现全面自动驾驶。他坦承,“我之前也做过许多类似的预测,我承认之前
2023-07-06 13:26:00
马斯克发布grokai测试版
12月8日消息,埃隆・马斯克旗下的人工智能初创公司xAI上个月推出了其首款AI助手Grok,今日马斯克在X平台发布贴文
2023-12-09 10:35:00
留给特斯拉FSD的时间不多了:马斯克还得再跑快点
...OTA 实现完全自动驾驶,并且 FSD 比人类驾驶会更加安全。马斯克已经不止一次在公开场合表示,FSD 有能力实现完全自动驾驶。不过,残酷的现实是特斯拉一直在不断推迟自己的完
2023-07-14 14:30:00
更多关于科技的资讯:
蔡高民:颠覆认知!打破西方理论垄断!中国老年学自主知识体系诞生
《全生命周期养能力发展与医养结合:理论和实践》的核心突破,在于建构“养”的元概念、定义与内涵外延,并以此为基础构建了逻辑自洽的三大理论体系
2026-01-04 20:15:00
编者按:周期更迭,变量叠加。站在“十五五”开局之年的关键节点上,各行业如何调整节奏、校准路径、寻找增量?中新经纬广邀多领域学者
2026-01-04 20:21:00
春节临近,年味渐浓。在贵阳,一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位,融合在地风物、潮流文化与青年创造力
2026-01-04 21:50:00
不经意晃动手机,软件立即跳转购物页面。最近,记者实测发现,备受诟病的“摇一摇跳转”广告乱象依然时有发生,困扰着不少用户
2026-01-04 17:59:00
2025年度帆书APP经典热搜榜,精准解锁经典中的成长指南
当“信息过载”成为常态,“选择困难”深入骨髓,我们比任何时候都更需要一个清晰的信号:什么才是值得投入时间的真知?近日,帆书APP根据全年用户收听数据发布的“经典热搜榜”
2026-01-04 14:25:00
黄鹤权据光明网报道,英国《剑桥词典》将2025年年度词汇定为“准社交”,形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感
2026-01-04 14:25:00
飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商
近日,海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单(第一批)》。公示名单显示
2026-01-04 15:28:00
抖音生活服务联合南京德基广场落地“心动街区”,电视台直播+明星见面会+打卡活动助力商圈消费
12月30日,抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播
2026-01-04 15:30:00
浪潮卓数大数据旗下公司入围多项2025年山东省大数据产业“三优两重”项目
近日,山东省工业和信息化厅正式公布2025年山东省大数据产业“三优两重”项目名单。浪潮卓数大数据旗下天元征信公司、浪潮(山东)大数据科技有限公司
2026-01-04 15:31:00
华麟数科推出联盟生态链“麒麟链”,加速数字经济深度融合与转型
【中国,2026年1月】 —— 在数字经济浪潮席卷全球、深入渗透各行各业的关键阶段,华麟数科(广东)有限公司(以下简称“华麟数科”)正式宣布
2026-01-04 15:31:00
以具身智能赋能教育未来----开普勒机器人助力高校产学研融合创新
在新一轮科技革命与产业变革加速演进的背景下,人工智能正从"算法与算力"的竞争,走向"智能体与真实世界深度融合"的新阶段
2026-01-04 15:33:00
中国首个!新奈发布“智能呼吸工程体系”,破解家用呼吸设备长期安全难题
在睡眠与呼吸健康领域,真正的改变往往不是某一功能的增加,而是背后那套长期支撑它持续进化的技术体系。2025年12月,新奈 Synaire 对外发布年度科研成果
2026-01-04 15:33:00
中国科技定义未来运动 HURA超现实远程赛车亮相世界未来运动会
2025年12月18日至23日,全球体育科技前沿的目光齐聚阿联酋首都阿布扎比国家展览中心。在这里举办的2025世界未来运动会(Games of the Future 2025)上
2026-01-04 15:33:00
京东健康深化政企协同 助力吉林人参产业发展提质增效
元旦假期期间,人参等滋补品在节庆送礼与家庭健康消费中的需求集中释放。京东健康的消费数据显示,近一个月以来,人参等滋补品类销售同比增长55%
2026-01-04 15:59:00
稳送万物,乘势而上:顺丰同城交出2025年度答卷
2025年,即时零售的“东风”依旧猛烈,市场规模逼近万亿大关,“餐饮+非餐”品类单量均刷新了历史纪录,验证即时零售的天花板远未见顶
2026-01-04 13:55:00