• 我的订阅
  • 科技

马斯克打脸OpenAI!全球最大模型Grok-1开源

类别:科技 发布时间:2024-03-20 13:44:00 来源:新周刊

本文经授权转载自

钛媒体

(ID:taimeiti)

作者:林志佳

马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。

钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

xAI表示,Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是Grok-1预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B)就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构建的内容。

langchain的Andrew Kean Gao评论认为,“Grok是有史以来最大的开源大模型,是llama2尺寸的4倍。”

ChatGPT则和马斯克在评论区互相嘲讽。

马斯克随后发推文表示,“告诉我们更多有关OpenAI的‘开放’部分的信息”。他直言,xAI这个平台“已经是迄今为止最透明和最求真的平台(说实话,门槛并不高)”。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

截至发稿前,Grok上线GitHub后狂揽了6000星,586个Fork。

据悉,2023年7月,特斯拉CEO马斯克宣布成立一家新的人工智能公司xAI,新公司使命是“了解宇宙的真实本质”,目标是打造OpenAI的竞争对手。

作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”

马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要一个替代GPT的AI技术选择。

去年11月,马斯克正式发布xAI旗下首个大模型和应用成果方案Grok,并将Grok AI助手内置在社交平台X上。马斯克曾表示,“在某些方面,它是目前存在的最好的(AI技术)。”

当时马斯克表示,调优之后的Grok大模型具有330亿个参数,性能基准上接近Llama 2-70B,在HumanEval编码任务、MMLU基准上的结果分别为63.2%、73%。

今年2月,马斯克向美国旧金山高等法院提起诉讼,起诉OpenAI和公司联合创始人、CEO奥特曼(Sam Altman),公司总裁Greg Brockman以及 OpenAI 的若干实体,控告OpenAI团队违约、出尔反尔(“允诺禁反言”)、不正当竞争等。

马斯克在46页、1.4万字诉讼文件中声称,OpenAI违背初衷,背叛了OpenAI这家AI公司成立时达成的一项协议,即开发技术的目的是“造福人类”而非利润。他认为,OpenAI最近与微软的密切关系损害了该公司最初对开放、开源通用人工智能(AGI)领域的贡献,他要求OpenAI开放技术并寻求偿还他提供的资金。

3月初,OpenAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了OpenAI,表示需要有一个与Google/DeepMind相关的竞争对手,而他将自己做这件事。他说他会支持我们找到自己的道路。”而且该公司驳回马斯克的所有主张,并称为事情发展到这一步感到遗憾。

马斯克则直接回应,OpenAI并不开源,Grok要直接开源(Open)。

如今,Grok-1正式开源,其拥有3140亿参数,具备先进MOE架构,远超GPT-3.5、llama2等,是迄今为止参数量最大的开源大语言模型。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

xAI称,这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。根据Apache 2.0许可协议,向公众开放模型的权重和架构。以下是钛

媒体App梳理的关键信息:

该基础模型通过大量文本数据训练而成,未专门针对任何具体任务进行优化。

3140亿参数构成的混合专家模型,其中25%的参数能够针对特定的数据单元(Token)激活。而xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型,完成时间为2023年10月。

模型参数数量高达3140亿,具备混合专家模型(Mixture of Experts, MoE)8架构,每一个数据单元(Token)由2位专家处理,共64个处理层,用于处理查询的有48个注意力机制单元(attention heads),用于处理键(key)/值(value)的有8个注意力机制单元,嵌入向量(embeddings)的维度为6,144,采用旋转式嵌入表示( RoPE) ,使用SentencePiece分词系统处理,包含131,072种数据单元,支持激活数据分布计算(activation sharding)和8位数字精度量化(8-bit quantization)

最大序列长度为8,192个数据单元,以处理更长的上下文信息

纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。

Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了”。

值得一提的是,近期南加州大学的论文称,OpenAI发布的GPT-3.5-turbo 的参数规模也在7B(70亿)左右,除非是MoE 架构可能不同,并估计gpt-3.5-turbo的嵌入大小为 4096,称花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。

有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中国 AI 模型就使用是不正确的做法,对于安全性有所影响,必须国内要解决数据开源的规则问题。同时,大模型算力不足下,中国不应该“一窝蜂”做300多个大模型,而是应该做一些垂直行业、边缘计算的小模型,从而解决实际应用问题。

“模型的价值不在于数据、算法、算力的大小,而在于能否为人创造真正的价值大小,并且在价值链条中扮演关键角色。价值的最终实现,取决于大模型与小模型之间的融合与协同。”喻国明表示。

读完点个【在看】????

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-20 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“言出必行”马斯克,全球最大开源模型Grok真的来了
...的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构
2024-03-18 11:50:00
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
马斯克起诉OpenAI事件已经发酵了一周。3月7日,马斯克在推特上称,如果OpenAI把名字改为ClosedAI他就撤销诉讼
2024-03-09 22:51:00
业内震动!马斯克与它公开叫板
特斯拉创始人埃隆·马斯克11日晚宣布,将在本周开源其公司的生成式人工智能(AI)产品——Grok。近期,马斯克正与开发ChatGPT的OpenAI公司展开激烈争辩
2024-03-13 13:43:00
剑指AI 马斯克暗度陈仓
作者|涂明 李晗 朱悦编辑|王博尽管很多人相信马斯克会组建AI公司,但是没人知道这一天会什么时候到来。就像1800多年前,雍王章邯知道汉军在修栈道,但不知道汉军会悄悄绕过栈道,结
2023-07-14 15:31:00
市场担忧Sora模型带来两大隐患,马斯克“坐不住”了,秀肌肉
...技惊四座”后,在AI领域一向野心勃勃的特斯拉CEO埃隆·马斯克(ElonMusk)“坐不住”了。日前,马斯克发布了特斯拉一年前模拟真实场景的自动驾驶视频,并称“特斯拉视频的生
2024-02-21 14:59:00
马斯克又买GPU了? 马斯克呼吁停止大模型研发
...大佬纷纷投入其中,然而也有人呼吁暂停研发,其中包括马斯克。近日,小冰CEO李笛在接受采访时,被问及马斯克为何呼吁停止大模型研发时,他表示,小冰曾对此进行调查,发现马斯克自己又
2023-07-10 17:00:00
可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI
...鲸新闻8月15日讯(记者 朱俊熹)当地时间8月14日,埃隆·马斯克预告已久的新一代AI大模型Grok-2终于面世。马斯克对该模型寄予厚望
2024-08-15 14:26:00
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
马斯克看来是不服谷歌抢风头,旗下公司xAI抓紧来凑热闹。北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)
2024-08-15 09:56:00
马斯克:只要满足电力需求,比人类更聪明的AGI将在两年内实现
特斯拉CEO埃隆·马斯克。视觉中国 资料图马斯克预测,只要电力和硬件供应能够满足日益上涨的需求,人工智能(AI)可能会在两年内超越人类智能。当地时间4月8日,特斯拉CEO埃隆·马
2024-04-09 15:34:00
更多关于科技的资讯:
投洽会期间厦门火炬高新区共有41个项目完成签约 计划总投资约433亿元
投洽会上,火炬高新区企业展示的芯片产品吸引客商关注。(本组图/厦门日报全媒体记者 卢剑豪 摄)多家位于火炬高新区的专精特新“小巨人”企业亮相投洽会
2025-09-09 08:44:00
刚刚过去的暑假,“工厂游”火爆出圈。多地工厂纷纷敞开大门,推出丰富多彩的研学项目。而在社交平台上,“工厂游”的攻略被大量转发
2025-09-09 08:46:00
东南网9月8日讯(通讯员 苏培婷)9月5日,由大田县总工会、国网大田县供电公司联合主办,国网大田县供电公司工会承办的首届“电力工匠”职业技能竞赛AI技术应用项目比赛圆满落幕
2025-09-09 09:28:00
本报讯 作为中国洗涤用品工业协会主办的行业盛会,第45届(2025)中国洗涤用品行业年会与第17届中国国际日化产品原料及设备包装展览会(以下简称“中国国际日化展”)将于今年10月15日至17日在重庆国际博览中心举行
2025-09-09 10:44:00
摩登中国时尚展传递中国皮革强音
本报记者 解 磊 文/摄为了满足人们对鞋包服饰等消费需求,为国际国内品牌企业、特色区域、独立设计师提供一个高端商贸合作
2025-09-09 10:44:00
近年来,我国消费市场涌现出许多新亮点,其中一个令人意外却极具代表性的现象是:碳纤维最大应用市场,竟然不是航空航天或风电叶片
2025-09-09 10:45:00
获SIAL创新金奖:纸沙拉沙拉脆片掀起零食健康新主张
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。湖南立方体食品有限公司选送的产品纸沙拉沙拉脆片荣获金奖
2025-09-09 11:17:00
王腾发微博辟谣:有失职,但没有窃取机密出售
9月8日,王腾发布离开小米的微博,当天,“小米王腾因泄密被辞退”登上热搜。此前,2023年8月25日,王化曾发博表示,欢迎王腾回京~好好干
2025-09-09 11:18:00
王腾深夜发文离开小米,其曾被赠“谨言慎行”T恤
9月8日晚,中国区市场部总经理、REDMI品牌总经理王腾发布微博:很惭愧跟大家说声抱歉,过去犯了一些错误,接受该有的代价
2025-09-09 11:18:00
前零一万物联创戴宗宏创业:20人团队,能干上百人的AI定制项目
文|周鑫雨编辑|苏建勋国内市场、ToB、定制化——每个词都踩到了当下AI创业的雷点上。但这恰恰是前零一万物联合创始人戴宗宏
2025-09-09 15:19:00
不再低调的二次元,正在经营一种「痛系生活」
撰文|深海 封面来源|视觉中国 刚刚过去的这个夏天,上海俨然变成了一座二次元年轻人的“痛城”。 7月开始,几大动漫展会接连袭来
2025-09-09 21:51:00
全棉时代官宣孙颖莎为全球品牌代言人
9月8日,全棉时代官宣乒乓球运动员孙颖莎为全球品牌代言人,为旗下棉柔巾品类代言。双方将携手传递舒适、健康、环保的全棉生活方式
2025-09-09 14:30:00
京东超市11周年发布新战略 未来三年用户数从3亿将增至5亿
京东超市11周年发布会8日在北京举行,全球快消行业超400家知名品牌负责人、高管齐聚一堂。面对全球零售业遇到的多重挑战
2025-09-09 15:02:00
中秋至味 团圆共飨|好太太2025中秋礼盒上线啦!
月满人间,礼寄相思好太太中秋诚挚献礼好太太中秋礼盒是家的味道,更是爱的传递礼盒产品线下各大商超均有售卖欢迎各企事业单位
2025-09-09 15:19:00
让每个临沂人吃上48小时的健康好蛋 ——雁行天下商务驿站“斗蛋”比赛活动
大众网记者葛世艳 临沂报道9月2日上午,雁行天下全景溯源工厂体验店高朋满座,一场围绕新鲜健康好蛋的“斗蛋”活动在此热闹展开
2025-09-09 15:29:00