• 我的订阅
  • 科技

马斯克打脸OpenAI!全球最大模型Grok-1开源

类别:科技 发布时间:2024-03-20 13:44:00 来源:新周刊

本文经授权转载自

钛媒体

(ID:taimeiti)

作者:林志佳

马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。

钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

xAI表示,Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI的GPT模型。而此次开源的模型是是Grok-1预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

对此,英伟达科学家Jimfan评价称,这是有史以来最大的开放大型语言模型,由世界级团队训练,通过磁力链接发布。Apache 2.0。314B,专家混合(8个活跃中的2个)。就连活动参数仅(86B)就超过了最大的Llama。迫不及待地想看到基准测试结果以及人们用它构建的内容。

langchain的Andrew Kean Gao评论认为,“Grok是有史以来最大的开源大模型,是llama2尺寸的4倍。”

ChatGPT则和马斯克在评论区互相嘲讽。

马斯克随后发推文表示,“告诉我们更多有关OpenAI的‘开放’部分的信息”。他直言,xAI这个平台“已经是迄今为止最透明和最求真的平台(说实话,门槛并不高)”。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

截至发稿前,Grok上线GitHub后狂揽了6000星,586个Fork。

据悉,2023年7月,特斯拉CEO马斯克宣布成立一家新的人工智能公司xAI,新公司使命是“了解宇宙的真实本质”,目标是打造OpenAI的竞争对手。

作为OpenAI创始人之一,也是最新的OpenAI批评者,马斯克此前已表示,OpenAI已偏离了其预期目的,成为了一个以利润为导向的实体。他直言,OpenAI最初是作为一个非营利性开源组织创建的,目的是抗衡谷歌。但此后它变成了微软控制下的一家闭源、以利润为导向的公司。“OpenAI已经成为一家利润最大化的公司……这根本不是他的初衷。”

马斯克还谴责OpenAI遭到微软的控制。他表示,世界需要一个替代GPT的AI技术选择。

去年11月,马斯克正式发布xAI旗下首个大模型和应用成果方案Grok,并将Grok AI助手内置在社交平台X上。马斯克曾表示,“在某些方面,它是目前存在的最好的(AI技术)。”

当时马斯克表示,调优之后的Grok大模型具有330亿个参数,性能基准上接近Llama 2-70B,在HumanEval编码任务、MMLU基准上的结果分别为63.2%、73%。

今年2月,马斯克向美国旧金山高等法院提起诉讼,起诉OpenAI和公司联合创始人、CEO奥特曼(Sam Altman),公司总裁Greg Brockman以及 OpenAI 的若干实体,控告OpenAI团队违约、出尔反尔(“允诺禁反言”)、不正当竞争等。

马斯克在46页、1.4万字诉讼文件中声称,OpenAI违背初衷,背叛了OpenAI这家AI公司成立时达成的一项协议,即开发技术的目的是“造福人类”而非利润。他认为,OpenAI最近与微软的密切关系损害了该公司最初对开放、开源通用人工智能(AGI)领域的贡献,他要求OpenAI开放技术并寻求偿还他提供的资金。

3月初,OpenAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了OpenAI,表示需要有一个与Google/DeepMind相关的竞争对手,而他将自己做这件事。他说他会支持我们找到自己的道路。”而且该公司驳回马斯克的所有主张,并称为事情发展到这一步感到遗憾。

马斯克则直接回应,OpenAI并不开源,Grok要直接开源(Open)。

如今,Grok-1正式开源,其拥有3140亿参数,具备先进MOE架构,远超GPT-3.5、llama2等,是迄今为止参数量最大的开源大语言模型。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

xAI称,这个版本包含了Grok-1在2023年10月完成预训练阶段时的基础模型数据。根据Apache 2.0许可协议,向公众开放模型的权重和架构。以下是钛

媒体App梳理的关键信息:

该基础模型通过大量文本数据训练而成,未专门针对任何具体任务进行优化。

3140亿参数构成的混合专家模型,其中25%的参数能够针对特定的数据单元(Token)激活。而xAI团队利用定制的训练技术栈,在JAX和Rust的基础上,从零开始构建了此模型,完成时间为2023年10月。

模型参数数量高达3140亿,具备混合专家模型(Mixture of Experts, MoE)8架构,每一个数据单元(Token)由2位专家处理,共64个处理层,用于处理查询的有48个注意力机制单元(attention heads),用于处理键(key)/值(value)的有8个注意力机制单元,嵌入向量(embeddings)的维度为6,144,采用旋转式嵌入表示( RoPE) ,使用SentencePiece分词系统处理,包含131,072种数据单元,支持激活数据分布计算(activation sharding)和8位数字精度量化(8-bit quantization)

最大序列长度为8,192个数据单元,以处理更长的上下文信息

纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。

Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深刻的印象,3140亿参数太多了,你需要一堆H100,不过我已经买下了”。

值得一提的是,近期南加州大学的论文称,OpenAI发布的GPT-3.5-turbo 的参数规模也在7B(70亿)左右,除非是MoE 架构可能不同,并估计gpt-3.5-turbo的嵌入大小为 4096,称花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。

有网友形容,马斯克对于模型技术这么大方,中国企业终于有福了。

马斯克打脸OpenAI!全球最大模型Grok-1开源

(图/钛媒体)

3月17日,北京师范大学新闻传播学院教授、北京师范大学传播创新与未来媒体实验平台主任 喻国明在一场演讲中表示,别人一开源中国 AI 模型就使用是不正确的做法,对于安全性有所影响,必须国内要解决数据开源的规则问题。同时,大模型算力不足下,中国不应该“一窝蜂”做300多个大模型,而是应该做一些垂直行业、边缘计算的小模型,从而解决实际应用问题。

“模型的价值不在于数据、算法、算力的大小,而在于能否为人创造真正的价值大小,并且在价值链条中扮演关键角色。价值的最终实现,取决于大模型与小模型之间的融合与协同。”喻国明表示。

读完点个【在看】????

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-20 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“言出必行”马斯克,全球最大开源模型Grok真的来了
...的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构
2024-03-18 11:50:00
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
马斯克起诉OpenAI事件已经发酵了一周。3月7日,马斯克在推特上称,如果OpenAI把名字改为ClosedAI他就撤销诉讼
2024-03-09 22:51:00
业内震动!马斯克与它公开叫板
特斯拉创始人埃隆·马斯克11日晚宣布,将在本周开源其公司的生成式人工智能(AI)产品——Grok。近期,马斯克正与开发ChatGPT的OpenAI公司展开激烈争辩
2024-03-13 13:43:00
剑指AI 马斯克暗度陈仓
作者|涂明 李晗 朱悦编辑|王博尽管很多人相信马斯克会组建AI公司,但是没人知道这一天会什么时候到来。就像1800多年前,雍王章邯知道汉军在修栈道,但不知道汉军会悄悄绕过栈道,结
2023-07-14 15:31:00
市场担忧Sora模型带来两大隐患,马斯克“坐不住”了,秀肌肉
...技惊四座”后,在AI领域一向野心勃勃的特斯拉CEO埃隆·马斯克(ElonMusk)“坐不住”了。日前,马斯克发布了特斯拉一年前模拟真实场景的自动驾驶视频,并称“特斯拉视频的生
2024-02-21 14:59:00
马斯克又买GPU了? 马斯克呼吁停止大模型研发
...大佬纷纷投入其中,然而也有人呼吁暂停研发,其中包括马斯克。近日,小冰CEO李笛在接受采访时,被问及马斯克为何呼吁停止大模型研发时,他表示,小冰曾对此进行调查,发现马斯克自己又
2023-07-10 17:00:00
可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI
...鲸新闻8月15日讯(记者 朱俊熹)当地时间8月14日,埃隆·马斯克预告已久的新一代AI大模型Grok-2终于面世。马斯克对该模型寄予厚望
2024-08-15 14:26:00
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
马斯克看来是不服谷歌抢风头,旗下公司xAI抓紧来凑热闹。北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)
2024-08-15 09:56:00
马斯克:只要满足电力需求,比人类更聪明的AGI将在两年内实现
特斯拉CEO埃隆·马斯克。视觉中国 资料图马斯克预测,只要电力和硬件供应能够满足日益上涨的需求,人工智能(AI)可能会在两年内超越人类智能。当地时间4月8日,特斯拉CEO埃隆·马
2024-04-09 15:34:00
更多关于科技的资讯:
2025青岛虚拟现实创新大会要来:北航青岛研究院以科创助推产业跃升2.0时代
鲁网11月18日讯一副简约的框架眼镜,镜片后可能隐藏着快速滚动的信息流;一间平平无奇的房间,戴上头显后,就能摇身变为绚丽仙境……当科幻电影中的沉浸式场景逐渐成为现实
2025-11-18 15:45:00
大皖新闻讯 11月18日,记者从合肥市政府新闻办召开的新闻发布会获悉,近年来,合肥市围绕科技创新与产业升级需求,大胆改革科技金融政策机制
2025-11-18 15:44:00
AI赋能千行百业一线故事(十六):数智驱动,唤醒高校“沉睡”的专利
数智驱动,唤醒高校“沉睡”的专利——AI赋能千行百业一线故事(十六)10月24日,邯郸职业技术学院知识产权学院工作人员演示AI+专利转化运用生态服务平台
2025-11-18 08:42:00
市场监管总局11月15日发布《互联网平台反垄断合规指引(征求意见稿)》,向社会公开征求意见。征求意见稿坚持问题导向,针对平台经济领域竞争行为的特点和趋势
2025-11-18 08:44:00
厦门网讯(厦门日报记者 林露虹 通讯员 郭文晨)美资企业安费诺加码投资厦门。近日,位于厦门创新创业园的安费诺(厦门)高速线缆有限公司新工厂正式投产
2025-11-18 09:03:00
“‘一带一路’——我们共同的路”全球故事征集活动启动 扫码阅读手机版
11月18日,由天津市政府新闻办指导,津云新媒体主办的“‘一带一路’——我们共同的路”全球故事征集活动启动。活动以高质量共建“一带一路”八项行动为指引
2025-11-18 09:06:00
中新经纬11月18日电 题:“它走得太像人了”——为什么必须由车企来完成这一步?作者 陈兵 南开大学法学院副院长、教授
2025-11-18 13:00:00
OceanBase发布首款AI数据库seekdb,探索数据库AI范式的跃迁
11月18日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)
2025-11-18 13:21:00
全面满足用户本地生活服务需求,京东外卖App、点评、真榜、七鲜咖啡多箭齐发
11月17日晚,第三场京东品酒会在三亚保利瑰丽酒店举办。活动现场,京东宣布在本地生活领域密集落地一系列举措:推出京东外卖App
2025-11-18 13:21:00
安杰莱科技闪耀高交会:以科技赋能康复公益,斩获科技创新大奖
11月14日至16日,以“科技赋能产业,融合共创未来”为主旨的第二十七届中国国际高新技术成果交易会在深圳隆重举行。作为展现我国对外开放深度与广度的重要平台
2025-11-18 11:48:00
7×24小时自主巡检,杭州萧山机场添智能驱鸟装备
在航空运输业快速发展的今天,机场安全运行始终是行业关注的重点。鸟类撞击飞机的事件虽不常见,但一旦发生,可能对飞机引擎、机身结构造成损害
2025-11-18 10:47:00
“产业炬光灯”聚焦元之道生物科技
“产业炬光灯”聚焦厦门元之道生物科技有限公司。扫码看视频厦门网讯(厦门日报记者 李晓平)小小微生物,蕴藏着改变健康的大能量
2025-11-18 09:03:00
“安徽省电竞产业研究合作基地”聘任10名顾问
大皖新闻讯 2025年11月16日,安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾
2025-11-17 09:24:00
为进一步提升网点服务能力与柜员专业素养,夯实业务基础,打造有温度的金融服务,近日,邮储银行唐山市分行组织开展了“星暖燕赵 星星闪耀”星级柜员竞赛活动
2025-11-17 10:07:00
张家口农商银行宣泰支行打破传统服务边界,以“线上服务提质、直播互动破圈、短视频赋能”为抓手,将便捷与温度融入数字金融场景
2025-11-17 10:11:00