• 我的订阅
  • 科技

Meta大模型LLaMA 3即将登场,参数量或达1400亿

类别:科技 发布时间:2024-04-10 22:40:00 来源:财经风云

在推出开源大模型LLaMA2近一年之后,Meta的新一代大模型LLaMA3即将面世。

在4月9日伦敦举行的一次活动中,Meta确认计划在下个月内首次发布LLaMA3。据了解,该模型将有多个具有不同功能的版本。

Meta大模型LLaMA 3即将登场,参数量或达1400亿

但Meta并没有披露LLaMA3的参数规模。“随着时间的推移,我们的目标是让由LLaMA驱动的MetaAI成为世界上最有用的助手。”Meta人工智能研究副总裁JoellePineau说。“要达到这个目标,还有相当多的工作要做。”

而据科技外媒TheInformation4月8日发布的报道,作为对标GPT-4的大模型,LLaMA3的大规模版本参数量可能超过1400亿,而最大的LLaMA2版本的参数量为700亿。LLaMA3将支持多模态处理,即同时理解和生成文本及图片。

值得注意的是,LLaMA3将延续Meta一直以来的开源路线。目前,开源模型界的竞争正在变得愈发激烈,开源大模型亦进化得越来越强大。截至目前,包括谷歌、马斯克旗下的xAI、MistralAI、StabilityAI等在内的许多公司都发布了开源的大模型。

作为开源模型界的“扛把子”,Meta在AI基础设施上的投入亦不可小觑,目前只有微软拥有与之相当的计算能力储备。Meta发布的一篇技术博客称,到2024年底,该公司将再购350000个英伟达H100GPU,算上其他GPU,其算力相当于近600000个H100。

LLaMA3即将登场参数量或达1400亿

在4月9日伦敦举行的一次活动中,Meta确认计划在下个月内首次发布LLaMA3。Meta全球事务总裁NickClegg表示:“在下个月内,甚至是在很短的时间内,我们希望推出新的下一代基础模型套件LLaMA3。”

从NickClegg的表述上看,LLaMA3将有多个不同功能的版本。“今年内,我们将发布一系列具有不同功能、不同通用性的模型,很快就会开始发布。”

同时,Meta首席产品官ChrisCox补充称,Meta计划用LLaMA3为Meta的多个产品提供支持。

值得注意的是,LLaMA3将延续Meta一直以来的开源路线。

与OpenAI坚持的闭源路线和大参数LLM不同,Meta从一开始就选择了开源策略和小型化LLM。

2023年2月,Meta在其官网公开发布了LLaMA大模型,与GPT系列模型类似,LLaMA也是一个建立在Transformer基础架构上的自回归语言模型。

LLaMA包括70亿、130亿、330亿、650亿这四种参数规模,旨在推动LLM的小型化和平民化研究。相比之下,GPT-3最高则达到了1750亿的参数规模。Meta在当时的论文中总结称,尽管体积小了10倍以上,但LLaMA(130亿参数)的性能优于GPT-3。

一般来说,较小的模型成本更低,运行更快,且更容易微调。正如Meta首席执行官扎克伯格在此前的财报电话会议中称,开源模型通常更安全、更高效,而且运行起来更具成本效益,它们不断受到社区的审查和开发。

谈及开源问题,扎克伯格在接受外媒TheVerge采访时曾表示:“我倾向于认为,最大的挑战之一是,如果你打造的东西真的很有价值,那么它最终会变得非常集中和狭隘。如果你让它更加开放,那么就能解决机会和价值不平等可能带来的大量问题。因此,这是整个开源愿景的重要组成部分。”

除此之外,小型模型还便于开发者在移动设备上开发AI软件,这也是LLaMA系列模型自开源以来就获得开发者广泛关注的原因。当前,Github上许多模型都是基于LLaMA系列模型而开发。

去年7月,Meta发布了LLaMA2。当时,Meta也采用了先发小模型的策略。在发布700亿参数的LLaMA2大规模版本之前,Meta先行推出了130亿和70亿参数的小型版本。

不过,根据相关的测试,LLaMA2拒绝回答一些争议性较小的问题,例如如何对朋友恶作剧或怎样“杀死”汽车发动机等。近几个月来,Meta一直在努力使LLaMA3在回答有争议的问题上更开放,也更准确。

尽管Meta没有透露LLaMA3的参数规模,但从TheInformation的报道来看,作为对标GPT-4的大模型,LLaMA3的大规模版本参数量据悉可能超过1400亿,这与最大版本的LLa-MA2相比提升了一倍。

在整个开源模型界,竞争正在变得愈发激烈,开源大模型亦进化得越来越强大。

今年2月,谷歌罕见地改变了去年坚持的大模型闭源策略,推出了开源大模型Gemma;3月,马斯克也开源了旗下xAI公司的Grok-1模型。根据Gemma和Grok-1的性能测试文档,它们在数学、推理、代码等多项基准测试方面的性能均超过了同规模的LLaMA2模型。

截至目前,包括谷歌、xAI、MistralAI、DataBricks和StabilityAI等在内的多家科技公司发布了开源的大模型。有业内人士此前在接受记者采访时说道:“开源是大势所趋,我认为Meta正在引领这一趋势,其次是MistralAI、HuggingFace等规模较小的公司。”

“狂卷”AGI豪掷百亿美元囤芯片

作为开源模型界的“扛把子”,Meta在AI基础设施上的投入亦不可小觑。

实际上,Meta上个月曾发布一篇技术博客,展示了自己拥有的算力资源,以及布局AI基础设施的细节和路线图。该公司称,其长期愿景是构建开放且负责任的通用人工智能(AGI),以便让每个人都能广泛使用并从中受益。

Meta在博客中写道:“到2024年底,我们的目标是继续扩大(AI)基础设施建设,其中包括350000个英伟达H100GPU,这是其产品组合的一部分,算上其他,其算力相当于近600000个H100。”据悉,目前只有微软拥有与之相当的计算能力储备。按照亚马逊给出的价格来算,一块H100芯片大约3万美元,350000个H100的价格就是105亿美元(约合760亿元人民币)。

在这份文档中,Meta也透露了一些用于训练LLaMA3的集群细节,该集群由24576个英伟达H100GPU构成。

据市场跟踪公司Omdia去年发布的一份报告,Meta和微软是英伟达H100GPU的最大买家。据其估算,上述两家公司在2023年各自采购了150000个H100GPU,是谷歌、亚马逊、甲骨文等科技公司所购的H100GPU数量的三倍以上。

在前述文档中,Meta也重申了将坚持一贯以来的开源路线,“Meta始终致力于人工智能软件和硬件的开放创新。我们相信开源硬件和软件将永远是帮助行业大规模解决问题的宝贵工具。”

值得一提的是,凭借AI上的投入,扎克伯格在福布斯最新发布的2024(第38届)全球亿万富豪榜上居第四,资产净值为1770亿美元,这也是扎克伯格有记录以来的最高排名。以美元计算,扎克伯格的资产净值在过去一年增长最多,共增加1126亿美元,增幅为174.8%。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-11 06:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型
2024-04-20 11:00:00
“最强开源AI模型”,4050亿参数版Meta Llama 3被曝7月23日发布
...援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外
2024-07-13 09:52:00
扎克伯格这一举动,将让中国90%大模型公司快速死亡
什么才是正确的AI创业创新姿势?答案好像不是做大模型的。吃过见过,和王兴一起创立了万亿美团帝国的王慧文,大模型创业弄了一半,抑郁了,早早就退出了人工智能内卷,他或许提前看到了什么
2023-07-21 15:26:00
差一步称霸 AI:历史进程中的扎克伯格
...后,Facebook 又推出了 PyTorch。这是一个集合了大量代码与模型算法的超级仓库,能免除不少重复性工作。日后一众机构大炼 AI 时
2023-06-25 23:00:00
盘后跌15%!Meta一季度净利翻番,AI投资推高全年支出引发担忧
...的人才、数据和能力来扩展基础设施,构建世界领先的AI模型和服务。这让我相信,我们在未来几年中应该投入更多资金,构建更先进的模型和全球规模最大的AI服务。”Meta股价于24日
2024-04-25 08:19:00
钮祜禄·Meta:发布最强开源新模型Llama 2,拉拢微软做盟友 | 最前线
...Meta开始高调奋起进击。北美时间7月18日,META公布最新大模型Llama 2(羊驼 2),包含7B、13B和 70B三种参数变体
2023-07-19 18:04:00
开源大模型新的里程碑!Llama 3.1 模型准时发布
...KER科技7月24日消息,今日凌晨,Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本
2024-07-24 12:13:00
小扎新开源的Llama3.1,要带着套壳大模型追平GPT-4o?
...,开源 AI 界扛把子 Meta AI ,昨晚更新他们最新最强的大模型, Llama3.1 。 这玩意跟上次 Llama3 一样也是三个版本
2024-07-25 09:20:00
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...日),美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 4,Llama 4目前有两个的版本,名为Scout和Maverick
2025-04-07 06:44:00
更多关于科技的资讯:
高德扫街榜100天全新升级:从美食到吃喝玩乐,全球首次实现飞行实景探店
1月7日,上线100天的高德扫街榜宣布三大重磅升级:依托世界模型发布全球首个“飞行街景”,实现从街景一路俯瞰至店内实景
2026-01-07 14:08:00
税赋能肇庆新能源汽配集群蓄力成长
在粤港澳大湾区汽车产业集群迅猛发展的浪潮中,肇庆市鼎湖区依托区位优势和产业基础,新能源汽车零配件产业集群加速成型。从专注新能源汽车电池安全材料的国家级专精特新“小巨人”
2026-01-07 13:46:00
高德扫街榜100天重磅升级:全球首推飞行实景探店,免费向100万烟火小店开放
1月7日,上线100天的高德扫街榜宣布三大重磅升级:依托世界模型发布全球首个“飞行街景”,实现从街景一路俯瞰至店内实景
2026-01-07 11:26:00
让光谱仪变小变强:清华大学团队从波粒二象性找到答案
近日,清华大学电子系鲍捷教授团队在材料科学领域国际知名期刊《Nano Research》发表题为《The Wave-Particle Duality of Light Manif
2026-01-07 08:54:00
近期,荣程智运科技(天津)有限公司(以下简称“荣程智运”)自主研发的“基于图像识别的非格式化磅单智能转换方法及系统”获得国家发明专利授权
2026-01-07 09:04:00
一颗“善变”的石头|了不起的河南智造③
【编者按】当厚重中原遇上智慧创新,会擦出怎样的火花?黄河之畔,钢铁与芯片共舞,机械臂与大数据齐鸣,一场“智造交响曲 ”正在上演
2026-01-07 09:06:00
三河市燕郊首届机器人科技展开幕
河北新闻网讯(刘伟)1月2日,燕郊首届机器人科技展在三河市燕郊天洋广场盛大开幕。活动为期两天,由三河市委宣传部、三河市科协主办
2026-01-07 09:47:00
科技赋能反诈 珍爱网筑牢婚恋交友安全屏障
在互联网高速发展的当下,信息便利与安全风险并存,个人信息泄露、网络诈骗等问题给婚恋交友带来诸多隐患。作为深耕行业二十年的婚恋服务领军企业
2026-01-07 08:54:00
昨日,A股继续发动攻势,其中上证指数盘中突破2025年11月中旬4034点的阶段性高点,收在全天最高点4083.67点
2026-01-07 08:06:00
中新经纬1月6日电 6日晚,小米公司发言人官方微博公布了团队与相关KOL接触一事的处罚结果。全文如下:昨天关于团队与相关KOL接触一事
2026-01-07 08:08:00
杭州日报讯 创新往往来自年轻人。“我要特别致敬青年人,青年人始终站在时代前列,他们代表着社会前进的方向。”1月3日,杭州浙江大学校友会会长
2026-01-07 07:05:00
■程璐摘要:在高中英语学习中,词汇掌握质量直接影响阅读理解与表达能力。传统词汇教学多停留在机械记忆层面,学生难以形成稳定且可迁移的词汇表征
2026-01-07 04:52:00
江西如何跑稳“谷子经济”千亿赛道(图)
“‘谷子’不仅是Goods的谐音,对于我们来说,也是一种精神食粮。”刚从二手集市收摊的高中生小甜(化名)对“吃谷”这件事有着自己的理解
2026-01-07 04:52:00
喜旺春节礼盒上市!把年味与福气,一键打包带回家
辞暮尔尔,烟火年年。当街头的红灯笼渐渐挂起,当归家的车票开始抢订,藏在心底的年味也愈发浓烈。年,是团圆的相聚,是味蕾的盛宴
2026-01-07 05:00:00
烟台高新区:中关村烟台协同创新中心举办航空航天专场—烟台优质企业北京场景应用对接会
胶东在线1月5日讯(通讯员 郭健 实习编辑 单煜媛)近日,中关村·烟台协同创新中心联合烟台绿丞先进材料创新服务中心在北京举办烟台优质企业场景应用(航空航天专场)对接会
2026-01-07 05:00:00