• 我的订阅
  • 科技

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

类别:科技 发布时间:2024-04-20 11:00:00 来源:搜狐科技
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

在开源闭源到底谁会落后的争议声中,Meta——这家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。

美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。

马斯克对此评价称“还不错”。Meta透露,未来几个月内还会推出Llama3更大参数版本的开源模型。

Meta CEO扎克伯格在最新采访中确认,4050亿参数模型仍在训练,预计今年晚些时候推出,并称Meta的目标是要超过所有人。这意味着,Meta与OpenAI的开源闭源之战才刚刚打响。

2.4万张GPU训练,碾压谷歌

此次发布的Llama3大模型,相较于上一代在编码、推理等性能上取得了显著进步。Meta公布的九项行业基准测试评测结果显示,Llama3-8B参数版本几乎全面碾压谷歌的Gemma和Mistral的70亿模型。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama3-70B参数版本则在7项评测中超过闭源的谷歌Gemini两个版本模型,以及Mistral和Claude 3中杯模型,在GPQA(测试模型回答通用问题表现)和MATH(评估模型解决高级数学问题能力)上不及谷歌目前最强大的大模型,但优于Claude 3中杯模型。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

此外,在Meta组织的人类反馈评分中,Llama 3-70B打败了GPT-3.5等多款模型。该测试包含1800个测试项,覆盖12个主要的应用场景,包括文摘总结、创意写作、角色扮演、逻辑推理、编程分类等,意在提升模型在现实应用场景下的表现。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama 3模型能力的提升,得益于模型架构、预训练数据的选择、预训练过程的扩展,以及对模型进行指令微调的打磨。

它采用15T token的数据训练,是Llama 2数据集的7倍多,代码数据量也增加了四倍。并在含有2.4万个英伟达GPU集群上训练,训练效率提高3倍。

Meta表示,Llama 3预训练数据集超过5%来自高质量的非英语数据,能更好满足各国用户、不同语言背景的使用需求。

此外,Llama 3在安全方面也有重大突破,开发了新版的信任和安全工具,相比Llama 2,进一步降低了误拒率,增强了模型的一致性。

Meta目前还在研发Llama 3超400B的参数模型,有望与GPT-4一较高下。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama 3很快将在亚马逊、谷歌、微软、英伟达等云厂商和大模型API提供商等平台推出。未来数月,Meta计划推出一系列具备全新功能的模型,包括多模态、支持多语言对话、扩展上下文窗口的长度,以及全面提升的综合性能。

基于Llama 3,Meta发布了AI助手 Meta AI。扎克伯格表示,MetaAI将成为人们可以免费使用的最智能的AI助手。

开源还是闭源?

Llama3的开源将进一步深刻影响着全球AI大模型的格局,不仅巩固了Meta在开源阵营当中的地位,同时也增强了开源模型与闭源模型竞争的力量。

越来越多的公司开始争夺全球最强开源模型。不久前,马斯克旗下的xAI开源全球规模最大的开源模型,参数高达3140亿。美国AI独角兽Databricks最近开源了参数1320亿的模型,当时号称是全球最强的开源大模型,但现在可能已被Llama3-70B模型夺走。

国内同样有越来越多的公司选择开源,包括阿里、360以及智谱AI、百川智能、零一万物等,并在参数规模上不断突破。早前不久,昆仑万维推出4000亿参数的“天工3.0”基座开源大模型,成为全球最大的开源MoE(混合专家)大模型。

不过,在最新的采访中,扎克伯格表示,Meta的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。他提到,今年晚些时候发布的Llama 3-400B将在许多基准测试中领先,并已经在考虑Llama 4和5。

英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。

近日,开源和闭源引发不少争议。李彦宏认为,开源会越来越落后,闭源会持续领先,且闭源才有真正的商业模式。

随后,周鸿祎直言“网上有些名人胡说八道,大家别被忽悠,连说这话的公司自己都借助了开源的力量才成长到今天”。

他认为,开源社区聚集的工程师和科学家的数量是闭源的数百倍,所以一年(时间)就已经超过GPT-3.5,未来一两年内,开源很有可能会达到或超过闭源的水平。

扎克伯格同样强调了开源的重要性,认为它对社区和人类都有好处,可以推动AI广泛应用,是防范或解决AI垄断的重要方式。

“未来AI垄断可能会像人工智能的广泛应用一样危险,如果一个机构拥有的人工智能比其他机构的人工智能强大得多,那可能也很糟糕。”

在他看来,缓解这种情况的最佳方法是拥有优秀的开源人工智能,使其成为标准。

扎克伯格认为,AI可能会在大多数方面超越人类,AGI是一个渐进的过程。

目前,Meta正在储备更多的AI弹药,计划今年底前向英伟达购买35万个H100 GPU芯片,从而使GPU总量达到约60万个。这意味着,Meta在这些芯片上的支出将达到100亿美元。

如何收回这些投入,对Meta来说同样是挑战。

除了将AI应用到自身社交产品,从而推动原有的核心业务广告业务增长外,扎克伯格还提到了开源模型的另一条赚钱路径。比如此前开源的Llama 2基本与所有主要的云公司都有交易,Llama2通过它们的云上托管提供服务,但Meta对使用它的公司也有限制。

“随着我们发布的模型越来越大,如果微软或亚马逊拿走并转售它且从中赚钱,那么我们应该从中获得一些收入。”扎克伯格说。

由于免费使用,开源往往被认为难以赚到钱。扎克伯格或许为开源提供了一种可能的赚钱方式,前提是开源的模型要足够强大。但对许多其它开源模型来说,它们还缺乏足够的议价能力。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-20 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

【产业互联网周报】马斯克发文反对美国禁止TikTok:将违背言论和表达自由;李彦宏再给开源大模型泼冷水,称大模型领域开源最贵;周鸿祎:说开源好不是针对李彦宏,开源和闭源没必要相互贬低
...时,我们预测2024将有更多公司需要定制化的AI模型。” 马斯克发文反对美国禁止TikTok:将违背言论和表达自由特斯拉CEO马斯克当地时间19日在社交媒体平台X发文称
2024-04-22 21:00:00
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚
2024-08-13 09:50:00
未发先售!华为又上架两款新机;马斯克嘲讽iPhone没新意|科技早报
...,这两台新机目前尚未正式公布发售价格。(腾讯数码)马斯克讽刺iPhone换代没新意,被网友回呛:特斯拉也一样 马斯克近日表示
2023-09-09 11:12:00
【科技早报】微软Office推出全新AI功能 Copliot;李彦宏称文心一言还不完美
...hatGPT人工智能4.网易LOFTER致歉:争议功能已于3月8日下线5.马斯克:OpenAI已经变成了营利组织【政策时讯】国家网信办
2023-03-17 10:00:00
《时代》评出100位AI领域最具影响力人物,李彦宏、李开复、曾毅在列
...壮志,该公司已经在开发自己的昆仑微处理器。 4.埃隆·马斯克(Elon Musk),xAI创始人众所周知,这位世界首富非常担心人工智能,害怕其可能毁灭人类。但与此同时,他也
2023-09-08 14:21:00
...ckman,谷歌 DeepMind 首席执行官兼联合创始人 Demis Hassabis,马斯克、吴恩达、黄仁勋等
2023-09-11 17:11:00
马斯克打脸OpenAI!全球最大模型Grok-1开源
本文经授权转载自钛媒体(ID:taimeiti)作者:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了
2024-03-20 13:44:00
周鸿祎一口气发布200多个数字人 “马斯克”“孙悟空”“诸葛亮”将把守大模型应用入口?
...360集团创始人周鸿祎现场创建了自己的数字分身,并与“马斯克”数字人对话。目前,360AI数字人拥有200多个角色,还支持定制,生成自己的专属数字人。在360智脑大模型内测版
2023-06-14 13:00:00
超30个国产大模型混战:华为百度阿里腾讯,谁能成为“中国的OpenAI”?
...辑 | 杨锦在高调呼吁暂停开发高级别人工智能后,近日,马斯克被爆出斥资数千万美元购买上万张GPU训练算力,并成立对标OpenAI的X
2023-04-18 13:00:00
更多关于科技的资讯:
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00
“小丰”又一次在走位中撞到了同伴。在杭州市滨江区大丰科创中心的实验室里,这个站在C位的人形机器人突然停顿——它的“大脑”
2025-12-09 08:19:00
浙江日报讯 (记者 应磊 通讯员 崔宁 洪映映) 外形酷似“机械战警”,行动稳健有力,即便遭遇人为干扰也“不动如山”。近日
2025-12-09 08:20:00
产业炬光灯聚焦新诺北斗:坚持自主创新 为船舶装上“智慧大脑”
厦门网讯(厦门日报记者 林露虹)茫茫大海上,船舶的行踪与航向,由船载北斗终端精准“掌舵”。位于火炬高新区的新诺北斗航科信息技术(厦门)股份有限公司(以下简称“新诺北斗”)
2025-12-09 08:57:00
厦门跨境电商出海加速 多家厦企亮相2025亚马逊全球开店跨境峰会
2025亚马逊全球开店跨境峰会。(主办方 供图)提供亚马逊出海服务的厦门企业AMZ123服务台前围满咨询的客商。(受访企业 供图) 厦门网讯 (厦门日报记者 沈彦彦 通讯员 周晓雅) “每年的亚马逊全球开店峰会
2025-12-09 08:57:00
长白时评评论员 久泰平“方向盘装饰贴”竟成“夺命杀器”!凌晨1点28分,一车辆在高架行驶时,主驾驶位空无一人,王某某竟在副驾驶酣睡
2025-12-09 11:09:00
根据工业和信息化部的数据,近年来我国互联网数据中心(IDC)产业规模年均增速达30%左右。然而,高速增长累积的高能耗问题也逐渐暴露
2025-12-09 14:21:00
第十一届全国大学生物理实验竞赛:西工大荣获三个“国赛一等奖”
近日,第十一届全国大学生物理实验竞赛(创新)决赛成绩公布,西北工业大学三支代表队进入决赛,均荣获国赛一等奖,获奖数量与质量位居全国高校前列
2025-12-09 14:29:00
西安建大学子创新研发“膜法湿法磷酸净化技术” 获全国特等奖
近日,西安建筑科技大学“膜达”环境与市政工程学院学生科创团队凭借自主研发的“膜法湿法磷酸净化技术”,在第十九届“挑战杯”全国大学生课外学术科技作品竞赛“揭榜挂帅”擂台赛中荣获特等奖
2025-12-09 14:30:00
重要提醒:杭州小红车租借有新变化!大家务必转知
2025年12月31日起,杭州小红车“绑卡租车”功能(即“绑卡免押金”服务)将正式停止服务,已开通“绑卡租车”功能的用户也将无法使用
2025-12-09 14:57:00
优路教育荣膺腾讯教育“2025年度职业教育领航品牌”
近日,2025腾讯新闻教育·新回响年会在北京圆满落幕。本届年会以“智变之时”为主题,汇聚了众多教育行业专家、学者及头部教育机构代表
2025-12-09 15:05:00
二元魂×金鹰卡通破界联动,AI+IP重构Z世代家庭陪伴新场景
2025年12月3日,AI潮玩创新品牌二元魂与湖南广播电视台旗下金鹰卡通卫视在长沙正式签署战略合作协议。双方将聚焦国民级亲子IP“麦咭”
2025-12-09 15:33:00