• 我的订阅
  • 科技

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

类别:科技 发布时间:2024-04-20 11:00:00 来源:搜狐科技
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

在开源闭源到底谁会落后的争议声中,Meta——这家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。

美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。

马斯克对此评价称“还不错”。Meta透露,未来几个月内还会推出Llama3更大参数版本的开源模型。

Meta CEO扎克伯格在最新采访中确认,4050亿参数模型仍在训练,预计今年晚些时候推出,并称Meta的目标是要超过所有人。这意味着,Meta与OpenAI的开源闭源之战才刚刚打响。

2.4万张GPU训练,碾压谷歌

此次发布的Llama3大模型,相较于上一代在编码、推理等性能上取得了显著进步。Meta公布的九项行业基准测试评测结果显示,Llama3-8B参数版本几乎全面碾压谷歌的Gemma和Mistral的70亿模型。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama3-70B参数版本则在7项评测中超过闭源的谷歌Gemini两个版本模型,以及Mistral和Claude 3中杯模型,在GPQA(测试模型回答通用问题表现)和MATH(评估模型解决高级数学问题能力)上不及谷歌目前最强大的大模型,但优于Claude 3中杯模型。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

此外,在Meta组织的人类反馈评分中,Llama 3-70B打败了GPT-3.5等多款模型。该测试包含1800个测试项,覆盖12个主要的应用场景,包括文摘总结、创意写作、角色扮演、逻辑推理、编程分类等,意在提升模型在现实应用场景下的表现。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama 3模型能力的提升,得益于模型架构、预训练数据的选择、预训练过程的扩展,以及对模型进行指令微调的打磨。

它采用15T token的数据训练,是Llama 2数据集的7倍多,代码数据量也增加了四倍。并在含有2.4万个英伟达GPU集群上训练,训练效率提高3倍。

Meta表示,Llama 3预训练数据集超过5%来自高质量的非英语数据,能更好满足各国用户、不同语言背景的使用需求。

此外,Llama 3在安全方面也有重大突破,开发了新版的信任和安全工具,相比Llama 2,进一步降低了误拒率,增强了模型的一致性。

Meta目前还在研发Llama 3超400B的参数模型,有望与GPT-4一较高下。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama 3很快将在亚马逊、谷歌、微软、英伟达等云厂商和大模型API提供商等平台推出。未来数月,Meta计划推出一系列具备全新功能的模型,包括多模态、支持多语言对话、扩展上下文窗口的长度,以及全面提升的综合性能。

基于Llama 3,Meta发布了AI助手 Meta AI。扎克伯格表示,MetaAI将成为人们可以免费使用的最智能的AI助手。

开源还是闭源?

Llama3的开源将进一步深刻影响着全球AI大模型的格局,不仅巩固了Meta在开源阵营当中的地位,同时也增强了开源模型与闭源模型竞争的力量。

越来越多的公司开始争夺全球最强开源模型。不久前,马斯克旗下的xAI开源全球规模最大的开源模型,参数高达3140亿。美国AI独角兽Databricks最近开源了参数1320亿的模型,当时号称是全球最强的开源大模型,但现在可能已被Llama3-70B模型夺走。

国内同样有越来越多的公司选择开源,包括阿里、360以及智谱AI、百川智能、零一万物等,并在参数规模上不断突破。早前不久,昆仑万维推出4000亿参数的“天工3.0”基座开源大模型,成为全球最大的开源MoE(混合专家)大模型。

不过,在最新的采访中,扎克伯格表示,Meta的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。他提到,今年晚些时候发布的Llama 3-400B将在许多基准测试中领先,并已经在考虑Llama 4和5。

英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。

近日,开源和闭源引发不少争议。李彦宏认为,开源会越来越落后,闭源会持续领先,且闭源才有真正的商业模式。

随后,周鸿祎直言“网上有些名人胡说八道,大家别被忽悠,连说这话的公司自己都借助了开源的力量才成长到今天”。

他认为,开源社区聚集的工程师和科学家的数量是闭源的数百倍,所以一年(时间)就已经超过GPT-3.5,未来一两年内,开源很有可能会达到或超过闭源的水平。

扎克伯格同样强调了开源的重要性,认为它对社区和人类都有好处,可以推动AI广泛应用,是防范或解决AI垄断的重要方式。

“未来AI垄断可能会像人工智能的广泛应用一样危险,如果一个机构拥有的人工智能比其他机构的人工智能强大得多,那可能也很糟糕。”

在他看来,缓解这种情况的最佳方法是拥有优秀的开源人工智能,使其成为标准。

扎克伯格认为,AI可能会在大多数方面超越人类,AGI是一个渐进的过程。

目前,Meta正在储备更多的AI弹药,计划今年底前向英伟达购买35万个H100 GPU芯片,从而使GPU总量达到约60万个。这意味着,Meta在这些芯片上的支出将达到100亿美元。

如何收回这些投入,对Meta来说同样是挑战。

除了将AI应用到自身社交产品,从而推动原有的核心业务广告业务增长外,扎克伯格还提到了开源模型的另一条赚钱路径。比如此前开源的Llama 2基本与所有主要的云公司都有交易,Llama2通过它们的云上托管提供服务,但Meta对使用它的公司也有限制。

“随着我们发布的模型越来越大,如果微软或亚马逊拿走并转售它且从中赚钱,那么我们应该从中获得一些收入。”扎克伯格说。

由于免费使用,开源往往被认为难以赚到钱。扎克伯格或许为开源提供了一种可能的赚钱方式,前提是开源的模型要足够强大。但对许多其它开源模型来说,它们还缺乏足够的议价能力。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-20 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

【产业互联网周报】马斯克发文反对美国禁止TikTok:将违背言论和表达自由;李彦宏再给开源大模型泼冷水,称大模型领域开源最贵;周鸿祎:说开源好不是针对李彦宏,开源和闭源没必要相互贬低
...时,我们预测2024将有更多公司需要定制化的AI模型。” 马斯克发文反对美国禁止TikTok:将违背言论和表达自由特斯拉CEO马斯克当地时间19日在社交媒体平台X发文称
2024-04-22 21:00:00
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚
2024-08-13 09:50:00
未发先售!华为又上架两款新机;马斯克嘲讽iPhone没新意|科技早报
...,这两台新机目前尚未正式公布发售价格。(腾讯数码)马斯克讽刺iPhone换代没新意,被网友回呛:特斯拉也一样 马斯克近日表示
2023-09-09 11:12:00
【科技早报】微软Office推出全新AI功能 Copliot;李彦宏称文心一言还不完美
...hatGPT人工智能4.网易LOFTER致歉:争议功能已于3月8日下线5.马斯克:OpenAI已经变成了营利组织【政策时讯】国家网信办
2023-03-17 10:00:00
《时代》评出100位AI领域最具影响力人物,李彦宏、李开复、曾毅在列
...壮志,该公司已经在开发自己的昆仑微处理器。 4.埃隆·马斯克(Elon Musk),xAI创始人众所周知,这位世界首富非常担心人工智能,害怕其可能毁灭人类。但与此同时,他也
2023-09-08 14:21:00
...ckman,谷歌 DeepMind 首席执行官兼联合创始人 Demis Hassabis,马斯克、吴恩达、黄仁勋等
2023-09-11 17:11:00
马斯克打脸OpenAI!全球最大模型Grok-1开源
本文经授权转载自钛媒体(ID:taimeiti)作者:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了
2024-03-20 13:44:00
周鸿祎一口气发布200多个数字人 “马斯克”“孙悟空”“诸葛亮”将把守大模型应用入口?
...360集团创始人周鸿祎现场创建了自己的数字分身,并与“马斯克”数字人对话。目前,360AI数字人拥有200多个角色,还支持定制,生成自己的专属数字人。在360智脑大模型内测版
2023-06-14 13:00:00
超30个国产大模型混战:华为百度阿里腾讯,谁能成为“中国的OpenAI”?
...辑 | 杨锦在高调呼吁暂停开发高级别人工智能后,近日,马斯克被爆出斥资数千万美元购买上万张GPU训练算力,并成立对标OpenAI的X
2023-04-18 13:00:00
更多关于科技的资讯:
全程支持极客营创新 拟上市的嘉立创助力18项硬件原型完成开发
2025年8月上旬,一场为期5天的硬件创意盛会——2025极客营(首场硬件黑客松)在深圳科创学院成功举办。来自美国、英国
2025-09-04 08:34:00
原钻产量同比降11%+GIA分级升级 天然钻石稀缺性支撑价格体系
2025年上半年,全球钻石市场呈现显著结构性分化。在整体价格下行压力下,大克拉异形钻凭借独特稀缺性展现强劲韧性。6月拉斯维加斯JCK珠宝展高端展区人流如织
2025-09-04 08:39:00
浪潮通信信息亮相2025年南亚东南亚数字合作大会
近日,2025南亚东南亚数字合作大会在泰国召开。本次大会由云南省人民政府和泰国数字经济与社会部联合主办,以“促进区域数字合作
2025-09-04 10:01:00
浪潮通信信息亮相2025算网融合产业发展大会,数据中心产品荣获优秀案例
近日,以“开放、创新、融合、共赢”为主题的2025算网融合产业发展大会在北京召开。会上,浪潮通信信息申报的“浪潮预制模块化数据中心产品”
2025-09-04 10:02:00
中新经纬9月4日电 据路透社报道,法国数据保护机构周三表示,已对Alphabet旗下的Google(谷歌)处以3.25亿欧元(3
2025-09-04 10:04:00
河北新闻网讯(邓学军)近日,中国贸促会正式发布《中国好礼产业促进计划2025—2026年度推荐企业及产品名录》,承德避暑山庄旅游集团有限责任公司精心选送的“朕在凉快”折扇
2025-09-04 10:05:00
国产GEO工具破局者 小陌引擎在济南书写AI创新传奇
近日,在生成式AI重塑全球数字竞争格局的浪潮中,来自济南高新区齐鲁软件园的济南矩阵跃动智能有限公司,凭借自主研发的国内首个攻克大模型搜索优化难题的“小陌GEO对抗引擎”
2025-09-04 10:13:00
集萃智造产业化基地项目开工,开启规模化量产新篇章未来三年力争实现年产近万台智能机器人南报网讯(通讯员芦玲玲记者徐宁)记者昨天从江苏集萃智能制造技术研究所有限公司(以下简称“集萃智造”)获悉
2025-09-04 07:40:00
山东移动日照分公司携手山东鲜醇乳业打造5G智能工厂 全流程赋能乳业生产新标杆
鲁网9月3日讯在数字化浪潮推动传统产业转型升级的背景下,山东移动日照分公司助力山东鲜醇乳业有限公司成功入选《2025年5G工厂名录》
2025-09-03 17:12:00
当晚期肺癌患者仅需支付最低207元、最高千余元的保费,即可通过“穗新保”全额报销高达30万元的质子治疗费用,重燃高质量生活希望时
2025-09-03 17:13:00
山东移动日照分公司:数智转型,打造高端板材涂镀产业新标杆
鲁网9月3日讯日照市昱岚新材料有限公司招商引资项目总投资达 63 亿元,目标打造全国最具竞争力的马口铁生产基地。项目分三期建设
2025-09-03 17:14:00
短视频平台丰富了公众的日常生活,提供了公众所需的各类信息,近年来,越来越多的人通过短视频平台向公众传播医学知识,但这些内容并非全部真实可信
2025-09-03 21:24:00
夏末秋初求职盛宴,山东省人力资源市场喊你来“挑”工作啦!
金九银十求职季,山东省人力资源市场为广大求职者准备了一系列精彩纷呈的招聘活动,无论是刚踏出校园的应届生,还是寻求职业转型的职场人
2025-09-03 18:51:00
吉哒哒生炸鸡架盛唐荟店开业,凭差异化优势领跑行业
近日,炸鸡品类新势力——济南星瀚途旗下吉哒哒生炸鸡架盛唐荟店正式开业,持续引发市场关注。开业当日,现场食客络绎不绝,人气火爆
2025-09-03 18:57:00
豪米客鲜烤牛肉拌饭以特色引领韩式餐饮新潮流
当下餐饮行业竞争日趋白热化,同质化严重的赛道已难见增长红利,而那些能精准捕捉消费需求、构建独特记忆点的特色品类,正凭借差异化优势突围而出
2025-09-03 18:59:00