• 我的订阅
  • 科技

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

类别:科技 发布时间:2024-04-20 11:00:00 来源:搜狐科技
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

在开源闭源到底谁会落后的争议声中,Meta——这家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。

美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。

马斯克对此评价称“还不错”。Meta透露,未来几个月内还会推出Llama3更大参数版本的开源模型。

Meta CEO扎克伯格在最新采访中确认,4050亿参数模型仍在训练,预计今年晚些时候推出,并称Meta的目标是要超过所有人。这意味着,Meta与OpenAI的开源闭源之战才刚刚打响。

2.4万张GPU训练,碾压谷歌

此次发布的Llama3大模型,相较于上一代在编码、推理等性能上取得了显著进步。Meta公布的九项行业基准测试评测结果显示,Llama3-8B参数版本几乎全面碾压谷歌的Gemma和Mistral的70亿模型。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama3-70B参数版本则在7项评测中超过闭源的谷歌Gemini两个版本模型,以及Mistral和Claude 3中杯模型,在GPQA(测试模型回答通用问题表现)和MATH(评估模型解决高级数学问题能力)上不及谷歌目前最强大的大模型,但优于Claude 3中杯模型。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

此外,在Meta组织的人类反馈评分中,Llama 3-70B打败了GPT-3.5等多款模型。该测试包含1800个测试项,覆盖12个主要的应用场景,包括文摘总结、创意写作、角色扮演、逻辑推理、编程分类等,意在提升模型在现实应用场景下的表现。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama 3模型能力的提升,得益于模型架构、预训练数据的选择、预训练过程的扩展,以及对模型进行指令微调的打磨。

它采用15T token的数据训练,是Llama 2数据集的7倍多,代码数据量也增加了四倍。并在含有2.4万个英伟达GPU集群上训练,训练效率提高3倍。

Meta表示,Llama 3预训练数据集超过5%来自高质量的非英语数据,能更好满足各国用户、不同语言背景的使用需求。

此外,Llama 3在安全方面也有重大突破,开发了新版的信任和安全工具,相比Llama 2,进一步降低了误拒率,增强了模型的一致性。

Meta目前还在研发Llama 3超400B的参数模型,有望与GPT-4一较高下。

李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”

Llama 3很快将在亚马逊、谷歌、微软、英伟达等云厂商和大模型API提供商等平台推出。未来数月,Meta计划推出一系列具备全新功能的模型,包括多模态、支持多语言对话、扩展上下文窗口的长度,以及全面提升的综合性能。

基于Llama 3,Meta发布了AI助手 Meta AI。扎克伯格表示,MetaAI将成为人们可以免费使用的最智能的AI助手。

开源还是闭源?

Llama3的开源将进一步深刻影响着全球AI大模型的格局,不仅巩固了Meta在开源阵营当中的地位,同时也增强了开源模型与闭源模型竞争的力量。

越来越多的公司开始争夺全球最强开源模型。不久前,马斯克旗下的xAI开源全球规模最大的开源模型,参数高达3140亿。美国AI独角兽Databricks最近开源了参数1320亿的模型,当时号称是全球最强的开源大模型,但现在可能已被Llama3-70B模型夺走。

国内同样有越来越多的公司选择开源,包括阿里、360以及智谱AI、百川智能、零一万物等,并在参数规模上不断突破。早前不久,昆仑万维推出4000亿参数的“天工3.0”基座开源大模型,成为全球最大的开源MoE(混合专家)大模型。

不过,在最新的采访中,扎克伯格表示,Meta的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。他提到,今年晚些时候发布的Llama 3-400B将在许多基准测试中领先,并已经在考虑Llama 4和5。

英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。这意味着,Meta与OpenAI将在开源闭源模型上开启更大的竞争。

近日,开源和闭源引发不少争议。李彦宏认为,开源会越来越落后,闭源会持续领先,且闭源才有真正的商业模式。

随后,周鸿祎直言“网上有些名人胡说八道,大家别被忽悠,连说这话的公司自己都借助了开源的力量才成长到今天”。

他认为,开源社区聚集的工程师和科学家的数量是闭源的数百倍,所以一年(时间)就已经超过GPT-3.5,未来一两年内,开源很有可能会达到或超过闭源的水平。

扎克伯格同样强调了开源的重要性,认为它对社区和人类都有好处,可以推动AI广泛应用,是防范或解决AI垄断的重要方式。

“未来AI垄断可能会像人工智能的广泛应用一样危险,如果一个机构拥有的人工智能比其他机构的人工智能强大得多,那可能也很糟糕。”

在他看来,缓解这种情况的最佳方法是拥有优秀的开源人工智能,使其成为标准。

扎克伯格认为,AI可能会在大多数方面超越人类,AGI是一个渐进的过程。

目前,Meta正在储备更多的AI弹药,计划今年底前向英伟达购买35万个H100 GPU芯片,从而使GPU总量达到约60万个。这意味着,Meta在这些芯片上的支出将达到100亿美元。

如何收回这些投入,对Meta来说同样是挑战。

除了将AI应用到自身社交产品,从而推动原有的核心业务广告业务增长外,扎克伯格还提到了开源模型的另一条赚钱路径。比如此前开源的Llama 2基本与所有主要的云公司都有交易,Llama2通过它们的云上托管提供服务,但Meta对使用它的公司也有限制。

“随着我们发布的模型越来越大,如果微软或亚马逊拿走并转售它且从中赚钱,那么我们应该从中获得一些收入。”扎克伯格说。

由于免费使用,开源往往被认为难以赚到钱。扎克伯格或许为开源提供了一种可能的赚钱方式,前提是开源的模型要足够强大。但对许多其它开源模型来说,它们还缺乏足够的议价能力。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-20 11:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

【产业互联网周报】马斯克发文反对美国禁止TikTok:将违背言论和表达自由;李彦宏再给开源大模型泼冷水,称大模型领域开源最贵;周鸿祎:说开源好不是针对李彦宏,开源和闭源没必要相互贬低
...时,我们预测2024将有更多公司需要定制化的AI模型。” 马斯克发文反对美国禁止TikTok:将违背言论和表达自由特斯拉CEO马斯克当地时间19日在社交媒体平台X发文称
2024-04-22 21:00:00
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚
2024-08-13 09:50:00
未发先售!华为又上架两款新机;马斯克嘲讽iPhone没新意|科技早报
...,这两台新机目前尚未正式公布发售价格。(腾讯数码)马斯克讽刺iPhone换代没新意,被网友回呛:特斯拉也一样 马斯克近日表示
2023-09-09 11:12:00
【科技早报】微软Office推出全新AI功能 Copliot;李彦宏称文心一言还不完美
...hatGPT人工智能4.网易LOFTER致歉:争议功能已于3月8日下线5.马斯克:OpenAI已经变成了营利组织【政策时讯】国家网信办
2023-03-17 10:00:00
《时代》评出100位AI领域最具影响力人物,李彦宏、李开复、曾毅在列
...壮志,该公司已经在开发自己的昆仑微处理器。 4.埃隆·马斯克(Elon Musk),xAI创始人众所周知,这位世界首富非常担心人工智能,害怕其可能毁灭人类。但与此同时,他也
2023-09-08 14:21:00
...ckman,谷歌 DeepMind 首席执行官兼联合创始人 Demis Hassabis,马斯克、吴恩达、黄仁勋等
2023-09-11 17:11:00
马斯克打脸OpenAI!全球最大模型Grok-1开源
本文经授权转载自钛媒体(ID:taimeiti)作者:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了
2024-03-20 13:44:00
周鸿祎一口气发布200多个数字人 “马斯克”“孙悟空”“诸葛亮”将把守大模型应用入口?
...360集团创始人周鸿祎现场创建了自己的数字分身,并与“马斯克”数字人对话。目前,360AI数字人拥有200多个角色,还支持定制,生成自己的专属数字人。在360智脑大模型内测版
2023-06-14 13:00:00
超30个国产大模型混战:华为百度阿里腾讯,谁能成为“中国的OpenAI”?
...辑 | 杨锦在高调呼吁暂停开发高级别人工智能后,近日,马斯克被爆出斥资数千万美元购买上万张GPU训练算力,并成立对标OpenAI的X
2023-04-18 13:00:00
更多关于科技的资讯:
匠心护航丨济宁移动圆满完成2025嘉祥圣德山野音乐节通信保障
鲁网10月20日讯10月18-19日,“共赴山野之约,让旋律在自然间共鸣”群星演唱会在嘉祥九顶山激情开唱,华语乐坛知名歌手轮番登台
2025-10-20 12:17:00
移动的 “智算样板间” 亮相青岛,施耐德电气破解算力基建难题
10月17日,一场穿行14城、总里程近2万公里的技术巡展抵达青岛。施耐德电气关键电源巡卡车化身 “数据中心行业的技术样板间”
2025-10-20 12:45:00
彰显多维综合实力,Hape重装亮相2025中国玩具展
10月15至17日,由中国玩具和婴童用品协会(简称中国玩协)主办的第二十三届CTE中国玩具展&潮玩展、第十八届CLE中国授权展
2025-10-20 13:19:00
富士胶片91年传承,始终深耕影像领域,在不同时代适时推出符合当下需求的产品.。影像的发展从未离开过"光",近日FUJIKINA 2025富士胶片影像周以"光的交响曲"为题拉开序幕
2025-10-20 13:19:00
安踏儿童足弓PRO跑鞋获国际设计金奖 以科技守护青少年足弓健康
安踏儿童旗下产品“足弓PRO跑鞋”凭借对儿童足弓健康成长的深刻洞察与科学的产品设计,荣获2025年缪斯设计奖(MUSE Design Awards)金奖
2025-10-20 13:49:00
厦门网讯(厦门日报记者 李晓平)日前,厦门市工业和信息化局组织开展人工智能政策资金申报工作,“真金白银”推进今年我市出台的《厦门市进一步推动人工智能产业发展若干措施》(以下简称《若干措施》)落地见效
2025-10-20 08:56:00
报告:研学旅游市场分化趋势明显 监管滞后发展
10月18日,“2025首届旅行服务大会暨交易展——‘跨界协作•链动未来’研学新生态思享会”在海南三亚保利国际会展中心举行
2025-10-20 09:30:00
西乡街道企业人才训练营走进北科瑞声探寻AI声纹新未来
10月16日,由西乡街道党群服务中心主办的“AI赋能·智汇西乡”企业人才训练营系列活动之北科瑞声参访学习在新一代产业园顺利举行
2025-10-20 09:48:00
姬源在数字化浪潮席卷全球的今天,一个特殊的群体正在悄然形成,他们就是阿尔法一代(GenerationAlpha)。这一代人正值智能手机
2025-10-20 10:49:00
2025微博V影响力大会揭晓9组大V荣誉,“尽兴分享”推动社会价值沉淀
10月18日,2025微博V影响力大会在北京・微博IN跨次元引力场隆重举行。作为微博主办的年度重磅平台级活动,此次大会以“尽兴分享
2025-10-20 10:49:00
新闻纵深·聚焦2025中国国际数字经济博览会|人工智能赋能产业升级“下半场”
阅读提示数字浪潮,奔涌而至。10月17日至19日,2025中国国际数字经济博览会在石家庄举办。这场综合性数字经济大会,不仅搭建起国际数字经济交流合作的高端平台
2025-10-20 07:35:00
聚焦2025中国国际数字经济博览会|数字“加料”,生活可以这么“潮”
10月17日,观众和下棋机器人对弈。河北日报记者 史晟全摄数字让生活更美好。2025中国国际数字经济博览会上,众多数智技术闪亮登场
2025-10-20 07:37:00
河北日报讯(记者宋平)10月19日,2025京津冀AI赋能教育新生态大会在石家庄举办。来自政府、高校、科研机构与企业的与会嘉宾
2025-10-20 07:42:00
青春华章丨制造业“数智化”,“脑力”岗位需求旺
南航双选会上来了237家制造业单位制造业“数智化”,“脑力”岗位需求旺□南京日报/紫金山新闻记者姜静实习生黄佳琪杨久久400多家用人单位中
2025-10-20 07:43:00