• 我的订阅
  • 科技

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了

类别:科技 发布时间:2024-07-25 09:32:00 来源:机器之心Pro

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了

开源与闭源的纷争已久,现在或许已经达到了一个新的高潮。

说到开源大模型,Llama 系列自诞生以来就是典型代表,其优秀的性能与开源特点让人工智能技术的应用性和可访问性大大提升。任何研究人员和开发者都能够从中获益,让研究和应用变得更加广泛。

现在,Meta Llama 3.1 405B 正式发布。在官方博客中,Meta 表示:「直到今天,开源大语言模型在功能和性能方面大多落后于封闭模型。现在,我们正在迎来一个开源引领的新时代。」

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了

与此同时,Meta 创始人、CEO 扎克伯格亲自撰写长文阐述开源对所有开发者、对 Meta、对世界的意义。他表示,开源是 AI 积极发展的必要条件。以 Unix 和 Linux 的发展为例,开源 AI 将更有利于创新、数据保护和成本效益。

他还认为,开源 Llama 模型能够建立一个完整的生态系统,确保技术进步,并且不会因为竞争而失去优势。Meta 有着成功的开源历史,通过开源 AI 模型,扎克伯格希望促进全球技术的平等和安全应用。

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了

原文链接:https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

以下是原文内容:

扎克伯克为 Meta 注入开源基因

在高性能计算的早期,各大主流科技公司都投入大量资金开发各自的闭源 Unix 版本。当时很难想象会有其他方法能开发出如此先进的软件。

然而,开源的 Linux 逐渐流行起来:最初是因为它允许开发人员自由修改代码且价格更实惠,而后来它变得更先进、更安全,并且拥有比任何闭源 Unix 更广泛的生态系统,支持更多的功能。今天,Linux 已成为云计算和运行大多数移动设备的操作系统的行业标准基础, 大家都因其卓越的产品受益。

我相信人工智能的发展也与其发展轨迹类似。今天,一些科技公司正在开发领先的闭源模型,但开源正在迅速缩小差距。

去年,Llama 2 仅能与一代旧型号相媲美。而在今年,Llama 3 在某些领域已经可以与行业中领先的模型竞争甚至领先。明年开始,我们预计未来的 Llama 模型将成为行业中最先进的大模型。在此之前,Llama 也已经在开放性、可修改性和成本效益方面领先。

今天,我们正迈出下一步 —— 使开源 AI 成为行业标准。我们发布了首个前沿级开源 AI 模型 Llama 3.1 405B,以及改进版的 Llama 3.1 70B 和 8B 模型。较于闭源模型,这些开源模型在成本效益上显著提升,特别是 405B 模型的开源特性,使其成为微调和蒸馏小型模型的最佳选择。

除了发布这些模型,我们还与多家公司合作,拓展更广泛的生态系统。亚马逊、Databricks 和英伟达正在推出全套服务,支持开发者微调和蒸馏他们自己的模型。像 Groq 这样的创新者已经为所有新模型构建了低延迟、低成本的推理服务。

这些模型将在包括 AWS、Azure、Google、Oracle 等所有主要云平台上可用。Scale.AI、戴尔、德勤等公司已经准备好帮助企业采用 Llama 并使用他们自己的数据训练定制模型。随着社区的成长和更多公司开发新服务,我们可以共同使 Llama 成为行业标准,并将 AI 的益处带给每个人。

Meta 致力于开源 AI,以下是我认为开源是最佳开发平台的原因,为什么开源 Llama 对 Meta 有利,以及为什么开源 AI 对世界有益,并由此将长期存在。

开源 AI 之于开发者

当我与全球的开发者、CEO 和政府官员交谈时,通常听到几个主题:

我们需要训练、微调和蒸馏自己的模型。每个组织都有不同的需求,这些需求最好通过使用不同规模并使用特定数据训练或微调的模型来满足。设备上的任务和分类任务需要小型模型,而更复杂的任务则需要大型模型。现在,你可以使用最先进的 Llama 模型,继续用自己的数据训练它们,然后将它们蒸馏成最适合你需求的模型规模 —— 无需我们或任何其他人看到你的数据。 我们需要掌控自己的命运,而不是被闭源供应商「锁死」。许多组织不希望依赖他们无法自己运行和控制的模型。他们不希望闭源模型供应商能够更改模型、改变使用条款,甚至完全停止服务。他们也不希望被锁定在拥有模型专有权的单一云平台上。开源使得兼容工具链的广泛生态系统成为可能,你可以轻松地在这些工具之间切换。 我们需要保护我们的数据。许多组织处理需要保护的敏感数据,无法通过云 API 发送到闭源模型。一些组织则根本不信任闭源模型供应商对其数据的处理。开源解决了这些问题,因为它使你可以在任何你想要的地方运行模型。众所周知,开源软件会因为开发过程更加透明,而更安全。 我们需要一个高效且经济的模型。开发者可以在自己的基础设施上运行 Llama 3.1 405B,进行推理,成本大约是使用闭源模型(如 GPT-4)的 50%,适用于用户端和离线推理任务。 我们希望投资于将成为长期标准的生态系统。许多人看到开源的发展速度快于封闭模型,他们希望在能够长期提供最大优势的架构上构建自己的系统。

开源 AI 之于 Meta

Meta 的商业模式是为人们构建最佳体验和服务。为了实现这一目标,我们必须确保始终能够获取最佳技术,而不是被锁定在竞争对手的封闭生态系统中,这样他们就不能限制我们所开发的内容。

我想分享一个重要经历:虽然苹果公司允许我们在其平台上构建内容,但是当我们构建服务时仍受到了限制。无论是他们对开发者的税收、他们施加的任意规则,还是他们阻止的所有产品创新,显而易见,如果我们能够构建产品的最佳版本,并且竞争对手无法限制我们构建的内容,Meta 和许多其他公司将能够为人们提供更好的服务。从哲学层面上讲,这也是我如此坚信在 AI 和 AR/VR 领域为下一代计算机建立开放生态系统的一个重要原因。

人们常常问我是否担心因为开源 Llama 而失去技术优势,但我认为这忽略了大局,原因有以下几点:

首先,为了确保我们能够长期保持技术领先,并且不被锁定在闭源生态系统中,Llama 需要发展成一个完整的生态系统,包括工具、效率改进、硬件优化和其他集成。如果只有我们公司使用 Llama,这个生态系统将不会发展,我们的境况也不会比 Unix 的闭源变种好多少。

其次,我预计 AI 开发将继续保持高度竞争,这意味着在任何给定时刻,开源某个模型不会使我们在与下一个最佳模型的竞争中失去巨大优势。Llama 成为行业标准的途径是通过一代又一代地保持竞争力、高效性和开放性。

第三,Meta 与闭源模型提供商的一个关键区别在于,销售 AI 模型的访问权限并不是我们的商业模式。这意味着公开发布 Llama 不会削弱我们的收入、可持续性或投资研究的能力,而闭源提供商则会受到影响。(这也是为什么一些闭源提供商一直在游说公共管理者反对开源的原因之一。)

最后,Meta 在开源项目上有着丰富的成功经验。通过与开放计算项目分享我们的服务器、网络和数据中心设计,并使供应链标准化,我们节省了数十亿美元。通过开源 PyTorch、React 等领先工具,我们从生态系统的创新中受益匪浅。这种方法长期以来一直极具效果。

开源 AI 之于世界

我相信开源对于 AI 的未来是有必要的。AI 比任何其他现代技术都更有潜力提高人类的生产力、创造力和生活质量,并且能够在加速经济增长的同时推动医学和科学研究的进步。开源将确保全球更多的人能够从 AI 的发展中获得利益和机会,权力不会集中在少数几家公司手中,并且技术能够更均匀和安全地在社会中部署。

关于开源 AI 模型的安全性,存在着持续的争论。我的观点是,开源 AI 将比替代方案更安全。我认为各国政府最终会得出支持开源的结论,因为这将使世界更加繁荣和安全。

在我理解的安全性框架中,我们需要防范两类危害:无意和故意。

无意的危害是指 AI 系统可能在运行时非故意地造成伤害。例如,现代 AI 模型可能在无意中给出错误的健康建议。或者,在未来场景中,有人担心模型可能会无意中自我复制或过度优化目标,从而对人类造成损害。 故意的危害是指不良行为者使用 AI 模型以造成伤害为目的。

值得注意的是,无意的危害涵盖了人们对 AI 的多数担忧 —— 从 AI 系统对数十亿用户的影响到大多数真正灾难性的科幻场景。在这方面,开源所带来的安全性更加显著,因为系统更透明,可以被广泛审查。

历史上,开源软件由于这一原因一直更安全。同样,使用 Llama 及其安全系统如 Llama Guard,可能会比闭源模型更安全和更可靠。因此,大多数关于开源 AI 安全性的讨论集中在故意的危害上。

我们的安全流程包括严格的测试和红队评估,以检验我们的模型是否有可能造成实质性伤害,此目标是在发布前减轻风险。由于这些模型是开源的,任何人都可以自行进行测试。我们必须牢记,这些模型是通过互联网上已有的信息训练的,所以在考虑危害时,起点应该是模型是否能比从 Google 或其他搜索结果快速获取的信息造成更多的危害。

通过区分个体或小规模行为者与拥有大量资源的大规模行为者(如国家)所能做的事情,将会有益于推理故意伤害。

在未来的某个时候,个别恶意行为者可能会利用 AI 模型的智能,从互联网上现有的信息中制造出新型危害。在这一点上,力量的均衡对 AI 安全至关重要。

我认为生活在一个 AI 广泛部署的世界中会更好,因为这样可以使大型行为者制衡小型恶意行为者。这也是我们在社交网络上管理安全的方式,凭借更强大的 AI 系统识别并阻止那些经常使用小规模 AI 系统的不太复杂的行为者。

更广泛地说,大型机构在大规模部署 AI 时将促进社会的安全和稳定。只要每个人都能访问类似代际的模型,那么拥有更多算力资源的政府和机构将能够制衡拥有较少计算资源的恶意行为者。

在考虑未来的机遇时,请记住,今天的大多数领先科技公司和科学研究都是建立在开源软件之上的。如果我们共同投资于开源 AI,下一代公司和研究就会获得使用的机会。这包括刚刚起步的初创企业,以及那些可能没有资源从头开发 SOTA AI 的大学和国家的人们。

总而言之,开源 AI 代表了在全球范围内我们可以利用这项技术为所有人创造最大的经济机会和安全保障。

合作行稳,开源致远

在过去的 Llama 模型中,Meta 为自身开发发布了这些模型,但并未重点关注建立更广泛的生态系统。这次发布,我们采取了不同的方式。我们正在内部组建团队,使尽可能多的开发者和合作伙伴能够使用 Llama,并且积极建立合作伙伴关系,以便生态系统中的更多公司能够为他们的客户提供独特的功能。

我相信 Llama 3.1 的发布将成为行业的一个转折点,大多数开发者将开始使用开源技术,我预计这种方式将会以我们的开源为起点。

我希望我们可以共同努力将 AI 的益处带给全世界。

你现在可以在 llama.meta.com 上访问这些模型。

马克·扎克伯格

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-25 12:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

黄仁勋对话扎克伯格:下一波AI浪潮是机器人,开源大模型将赢得胜利?
...伦·古德、元宇宙公司Meta创始人兼首席执行官马克·扎克伯格坐在一起,进行了两场炉边谈话,畅想生成式人工智能的发展未来。对话上半场,黄仁勋和扎克伯格围绕生成式AI、开源技术等
2024-07-31 13:51:00
黄仁勋对话扎克伯格:新款芯片样品本周发送,AI行业还有5年产品创新期
英伟达CEO黄仁勋和Meta的CEO马克·扎克伯格罕见同台“商业互吹”。当地时间7月29日,在美国丹佛举行的第50届SIGGRAPH图形大会上,黄仁勋和扎克伯格进行了首次公开的炉
2024-07-30 11:08:00
黄仁勋对话扎克伯格:下一代计算平台是智能眼镜和VR/MR头显结合!还互送夹克
黄仁勋与扎克伯格凤凰网科技讯 北京时间7月30日,美国当地时间周一晚间,在丹佛举行的SIGGRAPH 2024计算机图形大会上
2024-07-31 13:52:00
黄仁勋对话扎克伯格!小扎“提到闭源就生气”,黄仁勋预测下一波AI浪潮
... 2024计算机图形大会上,英伟达CEO黄仁勋与Meta创始人扎克伯格同台对话。两家科技巨头的掌舵者罕见联合公开露面,着实引人瞩目。带着小金链子、留长卷发的小扎和“万年不变”
2024-07-30 14:10:00
扎克伯格这一举动,将让中国90%大模型公司快速死亡
...大战”。然而,造轮子这条赛道,在昨天大概率将被扎克伯格的Meta发布的Llama 2给终结掉。一、Meta放大招Llama 2
2023-07-21 15:26:00
差一步称霸 AI:历史进程中的扎克伯格
2016 年 1 月,Facebook 的创始人扎克伯格在自家平台上公布了一则重磅新闻:Facebook 秘密研发的围棋AI机器人即将取得突破
2023-06-25 23:00:00
裁员一万转身拥抱AI,Meta又要改名了
...再裁员一万名员工等等。陷入泥沼之时,Meta掌舵人扎克伯格不得不考虑新的增长点。在给员工的信中,扎克伯格表示构建元宇宙仍然是定义社交未来的核心,但这并不是Meta将投入大部分
2023-04-17 14:27:00
力挺开源!扎克伯格抨击闭源AI竞争对手正试图“创造上帝”
Meta首席执行官扎克伯格在周四的一场最新访谈活动中,谈到了他对人工智能未来的看法。扎克伯格深信人工智能最终不会“只有一个”,他强调了开源的价值——即把人工智能工具交到更多人手中
2024-06-28 19:09:00
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...月内还会推出Llama3更大参数版本的开源模型。Meta CEO扎克伯格在最新采访中确认,4050亿参数模型仍在训练
2024-04-20 11:00:00
更多关于科技的资讯:
你养“龙虾”了吗?这几天,以红色龙虾为标识的AI智能体OpenClaw火爆全网。用户将其安装在个人终端上进行训练开发,网友们形象地称之为“养龙虾”
2026-03-20 10:15:00
温州大学打破“围墙”,为校地协同聚合力
一个小小的笔尖滚珠,曾被称为“圆珠笔之殇”。随着中国科技日新月异,曾一度被视作中国制造“痛点”的笔尖滚珠早已被突破,如今笔头整体材料也被攻克
2026-03-20 10:17:00
近日,富德生命人寿续期收展团队帮助一位因工作繁忙险些失去保障的客户完成续保缴费确认,赢得了客户的赞誉,并在此基础上实现了业务拓展
2026-03-20 10:27:00
安平丝网产业集群实现全链共享1.6万余家丝网企业抱团闯市场3月15日,安平县河北丝筘金属制品有限公司(以下简称“丝筘公司”)
2026-03-20 08:16:00
河北八项重点工程推进产业集群数智化转型指导107个重点产业集群共享工厂全部建成智能工厂河北新闻网讯(河北日报记者米彦泽)近日
2026-03-20 08:03:00
打开雄安的九种方式(五)|“雄安之眼”里的城市智慧
“雄安之眼”里的城市智慧——打开雄安的九种方式(五)3月16日,雄安城市计算中心,工作人员正在巡检。河北日报记者 刘光昱摄3月10日晚8时许
2026-03-20 08:07:00
春节刚过,政府和企业就迅速进入“开跑”状态,各类交流活动密集展开,掀起了一股“春季攻势”。3月17日至18日,在中国贸促会的组织下
2026-03-20 07:13:00
手机涨价的消息终于落地成为现实,“早知道上个月就买了!”在城西一家互联网公司上班的林浩后悔不迭。他看中的那款手机,此前还卖2299元
2026-03-20 07:13:00
3月18日,中国国际化妆品、个人及家庭护理用品原料展览会(PCHi 2026)在杭州大会展中心开幕。作为本年度全球个护家清原料领域首场重磅产业盛会
2026-03-20 07:13:00
全域共进、多点开花 杭州持续刷新消费“极值”
从“全国销售第一柜”,到全城涌动的首店潮;从单柜业绩领跑,到商圈能级跃升;从市场自发增长,到政策系统赋能——湖滨路步行街人流如织
2026-03-20 07:43:00
江南时报讯 在金融科技浪潮奔涌向前的当下,数字经济正成为推动高质量发展的重要引擎。常熟农商银行加速推进数字金融战略布局
2026-03-19 23:25:00
江南时报讯 2025年,江阴农商银行将数字人民币推广列为全行年度重点工作,在场景拓展、产品创新及跨境应用等方面实现一系列突破性进展
2026-03-19 23:27:00
■侯豆豆摘要:在智能制造背景下,生产成本的精确预测已成为企业维持竞争优势的核心支撑。传统成本预测方法往往依赖历史财务数据
2026-03-20 04:55:00
贵阳贵安:一场关于标注的数字“狂飙”
当人工智能的浪潮席卷全球,“数据标注”这一曾被视为“幕后配角”的产业,正以惊人的速度成长为数字经济的新蓝海。在贵阳贵安
2026-03-19 21:12:00
中新经纬3月19日电 据工业和信息化部网络安全威胁和漏洞信息共享平台公众号消息,近日,工业和信息化部网络安全威胁和漏洞信息共享平台(NVDB)监测发现
2026-03-19 21:50:00