• 我的订阅
  • 科技

开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布

类别:科技 发布时间:2024-07-23 17:11:00 来源:华尔街见闻

千呼万唤始出来,原定于23日发布的Llama 3 405B就要来了。

作为Llama 3系列中的顶配,405B版本拥有4050亿个参数,是迄今为止最大的开源模型之一。

昨夜凌晨,META突发Llama 3.1-405B评测数据的泄漏事件,有网友预计可能还会同时发布一个Llama 3.1-70B版本,因为“(模型提前泄露)是META的老传统了,去年的Llama模型就干过一次。”

有分析认为,Llama 3 405B不仅仅是人工智能能力的又一次提升,对于开源AI 来说,“这是一个潜在的ChatGPT时刻”,其中最先进的人工智能真正实现民主化并直接交到开发人员手中。

对即将到来的 Llama 3 405B 公告的三个预测

有分析人士从数据质量、模型生态系统、API解决方案三个角度,预测了即将到来的Llama 3405B公告中的亮点。

首先,Llama 3 405B或许会彻底改变专用模型的数据质量。

对于专注于构建专业AI模型的开发人员来说,他们面临的长期挑战是获取高质量的训练数据。较小的专家模型(1-10B 个参数)通常利用蒸馏技术,利用较大模型的输出来增强其训练数据集。然而,使用来自OpenAI等闭源巨头的此类数据受到严格限制,限制了商业应用。

Llama 3 405B应运而生。作为一款与专有模型实力相媲美的开源巨头,它为开发人员创建丰富、不受限制的数据集提供了新的基础。这意味着开发人员可以自由使用Llama 3 405B的蒸馏输出来训练小众模型,从而大大加快专业领域的创新和部署周期。预计高性能、经过微调的模型的开发将激增,这些模型既强大又符合开源道德规范。

其次,Llama 3 405B将形成新的模型生态系统:从基础模型到专家组合

Llama 3 405B的推出可能会重新定义AI系统的架构。该模型的庞大规模(4050 亿个参数)可能意味着一种一刀切的解决方案,但真正的力量在于它与分层模型系统的集成。这种方法对于使用不同规模AI的开发人员来说尤其具有共鸣。

预计会转向更具动态的模型生态系统,其中Llama 3 405B充当骨干,由小型和中型模型提供支持。这些系统可能会采用推测解码等技术,其中不太复杂的模型处理大部分处理,仅在必要时调用405B模型进行验证和纠错。这不仅可以最大限度地提高效率,而且还为优化实时应用程序中的计算资源和响应时间开辟了新途径,尤其是在针对这些任务优化的SambaNova RDU上运行时。

最后,Llama 3 405B有最高效 API 的竞争

能力越大,责任越大——对于Llama 3 405B而言,部署是一项重大挑战。开发人员和组织需要谨慎应对模型的复杂性和运营需求。AI云提供商之间将展开竞争,以提供部署Llama 3 405B最高效、最具成本效益的API解决方案。

这种情况为开发人员提供了一个独特的机会,可以与不同的平台互动,比较各种API如何处理如此庞大的模型。这个领域的赢家将是那些能够提供API的人,这些API不仅可以有效地管理计算负载,而且不会牺牲模型的准确性或不成比例地增加碳足迹。

总之,Llama 3 405B不仅仅是AI武器库中的又一个工具;更是向着开放、可扩展和高效的 AI 开发的根本转变。分析认为,无论是在微调小众模型、构建复杂的AI系统还是优化部署策略,Llama 3 405B的到来都将为用户打开新的视野。

网友们怎么看?

网友在LocalLLaMA子Reddit板块中发帖,分享了4050亿参数的Meta Llama 3.1信息,从该AI模型在几个关键AI基准测试的结果来看,其性能超越目前的领先者,即OpenAI的GPT-4o,这标志着开源模型可能首次击败目前最先进的闭源LLM模型。

开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布

如基准测试所示,Meta Llama 3.1在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem和 winograd等多项测试中均优于 GPT-4o,但是,它在 HumanEval和 MMLU-social sciences方面却落后于 GPT-4o。

开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布

宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克(Ethan Mollick)写道:

如果这些统计数据属实,那么可以说顶级 Al 模型将在本周开始免费向所有人开放。

全球每个国家的政府、组织和公司都可以像其他人一样使用相同的人工智能功能。这会很有趣。

开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布

有网友总结了Llama 3.1模型的几个亮点:

模型使用了公开来源的15T+tokens进行训练,预训练数据截止日期为2023年12月;

微调数据包括公开可用的指令微调数据集(与Llama 3不同)和1500万个合成样本;

模型支持多语言,包括英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。

开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布

有网友表示,这是首次开源模型超越了GPT4o和Claude Sonnet 3.5等闭源模型,在多个benchmark上达到SOTA。

本文来自,关注更多AI前沿资讯请

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-23 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

具身智能竞速时刻,百度百舸提供全栈加速方案
...晰。每一家企业都面临着同样的核心命题:如何将前沿的模型能力,转化为在真实世界各类场景中可规模化应用落地的机器人产品?这背后,是研发团队对模型迭代速度的极致追求。企业亟需突破算
2025-08-13 17:25:00
...收割1亿月活用户。随后,百川智能、光年之外等中国大模型创企批量成立,国外Anthropic、Runway、LangChain等拿下知名风投巨额投资
2023-08-04 11:57:00
阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...人工智能对产业、工作、生活等方面带来的积极变化。大模型的落地应用、社区生态以及开源成为本次大会的热点话题。国内大模型“六小虎”中最为低调的上海阶跃星辰智能科技有限公司(以下简
2025-02-22 16:36:00
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考,以及背后的开发故事。OpenAI o1团队采访的完整版视频
2024-09-23 09:50:00
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能
2024-07-31 09:37:00
中新社北京3月25日电 (记者 夏宾)今年以来,中国大模型开源的消息一个接一个。阿里云通义千问从除夕夜开源全新的视觉模型Qwen2
2025-03-25 22:32:00
定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了
...I超级计算机——Project Digits。有多强悍? 2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑
2025-01-07 14:17:00
制造业AI也迎来大模型时刻? | 智造观察
...片来源@视觉中国在通用领域,以ChatGPT为代表的预训练大模型,正在被大众所熟知。业内也在频繁示意:大模型在企业级或更多行业细分场景中,能不能短时间内带来巨大的生产力改变。
2023-04-20 20:00:00
重磅首发!亚信科技发布“渊思”行业大模型,“全栈AI”赋能行业转型
...科技(股票代码:01675.HK)在京隆重举办“渊思”行业大模型产品发布会,正式揭晓1个通用人工智能与认知增强平台TAC MaaS
2024-05-17 14:25:00
更多关于科技的资讯:
王座赛事杭州站圆满落幕 台球产业生态链迎来升级热潮
9月6日,为期四天的王座赛事第一站在杭州希尔顿酒店圆满落幕,这项集竞技、产品、文化于一体的台球盛宴,不仅为观众呈现了精彩赛事
2025-09-08 13:37:00
强生眼力健与光正眼科举行合作集团揭牌仪式,共创“价值医疗”新范式
重塑白内障患者诊疗流程,推动精准屈光诊疗方案惠及患者【2025年9月5日,杭州】在中华医学会第二十九次眼科学术大会(CCOS2025)这一行业盛会上
2025-09-08 13:39:00
强生眼力健携手何氏眼科,共筑中国眼健康创新生态
以“医教研”一体化,加速全球前沿技术转化【2025年9月6日,杭州】为加速共筑中国眼健康创新生态,强生旗下的眼健康业务强生眼力健
2025-09-08 13:39:00
以“数字中台+智贸生态”赋能广州万亿级市场 数字化转型升级
2025年广州(秋季)白云里国际美妆节白云电商高峰论坛于9月5日在白云里国际美妆中心成功召开。本次论坛汇聚了广州市白云区电子商务行业协会会长朱东炫
2025-09-08 13:39:00
印象草原:一场关于“自我设计”的时尚革命蓄势登场
当服装跳出市场同质化“单品”的定义,成为承载个性的专属“战袍”,一场关于“自我设计”的时尚革命正蓄势登场。2025年9月9日
2025-09-08 13:39:00
强生眼力健与香港希玛眼科携手共建创新技术合作集团,引领屈光白内障及老视诊疗新篇章
【2025年9月6日,杭州】 近日,在中华医学会第二十九次眼科学术大会(CCOS2025)期间,强生眼力健与香港希玛医疗集团(以下简称“希玛医疗”
2025-09-08 13:40:00
强生眼力健携手爱尔眼科,共筑精准屈光诊疗全国标准化体系
以技术驱动,定义高品质眼科服务规模化落地新范本【2025年9月5日,杭州】在中华医学会第二十九次眼科学术大会(CCOS2025)期间
2025-09-08 13:41:00
首个电商蟹卡兑换系统上线:五年投入两千万元研发 无法履约最高赔10万元
蟹卡标注着长期有效,兑换时商家却玩起了失联。每逢中秋节前,不少消费者因蟹卡无法兑换而踩雷。今年大闸蟹消费季,京东超市宣布为消费者提供百分百可兑换服务
2025-09-08 13:48:00
小米回应车主提车发现是测试车:静电贴痕迹,湿毛巾就能擦掉
近日,有小米YU7车主反映,提车后发现前挡风或后挡风玻璃上存在“测试车”静电贴残留痕迹。9月7日,小米集团公关部总经理王化在微博回应称
2025-09-08 11:54:00
贵州大数据集团中标国内首个“云胶片”项目
在贵州,一朵惠及全民的“医疗云”正腾空而起。9月4日,国内首个数字化医用耗材“云胶片”省级带量采购项目中标结果正式出炉
2025-09-08 11:53:00
□南京日报/紫金山新闻记者王国俊通讯员宁穗独角兽企业的成长既需要企业自身的科技实力,也离不开良好的发展环境。近日,记者从南京市税务局获悉
2025-09-08 07:42:00
产业发展“最佳助攻”,如此赋能!
9月2日,位于苏美达伊顿纪德仓储分拨中心厂区,申通快递员工直接将打包好的校服扫码揽收、装箱、发出,迅速、高效地将包裹送至客户手中
2025-09-08 07:42:00
□南京日报/紫金山新闻记者徐宁在南京,软件产业创新活力奔涌。南京市千行万业鸿蒙原生应用正式开启,南京开鸿城市产业园在建邺区启动建设
2025-09-08 07:43:00
未来到底怎么飞?2025智博会揭秘蓝天新赛道
大河网讯 低空经济是当下热议的话题,也是智能制造新赛道。在此背景下,2025世界智能产业博览会设置了低空经济专区,展现了各色各样的无人机和低空飞行器
2025-09-07 23:22:00
“跨界玩家”涌现,追觅、MOVA、TCL正用AI重划家电版图|硬氪直击IFA2025
编者按:2025年IFA(柏林国际电子消费品展览会),中国厂商又一次攻占会场。坐拥全球最完善、复杂的供应链,储备下数量最多
2025-09-07 10:05:00