我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

开源大模型的ChatGPT时刻？备受期待的Llama 3 405B即将发布

类别：科技发布时间：2024-07-23 17:11:00 来源：华尔街见闻

千呼万唤始出来，原定于23日发布的Llama 3 405B就要来了。

作为Llama 3系列中的顶配，405B版本拥有4050亿个参数，是迄今为止最大的开源模型之一。

昨夜凌晨，META突发Llama 3.1-405B评测数据的泄漏事件，有网友预计可能还会同时发布一个Llama 3.1-70B版本，因为“（模型提前泄露）是META的老传统了，去年的Llama模型就干过一次。”

有分析认为，Llama 3 405B不仅仅是人工智能能力的又一次提升，对于开源AI 来说，“这是一个潜在的ChatGPT时刻”，其中最先进的人工智能真正实现民主化并直接交到开发人员手中。

对即将到来的 Llama 3 405B 公告的三个预测

有分析人士从数据质量、模型生态系统、API解决方案三个角度，预测了即将到来的Llama 3405B公告中的亮点。

首先，Llama 3 405B或许会彻底改变专用模型的数据质量。

对于专注于构建专业AI模型的开发人员来说，他们面临的长期挑战是获取高质量的训练数据。较小的专家模型（1-10B 个参数）通常利用蒸馏技术，利用较大模型的输出来增强其训练数据集。然而，使用来自OpenAI等闭源巨头的此类数据受到严格限制，限制了商业应用。

Llama 3 405B应运而生。作为一款与专有模型实力相媲美的开源巨头，它为开发人员创建丰富、不受限制的数据集提供了新的基础。这意味着开发人员可以自由使用Llama 3 405B的蒸馏输出来训练小众模型，从而大大加快专业领域的创新和部署周期。预计高性能、经过微调的模型的开发将激增，这些模型既强大又符合开源道德规范。

其次，Llama 3 405B将形成新的模型生态系统：从基础模型到专家组合

Llama 3 405B的推出可能会重新定义AI系统的架构。该模型的庞大规模（4050 亿个参数）可能意味着一种一刀切的解决方案，但真正的力量在于它与分层模型系统的集成。这种方法对于使用不同规模AI的开发人员来说尤其具有共鸣。

预计会转向更具动态的模型生态系统，其中Llama 3 405B充当骨干，由小型和中型模型提供支持。这些系统可能会采用推测解码等技术，其中不太复杂的模型处理大部分处理，仅在必要时调用405B模型进行验证和纠错。这不仅可以最大限度地提高效率，而且还为优化实时应用程序中的计算资源和响应时间开辟了新途径，尤其是在针对这些任务优化的SambaNova RDU上运行时。

最后，Llama 3 405B有最高效 API 的竞争

能力越大，责任越大——对于Llama 3 405B而言，部署是一项重大挑战。开发人员和组织需要谨慎应对模型的复杂性和运营需求。AI云提供商之间将展开竞争，以提供部署Llama 3 405B最高效、最具成本效益的API解决方案。

这种情况为开发人员提供了一个独特的机会，可以与不同的平台互动，比较各种API如何处理如此庞大的模型。这个领域的赢家将是那些能够提供API的人，这些API不仅可以有效地管理计算负载，而且不会牺牲模型的准确性或不成比例地增加碳足迹。

总之，Llama 3 405B不仅仅是AI武器库中的又一个工具；更是向着开放、可扩展和高效的 AI 开发的根本转变。分析认为，无论是在微调小众模型、构建复杂的AI系统还是优化部署策略，Llama 3 405B的到来都将为用户打开新的视野。

网友们怎么看？

网友在LocalLLaMA子Reddit板块中发帖，分享了4050亿参数的Meta Llama 3.1信息，从该AI模型在几个关键AI基准测试的结果来看，其性能超越目前的领先者，即OpenAI的GPT-4o，这标志着开源模型可能首次击败目前最先进的闭源LLM模型。

如基准测试所示，Meta Llama 3.1在 GSM8K、Hellaswag、boolq、MMLU-humanities、MMLU-other、MMLU-stem和 winograd等多项测试中均优于 GPT-4o，但是，它在 HumanEval和 MMLU-social sciences方面却落后于 GPT-4o。

宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克（Ethan Mollick）写道：

如果这些统计数据属实，那么可以说顶级 Al 模型将在本周开始免费向所有人开放。

全球每个国家的政府、组织和公司都可以像其他人一样使用相同的人工智能功能。这会很有趣。

有网友总结了Llama 3.1模型的几个亮点：

模型使用了公开来源的15T+tokens进行训练，预训练数据截止日期为2023年12月；

微调数据包括公开可用的指令微调数据集（与Llama 3不同）和1500万个合成样本；

模型支持多语言，包括英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。

有网友表示，这是首次开源模型超越了GPT4o和Claude Sonnet 3.5等闭源模型，在多个benchmark上达到SOTA。

本文来自，关注更多AI前沿资讯请

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-07-23 21:45:02

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,时刻,模型,数据,开发,人员的资讯：

具身智能竞速时刻，百度百舸提供全栈加速方案

...晰。每一家企业都面临着同样的核心命题：如何将前沿的模型能力，转化为在真实世界各类场景中可规模化应用落地的机器人产品？这背后，是研发团队对模型迭代速度的极致追求。企业亟需突破算

2025-08-13 17:25:00

被黄仁勋和OpenAI接连点名，这家向量数据库公司终迎“iP

...收割1亿月活用户。随后，百川智能、光年之外等中国大模型创企批量成立，国外Anthropic、Runway、LangChain等拿下知名风投巨额投资

2023-08-04 11:57:00

阶跃星辰宣布开源图生视频模型，多模态领域的DeepSeek时

...人工智能对产业、工作、生活等方面带来的积极变化。大模型的落地应用、社区生态以及开源成为本次大会的热点话题。国内大模型“六小虎”中最为低调的上海阶跃星辰智能科技有限公司（以下简

2025-02-22 16:36:00

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...时刻。在22分钟完整版采访视频中，他们分享了自己对新模型的思考，以及背后的开发故事。OpenAI o1团队采访的完整版视频

2024-09-23 09:50:00

（经济观察）中国大模型密集开源，影响几何？

中新社北京3月25日电 (记者夏宾)今年以来，中国大模型开源的消息一个接一个。阿里云通义千问从除夕夜开源全新的视觉模型Qwen2

2025-03-25 22:32:00

一块GPU都没用，苹果自研大模型干翻GPT-4？

...，上线Apple Intelligence的首个版本，同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能

2024-07-31 09:37:00

定价15000！老黄重磅发布RTX 5090：世界最小AI超

...I超级计算机——Project Digits。有多强悍？ 2000亿参数的大模型，直接在你办公桌上（自己的桌面系统）就能跑

2025-01-07 14:17:00

制造业AI也迎来大模型时刻？ | 智造观察

...片来源@视觉中国在通用领域，以ChatGPT为代表的预训练大模型，正在被大众所熟知。业内也在频繁示意：大模型在企业级或更多行业细分场景中，能不能短时间内带来巨大的生产力改变。

2023-04-20 20:00:00

重磅首发！亚信科技发布“渊思”行业大模型，“全栈AI”赋能行

...科技（股票代码：01675.HK）在京隆重举办“渊思”行业大模型产品发布会，正式揭晓1个通用人工智能与认知增强平台TAC MaaS

2024-05-17 14:25:00

更多关于科技的资讯：

杭产数字人“席卷”东南亚

“这款粉底色号非常自然，贴合亚洲人肤色。” 马来西亚TikTok直播间，一位妆容精致的主播正微笑着与观众互动，当用户追问具体颜色

2026-02-15 07:41:00

《视野》杂志启动AI协作创作大赛

中国青年报客户端讯（中青报·中青网记者马富春）2月13日，《视野》杂志“人类文明备忘录”AI协作创作大赛正式启动。活动以直播+实时互动形式展开

2026-02-14 20:52:00

新春走基层丨76秒，一套汽车零部件焊接就能下线

见习记者朱荣琛2月12日，农历腊月廿五。春节临近，廊坊经开区道路两旁挂上了大红灯笼，沿街企业的大门已贴上了大对联。热热闹闹的年味儿在这个城市的大街小巷悄然弥漫

2026-02-14 22:12:00

中国银行隆尧支行提升春节期间自助服务效能

针对春节期间服务需求，中国银行隆尧支行近日聚焦自助服务渠道，启动了专项保障工作。针对县域网点分布广、运维半径长的特点，隆尧支行依托历史运行数据

2026-02-14 22:17:00

飞来峰丨我们需要怎样的科学企业家？

领航新质生产力——2025浙江省科学企业家这个专题，是省科协和潮新闻联合举办的，已陆续推出了近二十位具有科技创新精神的浙商企业家

2026-02-14 22:34:00

深圳地铁陪你「返屋企」，跨场景互动刷新通勤与春运体验

近日，深圳地铁迎来了新春限定数字人，结合AI原创音乐与互动体验，走到了春运最前沿。这是深圳地铁数字IP首次以完整的互动形态沉浸式接入城市公共空间

2026-02-14 20:26:00

太原“新春招聘月”将于正月初八启幕

2月14日消息，2026年“新春招聘月”系列活动将于2月24日(正月初八)在五一广场太原人才大市场(迎泽区零工示范站)正式启幕

2026-02-14 17:37:00

星火空间完成数千万天使+轮融资核心产品“进化一号”发动机完

大皖新闻讯此前关于合肥要造火箭的消息引发外界广泛关注，背后则是合肥星火空间科技有限公司（以下简称“星火空间”）落户合肥新站高新区

2026-02-14 18:45:00

2026雄安国际医疗大健康技术应用大赛报名啦国医大师李佃贵

国医大师李佃贵为2026雄安国际医疗大健康技术应用大赛发声推介。他表示，当下是中西医并重、传统智慧与现代科技深度融合的时代，中医核心思想与大健康领域发展目标高度契合，期待中医药领

2026-02-14 19:13:00

中国科大取得重要突破首次实现量子李雅普诺夫指数的精确提取

大皖新闻讯 ”这一结果意义重大，为观测混沌的量子世界提供了全新视角。”相关人员如此评价说。2月14日，大皖新闻记者从中国科学技术大学获悉

2026-02-14 17:35:00

山东移动临沂分公司：技术赋能智慧生活，服务贴近百姓需求

鲁网2月14日讯为提升居民网络使用体验，助力智慧社区建设，近日，山东移动临沂分公司装维团队深入多个社区，开展 “移动装维进社区”专项服务活动

2026-02-14 15:10:00

山东移动临沂分公司：智慧装维服务升级，开启家庭网络新体验

鲁网2月14日讯“您好，我是中国移动装维工程师张师傅，现在上门为您检测网络，这是我的工作证件。”周六上午9点，临沂北城新区书香苑小区的王女士刚结束早间会议

2026-02-14 15:11:00

字节跳动发布豆包大模型2.0，主打真实世界复杂任务执行力

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后，2月14日，字节跳动宣布推出豆包大模型2

2026-02-14 15:35:00

从米兰冬奥会看全球消费趋势：为何“由你”成了2026年的新叙

过去十年，全球化品牌的策略多为“We are the best”，强调品牌的权威感。但现在的趋势是“Its your turn”

2026-02-14 16:20:00

千问大免单再加3天，邀请全国人民体验AI买电影票，激活春节A

2月14日，千问突然宣布免单再加3天，接入大麦、飞猪，邀请全国人民体验AI买电影票、门票等新功能，激活春节AI新消费。从今天下午3点到大年初一

2026-02-14 16:36:00

头条订阅服务

开源大模型的ChatGPT时刻？备受期待的Llama 3 405B即将发布