• 我的订阅
  • 科技

开源大模型新的里程碑!Llama 3.1 模型准时发布

类别:科技 发布时间:2024-07-24 12:13:00 来源:ZAKER科技

ZAKER科技7月24日消息,今日凌晨,Meta官方正式发布了Llama3.1模型。

本次Llama3.1模型共有三个版本,分别是8B、70B和405B。

从基准测试结果来看,超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。

在GSM8K任务中,Llama3.1405B得分96.8,高于GPT-4o的96.1和Claude3.5Sonnet的96.4。MATH任务成绩仅次于GPT-4o。这证明Llama3.1405B拥有很强的数学能力。

当然,Llama3.1模型的代码生成能力同样不俗。在评估Python生成的HumanEval和其它编程语言的MBPPEvalPlus测试中,8B和70B继续大幅领先同级别模型,但大参数模型上表现最佳的还是Claude3.5Sonnet。

从上述多项基准测试结果来看,Llama3.1模型的出现正在不断缩小开源大模型和闭源大模型之间的差距。

开源大模型新的里程碑!Llama 3.1 模型准时发布

图源:网络

其中HumanEvaluation主要用于评估模型在理解和生成代码、解决抽象逻辑问题方面的能力。在与其他大型模型的竞争中,Llama3.1405B显得略胜一筹。

开源大模型新的里程碑!Llama 3.1 模型准时发布

图源:网络

斯坦福大学计算机科学系和电子工程系副教授、人工智能实验室主任吴恩达(AndrewNg)在社交媒体上称赞"Meta和Llama团队对开源的巨大贡献"。他表示:"Llama3.1增加了上下文长度和改进了功能,是送给每个人的奇妙礼物。"

开源大模型新的里程碑!Llama 3.1 模型准时发布

图源:网络

总的来说,Llama3.1模型有以下几个特点:

1.包含8B、70B和405B三个尺寸,最大上下文提升到了128K,支持多语言,代码生成性能优秀,具有复杂的推理能力;

2.从基准测试结果来看,Llama3.1超过了GPT-40125,与GPT-4o、Claude3.5互有胜负;

3.提供开放/免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式,并支持在任何地方部署;

4.提供LlamaStackAPI,便于集成使用,支持协调多个组件,包括调用外部工具。

开源大模型新的里程碑!Llama 3.1 模型准时发布

图源:网络

最后,MetaCEO扎克伯格在今日长文中曾这样描述Llama3.1模型,"我相信Llama3.1版本将成为行业的一个转折点,大多数开发人员将开始转向主要使用开源技术,我期待这一趋势从现在开始持续发展……共同致力于将AI的福祉带给全球的每一个人。"

参考资料:

《赶超GPT-4o,最强大模型Llama3.1405B一夜封神,扎克伯格:开源引领新时代》

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-24 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

盘后跌15%!Meta一季度净利翻番,AI投资推高全年支出引发担忧
...示:“总的来说,我认为团队取得的成果是又一个关键的里程碑,展现出我们拥有相应的人才、数据和能力来扩展基础设施,构建世界领先的AI模型和服务。这让我相信,我们在未来几年中应该投
2024-04-25 08:19:00
准时达:用AI赋能全球供应链的新质生产力
...,并推出JusLink数字化供应链管理平台。2023年是AI发展的里程碑之年,准时达借助AI赋能智能供应链解决方案,实现了供应链透明度的提升、决策优化、流程自动化,以及风险的
2024-07-01 15:45:00
天垓100率先完成百亿级参数大模型训练,天数智芯迎来新的里程碑
6月10日,在第五届智源大会AI系统分论坛上,上海天数智芯半导体有限公司(以下简称“天数智芯”)对外宣布,在天垓100加速卡的算力集群,基于北京智源人工智能研究院(以下简称“智源
2023-06-13 12:00:00
差一步称霸 AI:历史进程中的扎克伯格
...顶级棋手。Facebook 的 AI 如果真能战胜人类,无疑是一个里程碑级的事件。这个项目的领头人是 Facebook 的首席科学家杨立昆(Yann Le Cun)
2023-06-25 23:00:00
小度、可口可乐强强联合,国内AIGC品牌与多模态大模型深度结合迎来里程碑产品
近日,可口可乐全球创意平台“乐创无界”(Coca-Cola Creations)再次推出重磅产品,在中国区产品上市营销活动里与国民智能品牌小度展开合作,共同推出可口可乐「未来畅想
2023-09-15 15:44:00
摩尔线程全国产千卡智算中心正式落地:国产GPU为底座的里程碑
近日,摩尔线程公司正式发布通告,宣布摩尔线程KUAE智算中心正式成立。这一举措具有划时代的意义,标志着国内首个以国产全功能GPU为底座的大规模算力集群正式落地。该中心的成立不仅彰
2023-12-23 13:56:00
由AI技术引发的产业革命还在继续。2024年春节期间OpenAI发布文生视频模型Sora一夜爆火,掀起包括短视频制作,短视频营销等多个领域的技术创新和商业化落地想象力。近期,微盟
2024-02-23 10:45:00
实现意念操控鼠标,脑机接口新突破!马斯克的宏伟抱负不远了
...此除了惊叹科技的魅力之外,这也是脑机接口技术迎来的里程碑时刻。今日,A股脑机接口概念活跃上扬,博济医药、创新医疗涨超5%,三博脑科涨超4%,南京熊猫、麒盛科技、佳禾智能涨超3
2024-02-21 14:06:00
...试成功,未来成功上舰的话,这对中国海军而言将是一个里程碑事件。
2025-01-05 11:41:00
更多关于科技的资讯:
国家级5G工厂,钟经开+1!
近日,工业和信息化部公示了《2025年5G工厂名录》钟楼经济开发区企业江苏电力装备有限公司成功入选成为继江苏精研科技股份有限公司后钟楼区第二家国家级5G工厂5G工厂是充分利用以5G为代表的新一代信息通信技术
2025-09-06 06:08:00
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00
本报讯(记者雷嘉)围绕国产车规级芯片搭载应用,北京市科委、中关村管委会会同北京市智慧城市基础设施与智能网联汽车协同发展办公室
2025-09-05 11:08:00
河北新闻网讯(王丽英)“后厨不只是生产中心,更是服务体验的心脏。”“服务不仅仅是完成交易的过程,更是以关怀为主利他主义精神的体现
2025-09-05 11:08:00
海信冰箱五款产品通过中国家用电器研究院自动制冰性能认证
日前,经中国家用电器研究院严格检测与评估,海信冰箱旗下五款产品成功通过“电冰箱自动制冰性能认证”,并获颁认证证书。此次获证不仅是对海信冰箱自动制冰技术性能的肯定
2025-09-05 11:57:00
京东全球80+高校招聘 清华、剑桥等80校专场 现场面试拿offer!
9月5日,京东招聘公众号发文:全球80+高校!京东2026校园招聘进校行程发布。文中称:将在全球20+城市,80+院校
2025-09-05 12:10:00
花一万元植入DeepSeek,一场没有终点的流量游戏
文|邓咏仪编辑|苏建勋让你的产品在DeepSeek的答案里有一席之地,需要多少钱?答案是:数千甚至上万元。人在哪,流量就在哪
2025-09-05 14:56:00
爱尔眼科开启老视多学科诊疗新时代
9月4日,2025年屈光性白内障手术国际论坛(IRCS)暨第一届老视矫正MDT管理国际高峰论坛在杭州举办我国超八成60岁以上老年人正面临老视(老花眼)与白内障的“双重眼病困扰”
2025-09-05 15:18:00
获SIAL创新奖:诺啦格兰诺拉脆片让生活更美好  
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。吉丽莎(广州)贸易有限公司选送的产品诺啦格兰诺拉脆片跻身TOP10
2025-09-05 15:18:00
桃李面包广告语引争议“五仁不好吃是你还年轻”官方账号发文:领导拍的板,这个锅只能他来背
近日,桃李面包一则电梯广告文案引发争议。社交平台上流传的图片显示,桃李蛋月烧产品的广告语写道:“有人说五仁不好吃,我们认为
2025-09-05 15:29:00
京东超市布局产地直采 加大力度进口澳洲水果 助力澳洲水果深耕中国市场
今年开始,京东超市加大力度布局澳洲水果的供给和销售,投入资源帮助澳洲橙子、提子等水果进一步扩大销量。近日,在2025中国国际水果展上
2025-09-05 15:30:00
潍坊寿光市圣城街道一企业酿出康养“新食尚”
大众网记者 刘建永 潍坊报道为企赋能、助企发展是区域经济高质量发展的推动器。潍坊寿光市圣城街道在政策引领、优化营商环境
2025-09-05 15:50:00
大众网记者 王帅 通讯员 孙丽霞 杨阳 潍坊报道走进山东禾汇食品有限公司黄豆酱生产车间,一排排瓶装黄豆酱准备打包装箱,发往各大连锁商超
2025-09-05 15:50:00
9月4日,济南市委网信办联合山东省互联网传媒集团举办“‘科创泉城 智启未来’知名网络达人济南采风”活动。当日上午,10余位全国知名网络名人
2025-09-05 16:34:00