我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

类别：科技发布时间：2024-05-14 09:56:00 来源：机器之心Pro

机器之心报道

机器之心编辑部

在 OpenAI 发布会的前一天，来自中国的大模型公司零一万物，让开源大模型社区活跃了起来：Yi 大模型家族新成员「Yi-1.5」模型正式开源。

在项目主页可以看到，Yi-1.5 包括一系列预训练和微调模型，分为 6B、9B、34B 三个版本，采用 Apache 2.0 许可证。

据了解，Yi-1.5 是 Yi-1.0 的持续预训练版本，使用 500B 个 token 来提高编码、推理和指令执行能力，并在 300 万个指令调优样本上进行了精细调整。

刚一发布，就已经有开发者跃跃欲试：

并收获了好评：

与前序模型相比，Yi-1.5 系列模型进一步提升了编码、数学、推理和指令遵循能力。从下方多个基准测试结果可以看出，Yi-1.5 34B 型号的一些指标超过了 Qwen 的 72B，几乎与 Meta Llama 3 的 70B 相当。6B 和 9B 型号也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型号。

重磅消息当然不止这一个。

在成立一周年之际，零一万物宣布面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口，保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案，Yi API Platform 英文站同步对全球开发者开放试用申请。

Yi 大模型 API 开放平台（https://platform.lingyiwanwu.com/）

其中，千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能，适用于复杂推理、预测，深度内容创作等场景，每百万 token 的价格是 20 元，是 GPT-4-turbo 的三分之一。

Yi-Large-Turbo API 则根据性能和推理速度、成本，进行了平衡性高精度调优，适用于全场景、高品质的推理及文本生成等场景。Yi-Medium API 优势在于指令遵循能力，适用于常规场景下的聊天、对话、翻译等场景；如果需要超长内容文档相关应用，也可以选用 Yi-Medium-200K API，一次性解读 20 万字不在话下；Yi-Vision API 具备高性能图片理解、分析能力，可服务基于图片的聊天、分析等场景；Yi-Spark API 则聚焦轻量化极速响应，适用于轻量化数学分析、代码生成、文本聊天等场景。

其中特别要提到的是发布会现场正式亮相的千亿参数 Yi-Large 闭源大模型。Yi-Large 面世的同时即正式进军全球 SOTA 顶级大模型之首。可以看到，与 GPT-4、Claude3 Sonnet、Gemini 1.5 Pro 以及 Llama 3-70B-Instruct 等当前顶级模型的较量中，Yi-Large 在绝大多数情况下取得了优势。

同时，在斯坦福大模型排行榜 AlpacaEval 的英语评测中，Yi-Large 达到全球大模型 Win Rate 第一。在中文通用大模型综合性基准 SuperCLUE 的中文语言理解排名中，Yi-Large 一跃成为国产大模型 No. 1。

中文能力方面，SuperCLUE 更新的四月基准表现中，Yi-Large 也位列国产大模型之首，Yi-Large 的综合中英双语能力皆展现了卓越的性能。

在发布会上，李开复还宣布，零一万物已启动下一代 Yi-XLarge MoE 模型训练，将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中，仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4-0409 等国际厂商的最新旗舰模型互有胜负。

Yi-XLarge 初期训练中评测（2024 年 5 月 12 日）。

至此，零一万物已经建立了「双轨模型策略」。

近期上线的一站式 AI 工作站「万知」（wanzhi.com/ 微信小程序「万知 AI」）则是零一万物基于世界领先的闭源模型 Yi-Large 所做出的「模应一体」生产力应用。

而对于大众和行业最关心的「大模型落地如何产生价值」的命题，李开复指出，国内大模型赛道的竞跑从狂奔到长跑，终局发展将取决于各个选手如何有效达到「TC-PMF」（

Product-Market-Technology-Cost Fit，技术成本 X 产品市场契合度）。大模型从训练到服务都很昂贵，算力紧缺是赛道的集体挑战，行业应当共同避免陷入不理性的 ofo 式流血烧钱打法，让大模型能够用健康良性的 ROI 蓄能长跑。

在李开复博士看来，自研 AI Infra 是零一万物必然要走的路，零一万物也自成立起便将 AI Infra 设立为重要方向，着力于实现计算效率的优化。AI Infra（AI Infrastructure 人工智能基础架构技术）主要涵盖大模型训练和部署提供各种底层技术设施。这也基于一个既定事实，很多大模型公司没有美国大厂的 GPU 数量，因此要采取更务实的战术和战略。

零一万物着力于实现计算效率的优化，经过多方面优化后，零一万物千亿参数模型的训练成本同比降幅达一倍之多。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-05-14 12:45:23

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于万物,模型,国产,再次,排行榜,模型的资讯：

阿里前副总裁贾扬清吐槽国产大模型“套壳”，李开复公司回应称有

...-34B模型目前在Hugging Face的Open LLM Leaderboard开源大语言模型排行榜排名第一。但此前有开发者在Hugging Face社区的Yi-34B项目讨论区留言称

2023-11-14 17:11:00

三六零上榜2023世界物联网500强为万物互联时代筑牢安全

...物联网500强峰会在京召开，会上发布2023世界物联网500强排行榜，并为三六零(601360.SH，下称“360”)数字安全集团

2023-07-10 13:00:00

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”，已在

...多大尺寸模型。 HuggingFaceOpenLLMLeaderboard(pretrained)大模型排行榜，Yi-34B高居榜首(2023年11月5日)在C-Eval中文权威榜单排行榜上

2023-11-06 15:25:00

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

...、中文大模型权威榜单名列前茅。图为AlpacaEval Leaderboard排行榜中排名（发布于2023年12月7日）/零一万物零一万物在11月15日表示

2023-12-20 00:10:00

李开复回应旗下AI独角兽陷“套壳”争议：起步受益于开源，会进

...A 2，在Hugging Face英文开源社区平台的最佳性能大语言模型排行榜和C-Eval中文评测的最新榜单都爬升到第一位。目前，零一万物估值超过10亿美元。按此估值，堪称创

2023-11-16 16:45:00

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...pretrained）（预训练大语言模型）和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口，意味着模型的“记忆力”

2023-11-06 12:13:00

遥遥领先！阿里Qwen-2成全球开源大模型排行榜第一

...布，阿里巴巴最新开源的Qwen2-72B指令微调版本在开源模型排行榜上荣登榜首。为了打造一个更为公正和准确的开源大模型排名

2024-06-27 11:53:00

零一万物新模型 Yi-Lightning 发布：LMSYS

IT之家 10 月 17 日消息，李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning

2024-10-17 09:57:00

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...相落地，国产大模型进入了新的竞争阶段。5月7日，零一万物官宣了一站式AI工作平台——万知。据官方介绍，万知可以帮助用户做会议纪要、周报、写作助手，还可以解读财报、论文等各类文

2024-05-07 18:33:00

更多关于科技的资讯：

AI时代，“养小龙虾”就能创业成功？

有人研究怎么把企业做大，有人研究怎么把企业做快，这个人却一头扎进历史堆里，研究一件事：为什么有些企业能活很久，有些却中途消失

2026-03-10 20:17:00

全国政协委员王黎光：AI编曲不能代替人工｜宅男财经

当前AI技术正在深入影响内容创作行业，对于AI编曲现象，全国政协委员王黎光表示，AI虽然能代替创作过程但不能代替人工。AI编曲是以大模型的储备量和收集量为基础的

2026-03-10 20:39:00

镇江农商银行优化结构驱动价值增长

在银行业竞争日趋激烈、利差收窄的宏观环境下，镇江农商银行坚持以精细化管理为抓手，通过实施“熵减工程”“蜂巢工程”和结构调优三大举措

2026-03-10 22:41:00

小红书将治理AI托管类账号

中新经纬3月10日电小红书“薯管家”官方账号发布公告称，近期，平台发现部分用户采用AI托管模式运营账号，通过技术手段自动生成内容

2026-03-10 21:19:00

国家互联网应急中心发布关于OpenClaw安全应用的风险提示

中国网3月10日讯据“国家互联网应急中心CNCERT”微信公众号消息，近期，OpenClaw（“小龙虾”，曾用名Clawdbot

2026-03-10 20:05:00

春风送千岗，AI助求职：2026年综合专场招聘会暨春风行动就

3月7日上午，“AI聘·才汇来”相城区2026年综合类专场招聘会暨春风行动就业援助活动在相城区人力资源市场成功举办。作为“春风行动”系列活动之一

2026-03-10 17:45:00

国科光锐研发生产基地项目落户黄桥

江南时报讯 3月4日，国科光锐研发生产基地项目签约仪式顺利举行，抢抓高端装备制造产业发展机遇，完善先进制造业发展支撑体系

2026-03-10 17:48:00

“养龙虾”，多地砸钱支持

中新经纬3月10日电 “养龙虾”，这是近日的AI热词，即部署和使用名为OpenClaw‌的开源AI智能体框架，因其图标为一只红色龙虾

2026-03-10 19:10:00

深耕微生物营养安琪酵母以基础研究驱动发酵产业新质生产力

鲁网3月10日讯（记者张佳伟）3月9日，由中国生物发酵产业协会主办、安琪酵母股份有限公司承办的“2026第十一届发酵培养基应用与发展技术论坛”在济南黄河国际会展中心举行

2026-03-10 17:24:00

两会，就这Young！丨万亿存量市场怎么激活？全国人大代表郭

编者按：今年全国两会，大河网两位00后记者首次踏上两会征程，以“萌新”视角记录两会，为网友带来全新体验：不背稿、不装样

2026-03-10 14:21:00

让家陪伴成长——金隅天坛家居Mall 3月7日启幕，定义“家

在快速更迭的时代，人们对家的期待已超越功能满足，转而追求情感承载与成长陪伴。正是基于这一洞察，金隅天坛家居Mall提出“我家的长期主义”核心主张——让家能够伴随家庭成长

2026-03-10 14:26:00

财报全维度解析高途：网课靠谱，机构可靠更正规

在教育选择中，高途网课是否靠谱、教育机构是否可靠、办学是否正规，是学习者和家长最为关注的核心问题。高途 2025 财年第四季度及全年财报

2026-03-10 14:27:00

文化认同融入创新表达，“欢笑中国年”如何抓住大众情绪的小切口

2026 年春节，红包大战再度迎来内卷与爆发，随着AI平台扎堆涌入，用户在春节期间的注意力被分散、现金激励的边际效应减弱

2026-03-10 16:50:00

灵寿县：灵活就业AI分析让求职成功率提升25%

“把这次春风行动搜集到的信息尽快录入系统，用AI分析一下，精准做好匹配。”3月8日，灵寿县零工市场有关负责人张杉认真梳理了上一场“春风行动”收集到的用工求职信息

2026-03-10 11:30:00

杭州的人形机器人太超前德国留学生专程为它来学习

近日，浙江科技大学机器人现代产业学院实验室里，来自德国德累斯顿技术经济大学的硕士研究生马克西米利安·穆勒正在开展关于宇树人形机器人的毕业论文研究

2026-03-10 11:36:00

头条订阅服务

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新