• 我的订阅
  • 科技

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

类别:科技 发布时间:2023-11-06 15:25:00 来源:央广网

11月6日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。

零一万物此次开源的Yi系列模型包含34B和6B两个版本。据HuggingFace英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型取得了多项SOTA国际最佳性能指标认可,成为全球开源大模型“双料冠军”。

零一万物创始人及CEO李开复博士表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为‘World'sNo.1’的初衷和决心。”

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

Yi-34B登顶全球英文及中文权威榜单No.1

在HuggingFace英文测试公开榜单Pretrained预训练开源模型排名中,Yi-34B以70.72分位列全球第一,碾压LLaMA2-70B和Falcon-180B等众多大尺寸模型。

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

HuggingFaceOpenLLMLeaderboard(pretrained)大模型排行榜,Yi-34B高居榜首(2023年11月5日)

在C-Eval中文权威榜单排行榜上,Yi-34B超越了全球所有开源模型。对比GPT-4,在CMMLU、E-Eval、Gaokao三个主要的中文指标上,Yi-34B也具有绝对优势。

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源

C-Eval排行榜:公开访问的模型,Yi-34B全球第一(2023年11月5日)

在全球大模型各项评测中最关键的MMLU(MassiveMultitaskLanguageUnderstanding大规模多任务语言理解)、BBH等反映模型综合能力的评测集上,Yi-34B同样表现突出,在通用能力、知识推理、阅读理解等多项指标评比中全部胜出。

各评测集得分:Yi模型v.s.其他开源模型

和LLaMA2一样,Yi系列模型在GSM8k、MBPP的数学和代码评测表现略逊GPT模型。未来,零一万物的系列开源计划中将推出代码能力和数学能力专项的继续训练模型。

全球最长200K上下文窗口

Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要。

受限于计算复杂度、数据完备度等问题,上下文窗口规模扩充从计算、内存和通信的角度存在各种挑战。为此,零一万物技术团队实施了一系列优化,包括计算通信重叠、序列并行、通信压缩等,实现了在大规模模型训练中近100倍的能力提升,也为Yi系列模型上下文规模下一次跃升储备了充足“电力”。

AIInfra实测实现40%训练成本下降

李开复曾经表示,“做过大模型Infra的人比做算法的人才更稀缺”。超强的Infra能力是大模型研发的核心护城河之一。

AIInfra(AIInfrastructure人工智能基础架构技术)涵盖大模型训练和部署提供各种底层技术设施,包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等。

零一万物Yi系列大模型基于阿里云平台打造,阿里云强大的智能算力基础设施为模型训练提供了稳固的基石。零一万物的Infra技术通过“高精度”系统、弹性训和接力训等全栈式解决方案,确保训练高效、安全地进行。

凭借强大的AIInfra,Yi-34B模型训练成本实测下降40%,实际训练完成达标时间与预测的时间误差不到一小时,进一步模拟上到千亿规模训练成本可下降多达50%。目前,零一万物Infra能力实现故障预测准确率超过90%,故障提前发现率达到99.9%,不需要人工参与的故障自愈率超95%。

零一万物组建了由前Google大数据和知识图谱专家领衔的数据团队,建设了高效、自动、可评价、可扩展的智能数据处理管线;还自研出一套“规模化训练实验平台”,用来指导模型的设计和优化。数据处理管线和加大规模预测的训练能力建设,把以往的大模型训练碰运气的“炼丹”过程变得极度细致和科学化。

李开复宣布,零一万物已启动下一个千亿参数模型的训练。

接下来,零一万物将基于Yi系列大模型,打造更多ToC超级应用。李开复强调,“AI2.0是有史以来最大的科技革命,它带来的改变世界的最大机会一定是平台和技术,正如PC时代的微软Office,移动互联网时代的微信、抖音、美团一样,商业化爆发式增长概率最高的一定是ToC应用。零一万物邀请开发者社群跟我们一起搭建Yi开源模型的应用生态系,协力打造AI2.0时代的超级应用。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-06 18:45:23

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
... | 搜狐科技作者 | 梁昌均国内大模型再陷“套壳”争议。阿里巴巴前副总裁、知名AI框架大牛贾扬清发朋友圈,感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名
2023-11-14 17:11:00
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...独角兽的AI公司。在公司正式运营的5个月后,零一万物从阿里云处再获融资,估值超10亿美元。晋升为独角兽之际,零一万物在11月6日发布了全新成果——两个开源大模型,Yi-34B
2023-12-20 00:10:00
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
...能有大幅提升,价格也下调了50%。国内市场,字节跳动、阿里等大厂纷纷大幅度降低大模型价格,百度5月21日更直接宣布文心大模型两大主力模型免费,掀起国内大模型一轮价格战。当被问
2024-05-21 23:32:00
国家超算互联网平台接入阿里千问大模型
3月10日消息,国家超算互联网平台接入阿里巴巴通义千问大模型,对外提供千问QwQ-32B API 服务,用户可免费获得100万tokens
2025-03-10 14:54:00
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...源:网络 在零一万物发布官方回应后,又有一张疑似原阿里技术副总裁贾扬清的朋友圈截图传出,强调在开源领域“魔改”不得:“开源是一个相互合作的事情,本质是要大家能够求同尊异,讨
2023-11-16 16:45:00
上海人工智能实验室公布首个ai高考全卷评测结果
...日开源的书生・浦语2.0系列文曲星大语言模型。Qwen2-57B:阿里巴巴于2024年6月6日开源的Qwen2系列MoE对话模型
2024-06-20 10:19:00
被低估的腾讯AI:专利全球第1,斩获2项世界冠军,5项评比第1
...苹果等等,都在研发自己的AI大模型。而在国内,百度、阿里、腾讯、华为、字节跳动等,也都在研发自己的大模型,真的是一个千模混战的大时代。当然,千模大战之下,倒掉的也多,之前一个
2024-07-09 09:47:00
阿里大模型,再次开源大放送
阿里大模型,再次开源大放送——发布Qwen1.5版本,直接放出六种尺寸。最大的Qwen1.5-72B-Chat模型,在MT-Bench和Alpaca-Evalv2上
2024-02-20 14:45:00
...0分)。参加OpenCompass此次高考测试的大模型,分别是来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室
2024-06-26 07:26:00
更多关于科技的资讯:
“组团作战”研发一种高品质汽车用钢创新联合体,解汽车制造业“痛点”日前,一个好消息从长城汽车股份有限公司传来:一种新研发的纯锌镀层热成形钢
2025-09-07 07:50:00
第六届金芦苇工业设计奖精品展开幕汇聚13个国家及地区的500余件佳作河北日报讯(见习记者李畅)9月1日,由雄安新区未来工业设计研究院主办
2025-09-06 08:32:00
近日,山大路街道山大社区联合芯赛博开展数码公益活动,围绕“免费、实用、贴心”,为居民提供0元贴膜、老旧照片AI修复、数码产品检测三项服务
2025-09-06 09:15:00
老乡鸡IPO:供应链协同力,食材管控体系获认可
近日,中式快餐品牌老乡鸡的IPO进程持续引发行业关注。作为门店数量超1500家的连锁餐饮企业,老乡鸡能在竞争激烈的快餐赛道站稳脚跟
2025-09-06 15:47:00
111大健康产业发展论坛走进北京同仁堂启动北京“店效王”孵化计划
当“健康中国2030”战略持续深化,大健康产业正迈向“品牌化、专业化、协同化”的新阶段。北京作为全国健康服务的前沿阵地
2025-09-06 15:49:00
解码鸿蒙有礼:华为砸下真金白银,花钱赚吆喝还是格局再打开?
9月4日,华为Mate XTs 非凡大师及全场景新品发布会在深圳召开,华为Mate XTs 非凡大师、华为智慧屏 Mate TV
2025-09-06 15:49:00
大皖新闻讯 九三阅兵期间,来自合肥高新区的四创电子提供了技术、设备、人员等多方面保障。他们分布在首都各区域,精准捕捉预测风
2025-09-06 17:26:00
从看砖头到看专利 贵阳市“科创积分贷”让科技型企业“知产”变现
“从提交申请到拿到贷款只用了两周多,申报材料比传统贷款少了三分之一,效率提高了50%!”近日,贵州捷众森建材有限公司董事长顾潘拿着“科创积分贷”到账凭证感慨道
2025-09-06 18:15:00
大河网讯 9月6日,细雨蒙蒙,湿润的空气中带着淡淡的江水气息,山城重庆显得格外宁静。可在重庆国际博览中心内却是另一番景象——2025世界智能产业博览会正在这里举办
2025-09-06 22:20:00
2025智博会“四链”融合对接暨“渝链通”发布活动成功举办 助力科创企业融资破局
大河网讯 9月6日,2025世界智能产业博览会“四链”融合对接活动——智能产业股权融资专题对接暨“渝链通”服务方案发布会在重庆国际博览中心圆满举行
2025-09-06 22:20:00
从茶叶到瓶装茶,小罐茶高香无糖茶加速传统茶企转型
健康消费升级持续推动市场扩容,无糖茶赛道正迎来众多品牌加码布局。尽管消费场景细分和产品升级带动无糖茶市场与受众不断扩大
2025-09-06 15:51:00
大河网讯 人工智能是新一轮科技革命和产业变革的重要驱动力量,对全球经济社会发展和人类文明进步产生了深远影响。9月5日,2025世界智能产业博览会在长江之畔重庆开幕
2025-09-06 13:08:00
国家级5G工厂,钟经开+1!
近日,工业和信息化部公示了《2025年5G工厂名录》钟楼经济开发区企业江苏电力装备有限公司成功入选成为继江苏精研科技股份有限公司后钟楼区第二家国家级5G工厂5G工厂是充分利用以5G为代表的新一代信息通信技术
2025-09-06 06:08:00
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00