• 我的订阅
  • 科技

李开复AI公司首发大模型,阿里云领投 | 36氪独家

类别:科技 发布时间:2023-11-06 12:13:00 来源:36氪

文 | 周鑫雨

编辑 | 杨轩

2023年11月6日,由创新工场董事长兼CEO李开复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。

此前,“Yi”于11月2日已经在Hugging Face低调上传了两个参数规模分别为6B和34B的基础模型。截至11月5日,Yi-34B分别在Hugging Face LLM Leaderboard(pretrained)(预训练大语言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。

上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。

李开复提到,由于GPU紧缺,当模型尺寸从6B推向更大的尺寸时,团队需要把握好规模减少试错成本,不能一味追求“大”。通过打磨AI Infra,Yi-34B将训练成本下降了40%,“别的友商如果要用2000张GPU,我们只要1200张。”

Yi的训练数据主要来源于公开语料的爬取和数据库。李开复介绍,训练数据的难点在于重复率高、质量低。通过清晰,团队从100多T的数据中筛选出了3T。由于中文语料的质量较低,目前,Yi的训练数据中英文语料的比例高于中文语料。

那么Yi的能力究竟几何?在测评中,零一万物参考了Meta开源模型Llama2能力测评中所用到的PIQA、SIQA、HellaSwag、WinoGrande等多个数据集,来评估Yi的“常识推理能力”“阅读理解能力”“数学与代码能力”等多维度能力。

李开复AI公司首发大模型,阿里云领投 | 36氪独家

Yi能力。

结果显示,Yi-6B在常识推理能力和阅读理解能力上达到了国内外开源模型的平均水平,但在数学与代码能力上还较弱。Yi-34B在常识推理能力和阅读理解能力上均大幅领先国内外开源模型,在数学与代码能力上处于领先水平。

李开复认为,34B的尺寸属于开源大模型稀缺的“黄金比例”尺寸,达到“涌现”门槛、满足精度要求的同时,对厂商而言能够采用高效率单卡推理,训练成本友好。

李开复坦言,在完成融资前,零一万物为了覆盖算力等训练成本已经负债几千万美元,“花光了创新工场的钱,还向银行贷了款”。这也侧面反映出李开复All in AI的决心。

作为零一万物的发起人,李开复也可谓是中国人工智能的领军人物之一。他曾先后担任微软全球副总裁、谷歌全球副总裁兼大中华区总裁,并在2009年创立了天使投资和企业孵化平台创新工场。

2023年3月,李开复躬身入局大模型赛道,为筹建新公司零一万物广发“英雄帖”:“零一万物欢迎有AI 2.0技术实力和AGI信仰的优秀人才加入,一起打造AI2.0全新平台,加速AGI到来。”到7月,零一万物已有来自阿里、百度、谷歌、微软等国内外公司的数十位核心成员到位。发布会上,李开复介绍,“(团队)在6、7月份写的第一行代码。”

如今,零一万物已经集结了国内外一批人工智能领域的大牛:

李开复AI公司首发大模型,阿里云领投 | 36氪独家

零一万物预训练负责人黄文灏,零一万物AI Infra副总裁戴宗宏。

比如零一万物AI Infra副总裁戴宗宏,曾是阿里达摩院机器智能技术资深算法专家,以及华为云人工智能领域CTO。在阿里期间,他构建了阿里巴巴搜索引擎平台,后带领团队研发了图像搜索应用拍立淘。

再比如,零一万物预训练负责人黄文灏来自智源人工智能研究院,曾担任健康计算研究中心技术负责人。加入智源前,他曾任微软亚洲研究院研究员,负责自然语言理解、实体抽取、对话理解以及人机协同等研究工作。加入零一万物后,黄文灏团队主要负责Yi的训练。

李开复认为,AI 2.0时代,最大的商机将出现在To C/消费级的超级应用。他提到,互联网时代的Super App微信和抖音的第一个版本并不是Super App,而是准确捕捉了用户的需求。而零一万物的目标是在AI 2.0时代再做一款微信、抖音。

具体到零一万物的商业规划,李开复告诉36氪,AI 1.0时代无法商业化的公司很早被淘汰,而商业化的公司的最大挑战是能够可持续、可增长——这意味着AI 1.0的不少公司需要人头规模,不是高质量的收入。

他强调,收入的规模化不应该用人头推动,而应该用技术推动。“以此为原则,零一万物将朝着Consumer(消费级)应用发力。”考虑到国内用户的付费意识和意愿尚在培养阶段,零一万物将同时考虑应用的本地化和出海。

目前,零一万物已经启动100B以上参数规模的模型训练,而多模态大模型团队已经集结了十多个人。“几周之内我们就有新的发布和大家分享。”李开复透露,“Yi”的定位是通用底座,同时,Yi系列量化版本、对话模型、数学模型、代码模型、多模态模型将以快节奏推出。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-06 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
11月6日,李开复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模
2023-11-06 15:25:00
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
...对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO
2023-11-14 17:11:00
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
李开复创办的AI公司零一万物(01.AI)近日陷入风波。11月15日,创新工厂董事长兼CEO李开复在其微信朋友圈转发了旗下零一万物对于日前“套壳”争议的官方回应
2023-11-16 16:45:00
李开复发布零一万物首款340亿参数大模型Yi
2023年11月7日星期二1、李开复发布零一万物首款340亿参数大模型Yi11月6日,知名投资人、创新工场董事长兼CEO李开复带队创办的AI2
2023-11-07 12:17:00
文 | 周鑫雨编辑 | 邓咏仪距李开复发出AI英雄帖,过去了整整106天。2023年3月19日,创新工场董事长兼CEO李开复在朋友圈宣布“亲自筹组Project AI 2
2023-07-03 19:28:00
李开复辟谣阿里收购:谣言散播的快 撤的也快
...网络上流传的“阿里收购零一万物”的传闻,零一万物CEO李开复在朋友圈发文澄清:“不知为什么会有这样的谣言散播,不过散的快,撤的也快。”李开复进一步表示,“2024年,零一万物
2025-01-07 11:17:00
零一万物联创戴宗宏离职创业 | 智能涌现独家
...零一万物的骄傲。2023年公司成立之初,零一万物创始人李开复曾多次对外表示,做过大模型Infra的人比做算法的人才更稀缺
2025-05-08 19:11:00
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...业以来首次面向C端用户发布一站式AI产品。而零一万物CEO李开复亲自出任万知C“E”O(ChiefExperienceOfficer)
2024-05-07 18:33:00
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
李开复露面的频率越来越高,都是因为大模型。没有上周发布会上精致讲究的穿搭和标志性的领带,这次李开复只是一件西服配上衬衫就出现在摄像头前,显得有些仓促。“昨晚技术团队看到这个突破很
2024-05-21 23:32:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00
“智慧武当”给游客带来数字文旅新体验
十堰广电讯(通讯员 汪伟 周琼 耿宇)“一部手机游武当”预约购票、AI导游、《入境武当》VR大空间、问道武当数字客厅……国庆假日
2025-10-01 18:35:00
津云文旅电商版块上线 首发“笑漾海河”优选线路 扫码阅读手机版
10月1日,天津鹏欣水游城14周年庆暨津云新媒体“笑漾海河”文旅电商线路首发仪式成功举办。近年来,随着“文旅+电商”模式的快速发展
2025-10-01 18:55:00