• 我的订阅
  • 科技

大模型时代的阿里云,将云计算进行到底

类别:科技 发布时间:2023-11-01 12:00:00 来源:36氪

文|葛覃

大模型与云计算,正在成为新时代的淘金者和卖铲人。

自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适合大规模的AI任务,同时云厂商也有人才、资源等优势,匹配大模型这类技术密集型工作。

淘金热最开始的阶段总是最混乱,淘金者一窝蜂涌向理想之地,竞争很快变得激烈起来,成功的淘金者是少数,这和如今的大模型产业相似。而云厂商同时具备淘金者与卖铲人的两种身份,如何平衡两者的关系,考验着云厂商的战略意识。

2023年云栖大会上,阿里云CTO周靖人表示:“面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。”

在现场,周靖人发布了千亿级参数的通义千问2.0,但更多的时间花在公布云计算基础能力的进展上:包括AI基础设施的全面升级、模型应用开发平台阿里云百炼以及更加自动化的云等,他宣布阿里云已初步建成AI时代全栈的云计算体系。

大模型时代的阿里云,将云计算进行到底

通义千问72B即将开源

阿里云传达出清晰的战略,最终落点在云,而不是大模型,要做卖铲人,服务千万淘金者。

01. 云优先,还是大模型优先

国外如AWS、微软Azure等,国内如阿里云、百度等,看起来似乎都没什么两样,从基础设施到大模型应用,云厂商能够包揽大模型链条上的大部分环节。实则不然,出发点不同,决定了云厂商不同的动作。

仔细观察国内外云厂商的布局就会发现,所有云厂商都面临云还是大模型的选择,国外头部云厂商更务实,以云为先,国内云厂商还在观望。

ChatGPT火爆之后,AWS的主打产品不是自研的大模型,而是Amazon Bedrock,Amazon Bedrock 是一项完全托管的服务,用户可调用亚马逊自己的基础模型Amazon Titan,也可以使用其他第三方基础模型,并且提供构建生成式人工智能应用程序所需的一系列工具链,强调隐私和安全。

如果说AWS的选择还可以理解为,错失大模型的先发机会不得不优先做云,那么,微软就更有代表性。

2020年,微软就发布了基于Transformer架构的语言生成模型Turing NLG,170亿参数是当时OpenAI的GPT-2的十倍。值得关注的是,当ChatGPT取得了现象级热度,微软并没有再着重强调自研大模型,而是选择了深度绑定的方式,直接基于GPT对外提供服务。

在最新一季财报中,微软收入同比增长了13%至565亿美元,净利润同比增长了27%,至222亿美元,微软表示,主要得益于对消费者和商业产品中大型AI模型的不断增长需求,推动了云消费的增加。

微软并不是放弃做大模型,微软Azure云是基础设施,Copilot作为AI 助手扩展到Windows、Office、Bing等软件,云-AI-软件的链条构成了商业闭环,微软要是再把持大模型,可能会得不偿失。

结合产业现实来看,站在云计算的出发点做大模型,有足以让人信服的理由。

大模型是技术驱动型创新,而非场景驱动型创新,这就意味着大模型没有现成的应用场景,说得好听点是无限可能,说得难听点是从零开始,毕竟ChatGPT很难复制,大模型还是需要找到客户为之买单的场景,尤其是B端有更高付费能力和意愿的客户。

拿着锤子找钉子,是大模型厂商当下的常态,而云计算是一条确定且广阔的赛道,商业模式清晰,赛道规模足够大,仅就算力资源来看,未来AI算力取代通用算力充满确定性,不止是目前的训练需求,未来推理需求将远超训练需求,以大模型算力为云的基本盘,是云厂商必须抓住的大生意。

除了算力之外,大模型能够提高云计算的附加值,直接提升毛利。IaaS是低毛利生意,但大模型的训练任务,是囊括了算力底座、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,对性能、成本提出了严酷挑战,传统数据中心难堪重任。

经历了大规模任务考验的云平台,更适合承载大模型。周靖人表示,云计算是做大模型的最佳选择。更适合跑大模型的云,本质上就是更好的铲子,能够让大模型厂商挖掘到更高的价值,自然云厂商的价值也会水涨船高。

某种意义上,阿里云自己下场做大模型,更像是“打样”——自己把坑都蹚过了,知道该往哪里走,才能更好地说服客户上云来做大模型。

不过,从产业生态的角度考量,一家云厂商同时做大模型和云平台,容易被理解为和客户竞争。云厂商做大模型应该把握好度,既要锤炼出大模型厂商所需要的基础设施,又不至于与客户争利。

微软、英特尔都是靠链接上下游,形成平台化、规模化的生态,云计算是新时代的平台,向下整合硬件,向上对接大模型,云厂商应该做好云平台,构建云生态,更多地把大模型应用的空间让渡给行业。

02. 阿里云在大模型时代的“三板斧”

相比于国外云厂商的坚定做云,国内云厂商还在摇摆之中,不过,作为中国最大的云计算厂商,阿里云的表态可能引起连锁反应。

本届云栖大会,阿里云发布了诸多产品和服务,除了国内千亿级参数通义千问2.0,还一次性放出了8个可以直接2C体验的行业大模型,还有玲琅满目的AI相关云产品全面升级。

大模型时代的阿里云,将云计算进行到底

通义大模型家族

在令人眼花缭乱的发布背后,阿里云面向AI时代其实已经做出了坚定选择——做AI时代的基础设施、开源路线、开放平台。

首先是AI基础设施,大模型是AI基础设施呈现的结果,实际上,阿里云内部的迭代早已开始,每一次模型的发展都离不开云,表面上看是模型的发布,背后代表的是阿里云整个AI基础设施的升级,高带宽网络的连接,大规模资源的管理,高效弹性的多种算力,数以万计的服务器构成了开发者界面的一台计算机。

以阿里云本次云栖大会发布为例,全新升级的阿里云人工智能平台PAI,底层采用HPN7.0新一代AI集群网络架构,可高效协同调度各类芯片,支持高达10万卡量级的集群可扩展规模,让超大集群像一台计算机般高效运转。

阿里云PAI可支撑多个万亿参数大模型同时训练,超大规模分布式训练加速比高达96%,远超行业水平;在大模型训练任务中,更可节省超过50%算力资源,性能全球领先。

要知道,大模型训练大部分时间都在等待,一个错误可能导致有效训练时间少几天甚至几个礼拜,而且大模型规模越大、卡数越多,出故障的概率就越大,多数大模型的训练只使用数百张卡,加速比96%意味着算力可以实现接近线性的增长,而不是绝大多数时间都在空转浪费资源,背后阿里云平台做了复杂的系统优化。

做云, 并不代表阿里云不做大模型,阿里云做大模型是为了更好的做云,因此阿里云也将大模型逐步开源出来,并且走开放路线。

今年4月,阿里云推出自研大模型通义千问,并先后开源70亿及140亿参数规模的大模型版本,成为国内最早开源自研大模型的科技公司。在2023云栖大会现场,通义千问2.0正式亮相,基于更大的参数规模和更先进的对齐技术,通义千问2.0在复杂指令理解、文学创作能力、通用数学能力、知识记忆、幻觉抵御等能力维度上表现优异,在多个主流测评集上,超越GPT-3.5,获得接近GPT-4的得分。

阿里云还“打样”了8大垂直领域模型——通义听悟、通义晓蜜、通义智文、通义星尘、通义灵码、通义法睿、通义仁心、通义点金,让大模型在金融、医疗、法律、编程、个性化创作等行业和场景中更易被集成。

通义灵码等8大垂直领域模型,将通过网页嵌入、API与SDK调用等方式集成进各行各业,还将通过全新发布的一站式大模型应用开发平台——阿里云百炼,对外开放。这也是阿里云降低大模型门槛的一大举措。

大模型时代的阿里云,将云计算进行到底

阿里云百炼接入主流三方大模型

周靖人介绍称,阿里云百炼集成了国内外主流优质大模型,包括阿里云自研大模型及Llama2、Baichuan等三方大模型。基于阿里云百炼,开发者可在5分钟内开发一款大模型应用,几小时“炼”出一个专属模型,大模型门槛大幅降低。

在2023云栖大会现场,周靖人透露,模型社区阿里云魔搭,已聚集2300多款AI模型,共吸引280万名AI开发者,魔搭社区上线仅一年,AI模型下载量就已突破1亿。

大模型时代的阿里云,将云计算进行到底

魔搭社区模型下载量突破1亿

阿里云魔搭已成为国内规模最大、开发者最活跃的开放模型社区,其中,通义千问开源版本累计下载超百万次,百川智能、智谱AI、上海人工智能实验室、IDEA研究院等业界顶级玩家都已将其核心大模型在魔搭上首发,并开源Baichuan2系列模型、MathGLM系列模型、书生-浦语200B模型InternLM-20B、Ziya2-13B等系列模型。

03. 做大模型时代的云生态

云栖大会上,阿里巴巴集团董事会主席蔡崇信致辞,他强调最多的词是“开放”。蔡崇信说:“我们坚信,不开放就没有生态,没有生态就没有未来。同时,我们要始终攀登技术高峰,只有站在更先进、更稳定的技术能力之上,才有更大的开放底气。”

大模型时代的阿里云,将云计算进行到底

技术从来不是护城河,与其说阿里云在做AI时代的云,不如说阿里云在做大模型时代的云生态。2022年底,周靖人首次提出MaaS(Model as a Service,模型即服务)理念,阿里云已经设想好了未来的蓝图。

即阿里云通过提供工具与服务,降低使用门槛,为大模型创业公司提供全方位服务,越多元的模型、越繁荣的应用,中国大模型生态意义上就更繁荣,阿里云的机会也就越大。

如此梳理,便能将阿里云的动作串联起来,AI基础设施包括IaaS和PaaS一系列能力,朝着更适合跑大模型的方向演进,应用层面树立标杆先一步为客户趟路,开源、开放是为了让客户、开发者、创业公司、ISV等角色聚拢在一起,降低沟通成本,快速推出面向市场的创新。

以开源为例,国外厂商开源大模型不少,阿里巴巴是唯一一个开源大模型的国内头部云厂商,这是阿里云与其他厂商的根本区别,所以在云厂商纷纷喊着做大模型生态时,魔搭社区早已经种下了种子,并且逐渐生长为中国大模型生态的森林。

生态开放策略为阿里云直接赢得了客户信任,周靖人介绍,中国一半大模型公司跑在阿里云上,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。

截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AIChatGLM系列、姜子牙通用大模型等,大模型厂商与阿里云一同面向客户。

百川智能是中国最头部大模型创业公司之一,曾创下平均28天迭代一版大模型的纪录。王小川介绍,百川大模型快速的快速迭代和部署离不开云计算的支撑,百川智能和阿里云作为紧密的合作伙伴进行了深入合作。在双方的共同努力下,百川很好地完成了千卡大模型训练任务。

大模型也在反哺阿里云,阿里云成为一朵走向“自动驾驶”的云。周靖人表示,“基于阿里云通义大模型,我们对云上产品也进行了AI化改造,超过30款云产品具备了大模型的能力,带来了开发效率的大幅提升。”

例如,阿里云大数据治理平台DataWorks新增了全新的交互形态——Copilot,用户只需用自然语言输入即可生成SQL,整体开发与分析可提效30%以上。阿里云容器、数据库等产品上也提供了类似的开发体验,未来这些能力还将集成到阿里云其他产品上。

阿里云用大模型驱动云计算进化,云平台加持大模型,并不依靠大模型本身赚钱,更重要的是找到自己的生态角色,开源开放的大模型与AI基础设施不断迭代,为其提供了循环往复的动力。

在全新的大模型时代,阿里云又踏上一个新的开始。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-01 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

从云栖大会,看阿里的科技本色
...办。今年,在 AI 技术火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2
2023-11-01 23:02:00
通义千问 再次“激活”阿里云
ChatGPT 掀起了又一波 AI 大战,阿里是最新加入战局的巨头,之一。4 月 11 日,阿里巴巴董事局主席张勇,在阿里云峰会上正式发布了阿里的大语言模型工具「通义千问」,并宣
2023-04-14 10:49:00
阿里云宣布推出通义万相 AI 绘画大模型
2023世界人工智能大会期间,阿里云宣布推出通义大模型家族新成员通义万相。据介绍,这是一款进化中的AI绘画模型,支持文生图等功能。目前,通义万相已经上线,并正式面向公众展开邀测。
2023-07-07 22:27:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
阿里云CTO周靖人:全面投入升级AI大基建
快科技9月19日消息,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训
2024-09-19 15:53:00
蔡崇信:中国八成科技企业和一半大模型公司都跑在阿里云上
阿里巴巴蔡崇信、吴泳铭、王坚同时亮相云栖大会。10月31日上午,2023云栖大会在杭州云栖小镇开幕,阿里巴巴集团董事会主席蔡崇信表示,在当下的智能化时代,阿里巴巴“要打造AI时代
2023-10-31 22:40:00
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,
2025-02-21 23:22:00
阿里云通义大模型家族迎来新成员,通义万相已开启定向邀测
...:钱江晚报潮新闻客户端 记者 张云山继通义千问之后,阿里云通义大模型家族迎来新成员。7月7日,在2023世界人工智能大会上,阿里云宣布AI绘画创作大模型通义万相开启定向邀测,
2023-07-07 16:55:00
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...恍惚,仿佛坐上了时光机来到数年前。云栖小镇处处有着阿里云创立早期的样子——书写着“计算,为了无法计算的价值”的巨大标语在会场四处可见,这是阿里云刚创立时的slogan,一直到
2023-11-03 14:33:00
更多关于科技的资讯:
聚焦2025中国国际数字经济博览会·访谈|沈昌祥:发挥优势,不断筑牢人工智能安全底座
发挥优势,不断筑牢人工智能安全底座——访中国工程院院士沈昌祥中国工程院院士沈昌祥。 河北日报记者 李东宇摄2025中国国际数字经济博览会的主题为“可信数据赋能产业发展”
2025-10-18 08:25:00
10月17日,2025中国国际数字经济博览会,一款AI绘画机器人精准识别人脸神态,快速绘画出人脸素描,被这只机械臂画得心服口服。(摄制:苏畅、白中豪、朱泊宇)
2025-10-18 08:27:00
深化开发利用,让高质量数据“动”起来——2025中国国际数字经济博览会探新之一机器人亮绝活、大模型总动员、虚拟空间沉浸体验……10月17日
2025-10-18 08:37:00
厦门网讯(厦门日报记者 薛尧)苹果iPhone17 Air昨日正式开启预售,这款取消实体卡槽、仅支持eSIM(嵌入式虚拟SIM卡)的新机
2025-10-18 08:59:00
近日,建设银行正式启动“‘享趣’玩·惠游中华”信用卡活动,为客户提供涵盖景区票务、特色餐饮、文创消费等多方面的用卡优惠
2025-10-18 10:41:00
海信贾少谦:AI重塑企业管理模式,打法要快,生意要慢
10月17日,第十五届中国管理·全球论坛暨首届“中国企业管理最佳实践榜”发布盛典在青岛举办。作为C50+2025年度轮值企业家召集人
2025-10-18 10:57:00
竹溪县数字经济产业链招商签约超亿元
十堰广电讯(全媒体记者 白孟尧 通讯员 付延峰)竞逐数字经济新赛道,孕育产业链招商硕果。10月18日,湖北十堰竹溪县竹溪数字经济产业链招商暨2025“国芯一号”生态合作伙伴大会在桃花岛夯土小镇举行
2025-10-18 13:47:00
东南网龙岩10月17日讯(通讯员 陈碧霞)近日,工行龙岩漳平支行组织青年志愿者主动深入当地企业园区,精心开展集“个人金融产品精准营销”与“金融反诈知识普及”于一体的“一站式”综合服务活动
2025-10-18 16:32:00
烟台银行荣登2025上半年度高质量数字化转型十大典型案例榜单
近日,由中国信通院主办的以“洞见十五五”为主题的2025数字生态发展大会暨“铸基计划”年中会议在北京盛大召开。会上,烟台银行联合长亮科技申报的《DataOps赋能烟台银行建设高质量智能数据中枢》案例
2025-10-18 17:45:00
视源股份广交会展示AI全场景创新实力,机器人机器人系列产品亮相成焦点
在第138届中国进出口商品交易会(广交会)上,视源股份以“AI+未来教育、AI+企业服务、AI+机器人、AI+生活”为主线
2025-10-18 18:18:00
本土智造重磅升级,医科达将八度亮相进博
第八届中国国际进口博览会(进博会)进入倒计时,作为八年“全勤生”,全球精准放疗先锋医科达将以“共建本土生态,共筑抗癌未来”为主题
2025-10-18 18:42:00
不用等到20号了!现在来京东11.11 iPhone 17 Pro系列可领300元惊喜券
每年11.11对于广大果粉而言无疑是换新的绝佳时机,无论是追求最新款还是预算有限入手上一代机型都能享受到极具吸引力的价格
2025-10-18 18:43:00
破局重构引领前行,联众优车持续锻造二手车服务新基建
近年来,在国内汽车消费结构持续升级的背景下,二手车市场已成为拉动汽车消费的重要引擎。特别是随着国家一系列利好政策的推出
2025-10-18 18:43:00
从龙虎到鹤年堂 京东七鲜十月品牌日再造下一个老字号联名爆款
随着“养生年轻化”与“即食化养生”成为主流,当代消费者愈发青睐“轻松养生、即时进补”。如何让传统养生智慧通过自有品牌融入日常
2025-10-18 18:43:00
全时段畅飞 全年不限次:长龙航空“365畅飞卡”10月19日在京东旅行限时开售
国内随心飞历史新低,全时段畅飞、全年不限次!在推出海航随心飞,并创下2天超25万用户下单、2亿销售额的纪录之后,京东11
2025-10-18 18:45:00