• 我的订阅
  • 科技

通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析

类别:科技 发布时间:2023-11-03 14:33:00 来源:36氪

走进云栖大会2023,不少云计算从业者也许会恍惚,仿佛坐上了时光机来到数年前。

云栖小镇处处有着阿里云创立早期的样子——书写着“计算,为了无法计算的价值”的巨大标语在会场四处可见,这是阿里云刚创立时的slogan,一直到七年前才更换;刚踏进算力馆的大门,就能看到几个大字:“数据中心成为一台计算机”,这也是阿里云最早期的设立愿景之一。

△云栖大会现场,36氪拍摄

尽管阿里云表示“并不是有意为之”,但种种迹象汇聚到一起,传递出清晰信号:阿里云要重新聚焦到技术研发本身。

如果说刚成立时,阿里云的目标是要让算力成为公共服务,十五年后,云计算已经成为互联网的基础设施,但“算力”的内涵已经进化到了“AI算力”。

阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。

做AI时代的“电动机”

今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里云正式推出通义千问的2.0版本,参数已达千亿,在各项评测集中,其综合性能已经超过GPT-3.5,加速追赶GPT-4。

通义千问2.0参数已经在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。反映到使用体验上,简单而言,更成熟也更好用了。

不过,对各种参数进展,或是各类评测集上的打分,周靖人只简单略过。相反,他花了很大篇幅介绍今年阿里在底层数据库、容器、模型开发平台、开源社区中的进展。

△来源:阿里云

一个重要原因在于,大模型已经火热了一年有余,但本质上依然是个新生事物。大模型的突破很大程度来源于暴力计算,很多训练都需要在云上进行。但如今的计算基础设施能力,其实还很难跟上大模型的计算所需。

“云计算和GPT的关系,就是电和电动机的关系。”阿里云创始人王坚如此表示。

据晚点报道,周靖人表示,最初阿里云想把几百台(GPU)服务器连起来做训练都很难,云优化一点,大模型才能发展一点。模型发展到一定程度又遇到挑战,又需要云去升级。

正因如此,阿里云这几年都在强调要回归基础计算技术,从底层芯片、数据库、中间件、开发平台都投入了不少人力物力去突破。而大模型如今还在从0到1的创新阶段,底层计算技术突破所带来的意义更甚。

比如,阿里云的PAI(人工智能平台)是训练AI模型的重要工具,通义千问就是基于这一平台训练而来。在本届云栖上,PAI的集群网络架构进行了全新升级,目前支持高达10万卡量级的训练集群规模,超大规模分布式训练加速比高达96%,可节省超过50%的算力资源。

所有这些进展,都会化为未来的AI算力基础设施基础,而大模型也只是未来AI服务的一个重要载体。

要落地产业,先团结开发者

2023年云栖的另一个关键词,是“开放”。

阿里巴巴集团董事会主席蔡崇信在主论坛演讲中重点提及的两个数据是:目前中国80%的科技企业,一半的大模型公司都跑在阿里云之上。以及,AI开源社区魔搭集聚了270万开发者,2300多个模型,模型下载量超过1亿。

和不少大模型厂商重点宣传B端落地不同,阿里云在云栖上重点向另一个群体——开发者发出讯号。“我们要做AI时代最开放的云。”蔡崇信表示。

通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析

△来源:阿里云

除了各项云计算的重要技术发布,阿里云今年还推出了“八大产品模型”,分别为:通义灵码-智能编码助手通义智文-AI阅读助手通义听悟-工作学习AI助手通义星尘-个性化角色创作平台通义点金-智能投研助手通义晓蜜-智能客服通义仁心-个人专属健康助手通义法睿-AI法律顾问

值得注意的是,阿里云先推“产品模型”而非“行业模型”,显示出其战略的不同。阿里云更希望的是,提供底层的芯片、中间件、开发平台到上层的开源模型,然后让开发者、AI初创企业来集成、做应用,在各个行业里落地。

周靖人强调,阿里云推八大产品模型,并非为了直接To C提供服务,而是To B。这更多是像个面向客户的Demo,让客户先了解到大模型能做什么。

“要做最开放的一朵云,我们说到做到。这些应用模型我们都会开放API,欢迎开发者将上述的模型能力集成到自己的大模型应用和服务中。”他表示。

要把开发者团结起来,这是如今大模型落地的必选项——开发者的含义也变得更广泛,不只是行业集成商、AI初创,更多AI独立的开发者,也都是阿里云如今希望覆盖到的群体。

截至10月,阿里云已与60多个行业头部的集成商、独立软件开发商进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

不过,36氪走访会场发现,云栖大会的人工智能展区中,参会的大模型厂商更多还是宣传自身的技术突破和进展。在各个行业中真正落地的案例还是偏少数。

有参会的大模型厂商告诉36氪,目前To B的项目大部分都还正在试点中,央国企的财政预算都是今年年底开始做计划,起码要到明年中旬,才会有比较多的落地实践。

大模型要在B端的生产环节中真正应用起来,还有很长一段的距离。

时灵时不灵,是当前大模型落地最大的障碍。据API Bank统计,即使是简单调用API,如今GPT-3.5的调用成功率也只在55%——对很多企业的生产环境而言,是无法接受的。上一波以人脸识别为主的AI浪潮,成功率基本要到95%以上才能真正可用;到最严格的自动驾驶场景,成功率更是需要达到99.9999999%(小数点后7个9),也就是说,几乎不能出错。

单纯靠大模型厂商来解决技术难题、做行业化落地并不现实。把开发者团结起来,一起突破工程化上的难题,这能加速大模型落地的实践。

对此,阿里云也实打实地放出了不少技术和产品支持,给开发者不仅提供“厨具”,也提供做饭原料。

此前,阿里云已先后开源7B和14B版本模型,周靖人表示,接下来的11月,阿里云还将开源720亿参数版本的通义千问大模型——这已经是一个能在大部分B端场景中进行商用的参数量级。

而从算力到开发工具,阿里云也有值得关注的产品,新推出的大模型应用开发平台“百炼”,就集成了国内外主流的优质大模型,为用户简化了底层算力部署、模型预训练、部署等环节。在算力层,“云工开物”还给中国4000多万高校学生每人送一台价值300元的云服务器,可以满足不少基础编程场景。

某种程度上,这和阿里云这几年重点讲的“被集成”战略一脉相承。经历了移动互联网浪潮而腾飞,阿里云如今仍是年收破千亿、国内第一的云厂商。但在全球云市场都还在苦苦应对增长放缓的背景下,云厂商想要吃到大模型带来的红利,还需耐心等待。

开放和团结,是当下最好的答案。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-03 18:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国企业调用大模型日均超10万亿Tokens,阿里通义份额第一
...场大模型的日均总消耗量为 10.2 万亿 Tokens,其中,阿里通义占比17.7%位列第一,成为目前中国企业选择最多的大模型
2025-09-01 13:55:00
2023年云栖大会,这些AI创业者有话要说
...科技高级业务专家刘姚峰介绍说,朗新科技基于阿里云的通义千问打造了电力行业的大模型,构建了行业的各类应用。比如说针对日常可能接触到的电费账单问题,开发了电费账单的智能解读助手。
2023-11-02 17:54:00
数字中国建设峰会抢鲜看:AI大模型“上天入地”融入各行各业
...国邮政与阿里的一个创新项目,背后是视觉生成大模型“通义万相”的能力。过去一年,AI生成内容(AIGC)的行业应用遍地开花,在此外更广阔的领域,AI大模型开始做更多的事,上至天
2024-05-23 17:57:00
五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半
...技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上差异显著
2023-06-08 21:00:00
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、
2024-09-19 15:53:00
阿里云推新 “杠”上讯飞
...企业供图“这不降维battle讯飞吗?”昨日,在朋友圈一张通义听悟的专属口令福利海报下,一位媒体工作者留言道。彼时在粤港湾大湾区的广州,阿里云CTO周靖人对通义听悟给出了如下
2023-06-02 17:45:00
吴泳铭为阿里云带来了什么?
...能为阿里云带来源源不断的收入。同时阿里云自研大模型通义千问取得快速进展,刚刚发布的通义千问 2.5 版本在权威基准 OpenCompass 上得分追平 GPT-4 Turbo
2024-05-21 18:10:00
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评测指标与方法》语言
2023-12-26 14:16:00
怀胎半年“混元”初开,腾讯大模型以慢为快 | 焦点分析
...直接用户其实也是C端。但腾讯暂时没推类似文心一言、通义千问之类的的To C聊天机器人,其实是因为走了另一条验证路径。如今,腾讯内部已经有包括文档、会议、游戏、金融、搜一搜等5
2023-09-11 12:22:00
更多关于科技的资讯:
鲁网9月17日讯万物互联,信息化浪潮奔涌。在数字化转型的过程中,工业互联网平台发挥着中枢神经般的重要作用。企业生产过程的数字化管理
2025-09-17 10:40:00
王涵为了准确识别由AI生成的内容并防止其被滥用,不少人建议用AI对抗AI,“AI溯源”技术应运而生。OpenAI宣布将推出一款工具
2025-09-17 10:52:00
360集团董事长周鸿祎:“超级员工” 是这样炼成的
周鸿祎(本报记者 林铭鸿 摄)厦门网讯 (厦门日报记者 刘艳)大模型相当于头脑,能说会道,能思考、能规划、能推理,但是没有手跟脚
2025-09-17 08:35:00
从高速增长到高质量发展:AI智习室的行业变革与挑战
从高速增长到高质量发展:AI智习室的行业变革与挑战在技术赋能教育的大背景下,AI智习室正成为连接传统教育与未来教育的重要桥梁
2025-09-17 09:03:00
烟台联通圆满完成2025莱州半程马拉松通信保障工作
9月14日,2025莱州半程马拉松正式鸣枪开跑,近5000名来自全国各地的跑步爱好者齐聚莱州,以奔跑感受城市风貌,用激情点燃赛事氛围
2025-09-17 08:06:00
手握101项专利,曜灵时代以创新引擎驱动临沂新能源产业升级
齐鲁晚报·齐鲁壹点 高松作为临沂新能源产业链的代表企业,曜灵时代积极践行绿色发展理念,不断创新和突破科学技术。目前,集团下设多个核心全资子公司
2025-09-17 08:08:00
南报网讯(记者孙琳通讯员焦娇李妍妍)9月15日,全国首个市级场景公共服务平台——“南京场景服务平台”正式上线。记者获悉
2025-09-17 07:45:00
□南京日报/紫金山新闻记者张安琪【实验室档案】新型显示与视觉感知石城实验室,由中央广播电视总台、南京市科技局、东南大学和鼓楼区于2022年8月开始合作共建
2025-09-17 07:45:00
南报网讯(记者曹丽珍)当《哈利·波特》系列电影中的魔法道具“隐身斗篷”有可能从银幕走向现实,如何为这种前沿科研保驾护航
2025-09-17 07:46:00
□南京日报/紫金山新闻记者张甜甜9月正值开学季,各大高校相继迎来新生报到。运满满司机申英良将刚刚收到的“云程奖学金”交到小儿子申宝凯手中——今年
2025-09-17 07:46:00
鹭江观察 | 人工智能+ 厦门加出了什么?
客商体验厦门绽优科技的AI+VR产品。厦门美图大楼展厅演示AI产品。(本组图/厦门日报记者 林铭鸿 摄)●2024年,厦门位列中国人工智能城市排行榜前10●截至去年底
2025-09-16 08:18:00
德资企业威卡荣获2025“大苏州雇主品牌一等奖”及“最具发展潜力奖”
9月12日,2025 "大苏州雇主品牌大赛" 颁奖盛典在苏州广电总台落幕。德资企业威卡中国凭借卓越的雇主形象、优秀的企业文化和突出的商业表现
2025-09-16 08:34:00
记者走基层|“邯郸造”掘进钻车 北极圈矿场上岗
9月15日,河北宏远液压机械有限公司装配车间内,技术人员对智能掘进钻车进行出厂前调试。河北日报记者 陈正摄“臂展伸缩正常
2025-09-16 08:52:00
近期,预制菜话题备受消费者关注。各方讨论背后,是消费者对于知情权的关切以及对提高餐饮质量的诉求。这场讨论也促使餐饮从业者思考
2025-09-16 09:02:00
穿警服直播带货引争议,“嘎子哥”道歉,云南警方已介入
近日,辽宁的李先生向记者反映称,他在观看“嘎子谢孟伟”的直播时发现,其身着人民警察制式服装带货,于是向事发地所属的云南警方报了警
2025-09-16 10:08:00