• 我的订阅
  • 财经

阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用

类别:财经 发布时间:2025-02-21 23:22:00 来源:澎湃新闻

阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用

阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。

2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(Qwen)系列模型的下载量达到了1.8亿,累计衍生模型总数达到9万个,衍生模型数已经超越Meta的Llama系列,成为了全球第一大开源模型系列,并在Hugging Face等第三方榜单和用户反馈上也取得了不错的成绩:“所以现在开始,我们就是一个千问的时代,而不是之前Llama的时代了。”

今年1月底,阿里发布了AI基础大模型千问旗舰版Qwen2.5-Max,在多项权威基准评测中处于业界领先水平。黄斐表示,Qwen2.5-Max的性能已经超越了DeepSeek-V3,不过没有超越作为推理模型的DeepSeek-R1,正如阿里巴巴集团CEO吴泳铭此前所透露的那样,通义千问正在Qwen2.5-Max的基础上建立推理模型,“很快就会把这个模型放出来”。

据黄斐介绍,Qwen2.5已经开放了7个不同规模的Dense(稠密)模型,基于传统的Transformer架构,从规模最小的0.5B到最大的72B,不同大小的模型会有不同的能力和速度,以适配不同场景的需求。同时,在千问系列的迭代中,预训练数据的大小已经从Qwen1.5-72B时的3T迅速增长到了Qwen2.5-72B的18T,通过规模化法则(Scaling Law)达到了很好的效果。

此外,Qwen2.5还包括3个采用MoE(混合专家模型)架构的API(应用程序编程接口)模型,在Dense模型的基础上“加宽加大”以减少训练代价,用户可以通过API去调用,包括Turbo、Plus和Max这三个版本。

除了为用户提供充分的选择以外,黄斐还揭露了另一个让千问系列如此受欢迎的“秘诀”,即其支持包括中英文、日语、韩语、西欧各国语言在内的超过29种语言:“千问现在在东南亚国家也用得非常多,在多语言支持上会比其他模型好很多。”

对于未来的发展方向,黄斐谈到推理模型、“Smarter Models(更智慧的模型)”和全能模型(Omni Models)。黄斐解释道,接下来放出的千问推理模型“会比大家现在能用到的更好一些”,而“更智慧的模型”不仅会更聪明,还包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型,在输入输出方面更加自由。

黄斐认为,在模型之外,AI Agent(智能体)也是一个需要重点关注的领域:“未来的一段时间内,AI Agent一定也是一个比较火热的话题。它能够帮助我们解决比较复杂的任务,尤其是结合近期推理模型的发展,我相信最终很多行业都可以运用到这个模型的能力,去完成现在只能由人完成的任务。”

据魔搭社区技术负责人陈颖达在该论坛上的介绍,自2022年11月创建以来,目前,魔搭社区的模型总量已超过4.5万个,涵盖LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,魔搭社区已经服务超过1100万开发者。

在21日的GDC大会上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。其中,Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达 204 帧的视频;Step-Audio则是业界首个产品级开源语音模型,参数规模达1300多亿。目前,这两款模型均可在魔搭社区下载和体验。

2月20日晚间,阿里巴巴集团公布新季度业绩,该季度营收2801.5亿元,预估2773.7亿元,同比增长8%。阿里云季度营收317.42亿元,同比增长13%,公共云收入持续两位数增长,AI相关收入连续六个季度三位数增长,调整后EBITA增长33%至31.38亿元。

阿里巴巴集团CEO吴泳铭在财报会上表示,面向未来,阿里巴巴将继续专注三大业务类型:国内外电商业务、AI+云计算的科技业务、互联网平台产品。未来三年,阿里将围绕AI这个战略核心,在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入。其中,集团未来三年在云和AI的基础设施投入预计将超越过去十年的总和。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-22 05:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ai实验室阿里通义将推出创新视频生成大模型
9月14日,CNMO获悉,阿里巴巴集团的AI实验室阿里通义宣布,将在即将举行的云栖大会上推出一款创新视频生成大模型。目前,该模型的预约通道已在通义App及通义万相PC平台上开放,
2024-09-15 02:18:00
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...n的效果比其他模型好得多。”华东理工大学·X-DLab(心动实验室)成员颜鑫表示,团队只用20万tokens的数据微调了Qwen基座模型
2023-12-01 21:07:00
大模型下探音视频AI市场,战争才刚刚开始 | ToB产业观察
...的同时,也在迅速推进大模型+的创新。例如从早期的iDST实验室到达摩院,阿里2019年开始投入大模型,2021年训练实现10万亿参数的多模态大模型M6
2023-06-07 14:00:00
2023年云栖大会,这些AI创业者有话要说
...诗句、一景一故事的李白在百诗之中畅游的畅快感。通义实验室:数字分身可迅速AI试衣来自通义实验室XR产品运营龚琪莹,则是介绍了XR-3D打印技术。今年曾火爆一时的妙鸭相机“妙鸭
2023-11-02 17:54:00
AI拜年火了,通义千问上线一张照片生成拜年视频
...人像生成难度更高、技术更复杂。针对该问题,阿里通义实验室项目组研发了一种multi-id人像生成方法,实现了一次多人人像推理的能力,使得生成效率提升1倍以上;同时,基于全家福
2024-02-05 13:37:00
如视与阿里通义实验室达成合作,共赴数实融合新未来
...视(北京)科技有限公司(以下简称为“如视”)与阿里通义实验室(以下简称为“通义实验室”)达成合作。双方在三维采集和重建领域有着共同的目标和愿景,通过本次合作,如视与通义实验室
2024-03-20 19:35:00
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐
2024-12-05 09:45:00
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试
2024-06-24 09:22:00
成本不到150元!26分钟训出个推理模型 媲美o1和R1
...AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩DeepSeek-R1和o1
2025-02-07 15:14:00
更多关于财经的资讯:
多因素催化锂电板块走强
11月13日,锂电板块成为资金集中涌入的核心赛道。Wind数据显示,锂电池指数(884039.WI)当日大涨6.40%
2025-11-15 07:06:00
11月以来机构调研聚焦成长与防御方向
11月以来,A股市场机构调研热度持续升温,超695家上市公司获机构走访调研,覆盖电子元件、半导体、电气设备、医药生物等多个核心行业
2025-11-15 07:06:00
海外用户活跃,小红书44个国家地区用户参与身边写作大赛
近日,小红书罕见地透露了一组海外用户相关数据。在第二届身边写作大赛中,来自44个国家地区、232个城市的用户参与了投稿
2025-11-15 18:32:00
54股11月回购逾2000万元
根据Wind数据统计,截至11月14日,11月已有220家公司实施回购,其中,54家公司回购金额超过2000万元。从二级市场来看,三元股份、壹石通、棕榈股份等股股价11月涨幅居前
2025-11-15 20:37:00
一周合辑|太保、新华、众安前10月保费收入出炉;青海银行迎新董事长、行长、副行长
监管国家发展改革委等10部门:深化物流数据在金融行业的应用,优化融资、保险等产品服务国家金融监督管理总局发布《银行保险机构许可证管理办法(征求意见稿)》最高法拟定
2025-11-15 21:32:00
因贷款风险分类不准确等,浙商银行深圳分行被罚330万元
11月13日,深圳金融监管局行政处罚信息公示表显示,浙商银行深圳分行因“贷前调查不尽职;集团客户授信管理不到位;贷款风险分类不准确”
2025-11-15 21:44:00
越秀产业基金、远景能源等成立私募股权投资基金
近日,南昌越秀远景私募股权投资基金合伙企业(有限合伙)成立,出资额3.9亿元,经营范围包含:以私募基金从事股权投资、投资管理
2025-11-14 15:00:00
格力集团、华发集团成立特资资产运营管理公司
近日,珠海市特资资产运营管理有限公司成立,法定代表人为李毅强,注册资本为1000万元,经营范围包含:自有资金投资的资产管理服务
2025-11-14 15:00:00
浙江欣旺达动力系统公司注册成立
近日,浙江欣旺达动力系统有限公司成立,法定代表人为刘桂松,注册资本为5000万元,经营范围包含:电池制造;电池销售;货物进出口
2025-11-14 15:00:00
阳光财险“爱心助考”公益活动入选2025人民企业社会责任案例
近日,由人民网主办的“2025人民企业社会责任论坛”发布“2025人民企业社会责任案例”。阳光财险“爱心助考”公益项目活动凭借在社会责任与公益实践方面的持续深耕和扎实实践
2025-11-14 15:10:00
并行科技、直真科技合资成立算力科技公司
近日,郑州直真并行算力科技有限公司成立,注册资本1000万元,经营范围包含:数据处理和存储支持服务;计算机系统服务;物联网技术服务;通信设备制造等。企查查股权穿透显示,该公司由并
2025-11-14 15:12:00
八亿时空成立科技公司,包含AI应用软件开发业务
近日,北京八亿云科技有限公司成立,法定代表人为赵雷,注册资本为1000万元,经营范围包含:人工智能应用软件开发;物联网技术服务
2025-11-14 15:12:00
逾六成股票上涨 沪指收盘创阶段新高 机构认为市场热点或现“高低切换”
周一,A股大小指数分化。沪指午后震荡走高,收盘点位创阶段新高;创业板指跌幅收窄,收盘下跌0.92%。盘面上热点快速轮动
2025-11-14 15:36:00
民生银行泉州分行:“知识产权贷”破解融资难,助力企业“知产”变“资产”
为深入服务泉州实体经济,民生银行泉州分行积极响应市委金融办深化“政银企担”合作的部署,以名单制对接企业需求,精准施策,推动金融服务落地见效
2025-11-14 15:52:00
吉视传媒成立智家商贸公司,含AI及集成电路业务
近日,吉视智家商贸(吉林省)有限公司成立,法定代表人为金永东,经营范围包含:人工智能基础软件开发;人工智能应用软件开发;集成电路芯片及产品制造;集成电路设计等。企查查股权穿透显示
2025-11-14 16:00:00