• 我的订阅
  • 头条热搜
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
快科技3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用...……更多
昨天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习,它在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...动率先将大模型的使用价格,调低至“厘”时代,百度、阿里、腾讯等巨头纷纷跟进,迅速将大模型推至免费时代。大模型免费时代加速到来5月15日,火山引擎云服务平台,发布了国内首批通过算法备案的“豆包大模型”,主力...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿里云还发布了包括编程、AI阅...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Face低调上传了两个参数规模分别为6B和34B的基础模型。截至11月5日,Y...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级,加速迈向年轻人工作、学习...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
阿里通义千问已成全球第一大开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、阿里、腾讯等企业控制成本、提升模型性能、应对大模型“价格战”的新方向。MoE的内涵、优势、发展历程及主要玩家MoE(MixtureofExperts,混合专家模型)是一种用于提升...……更多
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
快科技1月16日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多
阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加...……更多
大模型时代的阿里云,将云计算进行到底
...的关系,考验着云厂商的战略意识。2023年云栖大会上,阿里云CTO周靖人表示:“面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。”在现场,周靖人...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...平台宣布上线DeepSeek- R1大模型。近日,华为云、腾讯云、阿里云、百度智能云等国内主流云平台纷纷宣布上线R1大模型。2月5日,移动云宣布全面上线DeepSeek,实现全版本覆盖、全尺寸适配、全功能畅用。中国移动覆盖全国的13个...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...。夸克大模型性能评测夺冠四大能力提升用户效率日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克大模型的整体水平超越GPT-3.5,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新MILA模型
Mamba 是一种具有线性计算复杂度的状态空间模型,它能够以线性计算复杂度实现对输入序列的有效建模,在近几个月受到了广泛的关注。本文给出了一个十分有趣的发现:强大的 Mamba 模型与通常被认为性能不佳的线性注意力有...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...包大模型将处理输入文本的价格定在 0.8 元 / 百万 Tokens,阿里则把对标 GPT-4 的 Qwen-Long API 输入价格降到 0.5 元 / 百万 Tokens,百度更是宣布主力模型文心一言 ERNIE Speed 和 Lite 模型免费使用。大幅降价背后,除了短期的市场竞争因……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...对比实验,结果证明了RECIPE性能的优越性。 这项研究由阿里安全内容安全团队与华东师范大学计算机科学与技术学院、阿里云计算平台针对大语言模型知识编辑的联合推出。研究背景即使有非常强大的语言理解能力,像ChatGPT这...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
从云栖大会,看阿里的科技本色
...办。今年,在 AI 技术火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...d大约有2000亿个参数。相比之下,GPT-3.5有1750亿个参数。 阿里云首席商业官蔡英华离职阿里云首席商业官蔡英华(花名:华琰)已于12月13日正式卸任,从阿里云正式离职。蔡英华是阿里云近两年推进政企业务的关键人物。他在20...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...索的技术底座。夸克大模型四大能力提升用户效率日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克大模型在多语言翻译、写代码、...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...参数模型Falcon180B,国内8、9月份推出的开源大模型则包括阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。近日,香港中文大学贾佳亚团队还联合MIT发布长文本开源大语言模型LongAIpaca,号称全球首个70B参数长文本开源大..……更多
阿里云CTO周靖人:全面投入升级AI大基建
快科技9月19日消息,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成...……更多
...的高度关注。该模型名为s1。随后,该模型被曝出是基于阿里巴巴旗下中国人工智能实验室Qwen提供的一款小型、现成的免费人工智能模型。为了训练s1,研究人员创建了一个仅包含1000个精心策划的问题的数据集,以及这些问题的...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...,凭借70亿参数碾压 Llama2-13B(130亿参数);国内市场,阿里宣布开源720亿参数的大语言模型通义千问Qwen-72B,性能超越标杆Llama2-70B,号称最强中文开源模型。大模型开源、闭源的路线之争向来是热点话题,不少行业大佬也发表...……更多
更多关于科技的资讯:
IDC数据出炉:2024年华为穿戴出货量在700美元以下市场登顶全球第一
根据IDC最新发布的《全球可穿戴设备市场季度跟踪报告》显示,尽管2024年全球腕戴设备市场出货1.9亿台,同比下滑1.4%
2025-03-11 05:58:00
AI眼镜赛道,迎来一位81岁「创业者」
文|田哲‍‍编辑|苏建勋当你满怀激情勾勒出一幅全新创业蓝图时,蓦然回首却发现:曾经并肩作战的商业伙伴已隐入幕后,会议室里跃动的都是年轻面孔——这正是81岁的范钦强正在面对的现实
2025-03-11 05:58:00
长文解读并购市场,「买卖」双方怎么看?|OpenTalk回顾
资本市场新阶段已开启,企业并购需在复杂环境中寻找最佳路径。‍‍‍‍‍‍‍‍‍文 | 刘婧琼 编辑 | 阿至 2025年 2月 26 日
2025-03-11 05:58:00
LV开卖美妆;Adidas中国业绩七连增;Chanel开出地级市首店|品牌周报
赶上末班车,路易威登终于开卖美妆了LVMH旗下最大奢侈品牌路易威登(Louis Vuitton)成为最迟入局美妆领域的顶奢
2025-03-11 05:58:00
71岁董明珠,困在个人英雄主义里
最近,董明珠俨然成了舆论焦点。又是把格力改革成“董明珠健康家”,又是宣扬自己71岁也不退休。更名后格力股票全线飘绿,部分观点认为董明珠个人IP可能稀释格力品牌价值
2025-03-11 05:58:00
上汽大众总经理:我们的汽车标准比国产车高 在国内降本机会多的是
快科技3月10日消息,全新上汽大众途昂Pro上市,共推出3款车型,一口价26.99-31.99万元,一同上市的还有途昂X和途昂
2025-03-11 00:48:00
曝理想MEGA上市时被5-6家车企抹黑 有车企高管被喊去调查
快科技3月11日消息,据“电厂”报道,当前国内各家车企为了大家黑公关,基本上都开通了法务部账号,并且许诺高额奖励公开征集黑公关线索
2025-03-11 01:18:00
本文转自:人民日报海外版熊 建1927年,德国导演弗里茨·朗在科幻电影《大都会》中,描绘了机器人替代人类劳动的场景。片中机械人玛丽亚身披金属外壳
2025-03-11 03:49:00
近日,国家工业与信息化部办公厅公布2024年度绿色制造名单,中车戚墅堰机车有限公司被评为“2024年国家绿色供应链管理企业”
2025-03-11 05:34:00
淘宝亮剑!治理恶意店群,守护商家与消费者双权益
3月10日消息,据淘宝官方规则网站显示,于3月4日起正式生效《淘宝网开店规范》《淘宝网市场管理与违规处理规范》《淘宝网关于无货源店铺实施细则》等平台规则的调整
2025-03-11 05:34:00
本文转自:人民日报“科技创新和产业创新,是发展新质生产力的基本路径。”20多年来,我从一名普通操作工成长为技术专家。在重庆市大渡口区政府支持下
2025-03-11 06:06:00
微众银行:提升数字化智能化服务水平  精准有效支持民营经济发展
本文转自:人民日报微众银行作为我国首批成立的民营银行之一,自2014年成立以来,始终坚守“让金融普惠大众”的使命,瞄准小微企业融资的难点和痛点
2025-03-11 06:07:00
本文转自:环球时报近日,上海海关发布消息称, 2024年上海港汽车吞吐量达363万辆,同比增长15%,超越了比利时安特卫普-布鲁日港(该港也是中国汽车登陆欧洲的主要港口)
2025-03-11 06:53:00
3月6日,沃尔玛全球电商在“2025沃尔玛全球电商启动大会”上,公布了2025新卖家激励计划。该计划涵盖佣金减免、官方物流优惠以及广告抵用金等
2025-03-11 07:15:00
国内首款!超长寿命碳-14核电池研制成功
快科技3月11日消息,据报道,由无锡贝塔医药科技有限公司与西北师范大学科研团队联合研制的国内首款C-14核电池“烛龙一号”工程样机成功问世
2025-03-11 07:18:00