我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

直面大模型“大成本”挑战，如何提高算力效率？

类别：科技发布时间：2024-06-03 14:07:00 来源：每日看点快看

本文转自：中国新闻网

中新网北京6月3日电 (记者夏宾)近年来，为了追求大模型的智慧能力，各国公司不停加码投入，4月，Meta宣布追加10亿美元投资，用于其AI芯片研发和AI数据中心建设；亚马逊为了建设新数据中心投入110亿美元。但在大模型扩张的背后，算力代价、能源代价同样巨大。

有业界技术团队测算，若要对一个5000亿参数规模的单体大模型进行充分训练，所需算力基础设施约在10亿美元规模，每年消耗的电费在5.3亿元人民币。无论对于哪个机构、企业，这都是天文数字和巨大代价，中国也不例外。

知名科学杂志《Nature》此前发表了一篇关于大模型未来发展之路的文章，《In Al, is bigger always better?》(人工智能，越大型越好？)。争议的出现，意味着AI发展方向出现了分歧。

如今，“大”不再是模型的唯一追求，计算效率和算力开销两大问题成为新的行业焦点。

对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大，优化推理成本的空间也越大。以前的模型都是单机推理，大模型用的是分布式推理。所以如果能把各种各样底层算力用得更好，推理成本就会大大降低。

MoE大模型的盛行，实际上对应的正是模型能力和算力开销两大问题的解决。这也是为何众多大模型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因。

从浪潮信息发布的“源2.0-M32”开源大模型来看，其基于“源2.0”系列大模型已有工作基础，创新提出和采用了“基于注意力机制的门控网络”技术，构建包含32个专家(Expert)的混合专家模型(MoE)，并大幅提升了模型算力效率，模型运行时激活参数为37亿，在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。

浪潮信息人工智能首席科学家吴韶华在接受中新网记者采访时说，我们一直在想如何以更低的算力消耗，提高整个大模型的应用效果，能让企业、机构以更小的算力代价去获得更高的模型能力。“这可能是中国发展自己的AI大模型比较行之有效的路径。”

他直言，大模型推进速度越来越快，必须强调模型算力效率。“大家可以想象，效率越高就意味着在单位算力投入相等的情况下获得的精度回报越高，它对于训练和应用都非常有利。”

“现实的算力是有限的，我们一再反复强调模算效率，试图针对当前算力情况闯出一条自己觉得比较好的路子。在固定每个Token算力不变的情况下，通过扩展专家数量可以获得更大参数量的模型，进而获得更高精度。”吴韶华说。

他进一步称，整体来看，尽管当前模型的能力提升非常之快，但之前大家更多关注单个维度问题，即平均精度的提升。但大模型进入快速落地时代，就不得不考虑更多维度的问题，包括模算效率、精度、算力开销等。

中国工程院院士郑纬民曾做过这样的计算，在大模型训练过程中，70%开销要花在算力上；推理过程中95%的花费也是在算力上。

为解决大模型训练的算力不足问题，郑纬民建议，在推动智能计算中心建设同时也可以利用已有超算系统的空余算力。

郑纬民表示，现有14个国家挂牌的超算系统，每台机器的建设成本都很高，成本在10亿元至20亿元，甚至更高。这些超算系统已经为中国的国民经济发展作出巨大贡献，但有些系统还有空余算力，这些空余算力也可被用来做大模型训练，且经过优化甚至可降低大模型训练成本。

对于近期中国企业的一轮大模型降价，零一万物CEO李开复表示，未来整个行业的推理成本每年降低十倍是可以期待的，且这个趋势是必然的，如此会有更多人用上大模型，这是非常利好的消息。(完)

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-06-03 19:45:04

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,效率,成本,模型,推理,成本的资讯：

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...彦宏在Create2024百度AI开发者大会上，正式宣布发布文心大模型4.0的工具版。李彦宏表示，相比一年前，文心大模型的算法训练效率提升到了原来的5

2024-04-16 13:37:00

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合

2024-11-04 16:00:00

CPU,正在被AI时代抛弃？

...对话可以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院

2024-07-11 16:45:00

DeepSeek首次披露：理论成本利润率545%

...）的方法，并通过一系列技术策略，最大程度地优化了大模型推理系统，实现了惊人的性能和效率。具体而言，在更大的吞吐的方面，大规模跨节点专家并行能够使得batch size（批尺寸

2025-03-01 18:59:00

NeurIPS 2024|水印与高效推理如何两全其美？最新理

...印技术和投机采样（speculative sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本

2024-11-22 09:49:00

国产大模型第一梯队玩家，为什么pick了CPU？

AI一天，人间一年。现在不论是大模型本身，亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世

2024-07-10 20:45:00

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1

2023-02-15 15:47:00

DeepSeek开源惠四方（科技名家笔谈）

...州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek，受到用户热烈欢迎。2025年1月20日，DeepSeek-R1发布上线

2025-02-24 05:52:00

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

【新智元导读】大模型热，企业落地难？就在刚刚，百川智能推出「1+3」产品矩阵，一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」，仅需10分钟就能让企业自主成为

2024-11-04 09:50:00

更多关于科技的资讯：

57家企业在浙江新消费品牌创新大赛胜出消费“潜力股”长啥样

12月12日，2025浙江省新消费创新大赛资源对接活动在杭州举行，会上揭晓了本届大赛的获奖项目。聚焦新技术、新需求、新场景

2025-12-16 08:00:00

“与其扎在低价内卷里互相消耗，不如瞄准高端赛道奋力突围！”上

王水福说，高端路上很辛苦，但高端路上不拥堵。全球约80%的新商用飞机上都有“西子造”，每年为全球提供约65万个零部件。 “与其扎在低价内卷里互相消耗

2025-12-16 08:00:00

探究企业文化对企业管理的影响

陈勇摘要：企业文化是企业战略管理的重要支撑力量，其价值观、行为+准则等核心要素深刻影响企业战略的制定、实施与调整。契合企业发展需求的企业文化

2025-12-16 06:57:00

珠宝品牌营销服务质量评价指标体系构建及应用研究

李玲摘要：随着珠宝行业的竞争加剧，服务质量在消费者购买决策中占据越来越重要的地位。本文结合珠宝行业特点及服务营销理论，构建了一套全面系统的营销服务质量评价指标体系

2025-12-16 06:57:00

耳鸣掩蔽疗法：用声音治疗声音

冯智华蓥市人民医院在安静的夜晚，耳边却持续萦绕着嗡嗡声、蝉鸣声或嘶嘶声，这种“无中生有”的声音困扰着不少人，这就是耳鸣

2025-12-16 06:57:00

AI时代下新支付方式造出更多新消费场景

AI时代下的日新月异正加速向更多领域蔓延，支付便是其中之一。对着手机说两句话，在10秒不到的时间里完成咖啡点单，这是杭州白领小露最近每天都在尝试的“新玩意儿”

2025-12-16 07:29:00

零距招聘+创业孵化让“追梦人”实现理想长庆街道打造“企航

进入求职迷茫期，在社区的服务驿站，找到了职业赛道新方向，还解决了工作问题？没错！这两天，在汇金国际工作的张先生，一个月前离职正在考虑转变职业赛道

2025-12-16 07:29:00

金堰社区：党建赋能“她”力量，直播筑梦新斜塘

江南时报讯为激活数字经济时代社区创业活力，助力居民尤其是女性群体拓宽就业创业路径，苏州工业园区斜塘街道妇联联合金堰社区党支部

2025-12-15 14:25:00

体育用品产业创新加速器获奖企业出炉，聚焦材料、物流、数字化三

12月12日，在清华大学技术创新研究中心主办的全球开放式创新论坛期间，由安踏集团与璞跃中国联合发起的“体育用品产业创新加速器”（下称“加速器”）颁奖典礼在上海举行

2025-12-15 14:26:00

银泰百货绿色实践获认可，入选中国商业联合会2025年度创新案

12 月 15 日，银泰百货的 “绿色商场” 建设实践通过评审，成功入选中国商业联合会2025年度绿色消费创新案例。此次一同入选的还有喜茶

2025-12-15 14:26:00

年终消费季再添一把火！“购在中国·2025山东家居焕新消费季

鲁网12月15日讯年终消费市场迎来政策与科技双轮驱动的“强心剂”。2025年12月14日，由山东省智能家居协会主办，银座家居

2025-12-15 14:39:00

蚂蚁集团AQ升级为“蚂蚁阿福”：从医疗到健康从AI工具到A

12月15日消息，蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”，并发布App新版本，升级健康陪伴、健康问答、健康服务三大功能

2025-12-15 15:16:00

从品质定制到品牌闭环：中粮福掌柜以联名专供驱动供应端与餐饮端

近日，中粮餐饮旗下专业餐厨品牌福掌柜与知名川菜品牌龙人居联名推出福掌柜非转基因压榨一级玉米胚芽油，在行业内引发了深度关注

2025-12-15 15:22:00

技术+生态+服务三向发力聊城“惠循环”平台焕新惠民路径

鲁网12月15日讯（记者泮晓阳）12月15日上午，聊城市政府新闻办公室召开“水城有约·惠享两节”2026聊城元旦春节促消费兴文旅主题新闻发布会

2025-12-15 15:54:00

瀚康荟（德州）健康科技有限公司刘勇：儒缘汇德州，大道砥初心

刘勇“富而好礼，利以义制；居敬而行简，以临其民。”当我第一次驻足于儒商研究会，孔孟故里的微光，便悄然照进了我四十年的商海生涯

2025-12-15 15:55:00

头条订阅服务

直面大模型“大成本”挑战，如何提高算力效率？