模型,效率,成本,模型,推理,成本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...闻网中新网北京6月3日电 (记者夏宾)近年来，为了追求大模型的智慧能力，各国公司不停加码投入，4月，Meta宣布追加10亿美元投资，用于其AI芯片研发和AI数据中心建设；亚马逊为了建设新数据中心投入110亿美元。但在大模型扩...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...彦宏在Create2024百度AI开发者大会上，正式宣布发布文心大模型4.0的工具版。李彦宏表示，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

CPU,正在被AI时代抛弃？

...对话可以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

DeepSeek首次披露：理论成本利润率545%

...）的方法，并通过一系列技术策略，最大程度地优化了大模型推理系统，实现了惊人的性能和效率。具体而言，在更大的吞吐的方面，大规模跨节点专家并行能够使得batch size（批尺寸）大大增加，从而提高GPU矩阵乘法的效率，...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型

NeurIPS 2024|水印与高效推理如何两全其美？最新理

...印技术和投机采样（speculative sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

国产大模型第一梯队玩家，为什么pick了CPU？

AI一天，人间一年。现在不论是大模型本身，亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般，虽然AIGC目前还处于起步阶段，但市场规模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

DeepSeek开源惠四方（科技名家笔谈）

...州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek，受到用户热烈欢迎。2025年1月20日，DeepSeek-R1发布上线，7天内用户超过1亿。ChatGPT从发布到达到相同的用户规模用时两个月。GitHub是全球最大的代码托管网站，Gi...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

【新智元导读】大模型热，企业落地难？就在刚刚，百川智能推出「1+3」产品矩阵，一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」，仅需10分钟就能让企业自主成为模型定制增强专家，实现行业最...……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

当大模型Scaling Law继续,万卡集群算力释放在百舸找

...一世纪什么最贵？人才！」而随着人工智能行业进入到大模型时代，这一问题的答案已然变成了「算力」。随着模型规模急剧扩张，参数已经飙升到了千亿甚至万亿级，业界开启了千模大战，AI 算力需求不可避免迎来爆炸式增长...……更多

2024-09-26 13:37:00万卡,百舸,通途,集群,模型,百舸

chatgpt低成本复现流程来了

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需 1.62GB 显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch，单机训练速度最...……更多

2023-02-17 14:37:00流程,成本,模型,训练,内存,参数

谷歌发布gemma2大语言模型，共有两种大小

...布新闻稿，面向全球研究人员和开发人员发布Gemma2大语言模型，共有90亿参数（9B）和270亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

模型即服务，卓世科技MaaS平台 2.0 正式上线

引言：MaaS(ModelasaService，模型即服务)是一种将人工智能算法模型及其相关能力封装成服务，以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度，并提升人工智能技术的综合应用效能的模式。上新了...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

大模型价格战“卷”向何方？｜深度

...你降价，我免费。在经过一年多的“百模大战”后，AI大模型从5月初几乎毫无预兆地掀起了“降价潮”，阿里、百度、腾讯等纷纷加入战团。大厂“钱多、卡多、算力足”无惧价格战，以惯有的免费模式先聚集用户与开发者。中...……更多

2024-05-25 10:34:00何方,价格战,深度,模型,价格,模型

$IDC：中国大模型推理市场爆发，九章云极以\\\$

IDC：中国大模型推理市场爆发，九章云极以\"普惠算力\"领

近日，IDC发布《2025中国大模型推理算力市场分析报告》指出，大模型与生成式AI的推理算力建设已成为当前产业发展的关键环节。报告预测，2024年中国生成式AI基础设施市场规模将达到2091.9亿元。九章云极凭借在AI基础设施市场...……更多

2025-08-08 20:05:00普惠,赛道,中国,推理,基础设施,模型

摆脱Transformer依赖？这家AI初创公司推出国内首个

文 | 苏建勋Transformer是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构，凭借强大的自然语言理解能力，Transformer在问世的短短几年内便取代了传统的RNN网络结构，成为自然语言处理领域的主流模型架构。如今，一家创业...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

大模型降价背后，国产大模型的竞争逻辑变了

配图来自Canva可画随着人工智能技术的快速发展，大模型以其强大的数字处理能力和深度学习能力，不断与各领域交叉融合，逐步成为产业创新的关键抓手，和驱动新质生产力的关键引擎。据国家最新公布的数据显示，截至今年...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

36氪首发｜打造分布式AI开发和部署平台，「潞晨科技」完成数

...。众所周知，如今生成式AI的“涌现”能力来自于底层大模型的成熟，但训练大模型需要的算力、网络、数据成本非寻常公司能承受。而本文主角潞晨科技，希望为这一难题提供解法。潞晨科技成立于2021年，主要业务是通过打造...……更多

2023-05-22 09:14:00数亿,分布式,融资,开发,平台,科技

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

9月5日，腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

李彦宏再谈开源：开源模型是智商税，永远应该选择闭源模型

“今天无论是ChatGPT、还是文心一言等闭源模型，一定比开源模型更强大，推理成本更低。”在2024世界人工智能大会（WAIC 2024）期间，百度创始人、董事长兼首席执行官李彦宏，与第一财经传媒集团总编辑杨宇东和《硅谷101》创...……更多

2024-07-31 16:00:00模型,李彦,智商,选择,模型,李彦

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

智东西11月5日报道，今日，腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源，并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

京东云发布八大领先智算产品，助力企业火速用上大模型

...，京东云发布八大极致性价比的智算产品，五种全场景大模型部署模式，同时推出“开发训练+场景应用”双引擎一站式平台，助力企业实现DeepSeek等大模型开箱即用、智能体深度开发与应用，全面打通从模型落地到产业智能升级...……更多

2025-02-27 14:14:00京东,模型,领先,产品,企业,京东

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

大模型领域竞争日趋激烈，腾讯又放出大招！2月27日，腾讯混元Turbo S模型在腾讯云官网上架，开发者和企业用户可以通过API调用，即日起一周内免费试用，同时将逐步在腾讯元宝灰度上线，供用户使用和体验。据介绍，此次升...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

英伟达发布Llama-3.1-Nemotron-51B AI

...伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存

杨元庆谈AI PC：支持运行个人大模型

...惠》主题演讲。演讲中，他系统阐述了联想对人工智能大模型技术浪潮的洞察与业务布局，首次完整定义了未来AI PC（人工智能电脑）所具备的五大特质。两大行业趋势推动AI PC应运而生杨元庆提到，丰富多样的公共大模型为人...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型