模型,效率,成本,模型,推理,成本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...闻网中新网北京6月3日电 (记者夏宾)近年来，为了追求大模型的智慧能力，各国公司不停加码投入，4月，Meta宣布追加10亿美元投资，用于其AI芯片研发和AI数据中心建设；亚马逊为了建设新数据中心投入110亿美元。但在大模型扩...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...彦宏在Create2024百度AI开发者大会上，正式宣布发布文心大模型4.0的工具版。李彦宏表示，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

CPU,正在被AI时代抛弃？

...对话可以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

NeurIPS 2024|水印与高效推理如何两全其美？最新理

...印技术和投机采样（speculative sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

国产大模型第一梯队玩家，为什么pick了CPU？

AI一天，人间一年。现在不论是大模型本身，亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般，虽然AIGC目前还处于起步阶段，但市场规模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

【新智元导读】大模型热，企业落地难？就在刚刚，百川智能推出「1+3」产品矩阵，一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」，仅需10分钟就能让企业自主成为模型定制增强专家，实现行业最...……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

当大模型Scaling Law继续,万卡集群算力释放在百舸找

...一世纪什么最贵？人才！」而随着人工智能行业进入到大模型时代，这一问题的答案已然变成了「算力」。随着模型规模急剧扩张，参数已经飙升到了千亿甚至万亿级，业界开启了千模大战，AI 算力需求不可避免迎来爆炸式增长...……更多

2024-09-26 13:37:00万卡,百舸,通途,集群,模型,百舸

谷歌发布gemma2大语言模型，共有两种大小

...布新闻稿，面向全球研究人员和开发人员发布Gemma2大语言模型，共有90亿参数（9B）和270亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

模型即服务，卓世科技MaaS平台 2.0 正式上线

引言：MaaS(ModelasaService，模型即服务)是一种将人工智能算法模型及其相关能力封装成服务，以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度，并提升人工智能技术的综合应用效能的模式。上新了...……更多

2024-08-07 09:45:00模型,服务,平台,科技,模型,数据

大模型价格战“卷”向何方？｜深度

...你降价，我免费。在经过一年多的“百模大战”后，AI大模型从5月初几乎毫无预兆地掀起了“降价潮”，阿里、百度、腾讯等纷纷加入战团。大厂“钱多、卡多、算力足”无惧价格战，以惯有的免费模式先聚集用户与开发者。中...……更多

2024-05-25 10:34:00何方,价格战,深度,模型,价格,模型

摆脱Transformer依赖？这家AI初创公司推出国内首个

文 | 苏建勋Transformer是当下爆火的GPT、LLAMA、PaLM等大模型普遍采用的基础架构，凭借强大的自然语言理解能力，Transformer在问世的短短几年内便取代了传统的RNN网络结构，成为自然语言处理领域的主流模型架构。如今，一家创业...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

大模型降价背后，国产大模型的竞争逻辑变了

配图来自Canva可画随着人工智能技术的快速发展，大模型以其强大的数字处理能力和深度学习能力，不断与各领域交叉融合，逐步成为产业创新的关键抓手，和驱动新质生产力的关键引擎。据国家最新公布的数据显示，截至今年...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

9月5日，腾讯正式推出其新一代旗舰大模型——混元Turbo。相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

李彦宏再谈开源：开源模型是智商税，永远应该选择闭源模型

“今天无论是ChatGPT、还是文心一言等闭源模型，一定比开源模型更强大，推理成本更低。”在2024世界人工智能大会（WAIC 2024）期间，百度创始人、董事长兼首席执行官李彦宏，与第一财经传媒集团总编辑杨宇东和《硅谷101》创...……更多

2024-07-31 16:00:00模型,李彦,智商,选择,模型,李彦

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

智东西11月5日报道，今日，腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源，并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

英伟达发布Llama-3.1-Nemotron-51B AI

...伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存

杨元庆谈AI PC：支持运行个人大模型

...惠》主题演讲。演讲中，他系统阐述了联想对人工智能大模型技术浪潮的洞察与业务布局，首次完整定义了未来AI PC（人工智能电脑）所具备的五大特质。两大行业趋势推动AI PC应运而生杨元庆提到，丰富多样的公共大模型为人...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型