模型,效率,成本,模型,推理,成本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...是尽可能为大家提供所需的开发工具，这包括了1个基础模型系列和三大AI开发工具，“今天的中国，有10亿互联网用户，有强大的基础大模型，有足够多的AI应用场景，有全球最完备的产业体系，国家也在大力鼓励和支持‘人工...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

李开复：AI大模型产业如何找到“算力”最优解

本文转自：经济参考报“随着AI从1.0进入2.0大模型技术阶段，我们迎来了有史以来最重要的科技革命和平台革命。”零一万物CEO、创新工场董事长李开复日前在接受记者采访时表示，算力作为AI 2.0发展的关键环节，需要采用更务...……更多

2024-06-17 04:28:00李开复,模型,产业,模型,应用,万物

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...忧——传统软件问题尚能引发如此大的问题，那么站在大模型时代当下，AI+金融，是否又能做到准确可信？正所谓实践是检验真理唯一标准，要回答的这个问题，我们不妨了解一下已经在金融领域“上岗”了的AI大模型。大模型...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

优刻得助力智谱AI解锁智能生活

本文转自：人民日报客户端沈文敏如今，AI大模型可以带来智能生活新体验。近日，智谱AI发布认知智能大模型，其新一代基座大模型GLM-4性能大幅提升，逼近GPT-4，展现了业界领先的多模态大语言模型能力。据介绍，通过智谱大...……更多

2024-02-29 22:25:00智能,生活,模型,推理,规模,能力

生成式AI“拥抱”制造业，如何重塑新增长路径？

...景确实高度碎片化，但是这个并不是行业还未重复利用大模型的真正原因，根本原因是，相对于医疗和教育来说，制造业核心工艺公开数据相对较少，所以很难预训练大模型。顾凡称，大模型领域最重要的是找准核心业务应用场...……更多

2023-11-11 18:14:00路径,制造业,生成,增长,制造,模型

火山引擎谭待：大模型的超低定价，来自对技术的信心

...我们有信心用技术手段降低成本，市场也需要更低价的大模型。”5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待在接受媒体采访时，谈到了大模型的定价策略。豆包大模型的超低价格引发行...……更多

2024-05-16 11:29:00火山,模型,定价,信心,引擎,技术

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

Meta的开源大模型Llama 3在市场上遇冷，进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道，Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注，AWS的企业客户更倾向于使用Anthropic...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

搞医学影像，为什么都青睐于CPU？

...特尔® 至强® 可扩展处理器上，测试了不同参数规模的AI模型在同步和异步模式下的推理表现。测试数据显示，对于参数量为31,185,568的较大模型，在BF16精度和异步模式下，第五代英特尔® 至强® 铂金8592+处理器相比第二代英特尔...……更多

2024-06-02 15:41:00医学影像,影像,医学,英特,英特尔,三维

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

...机器之心编辑部在 OpenAI 发布会的前一天，来自中国的大模型公司零一万物，让开源大模型社区活跃了起来：Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到，Yi-1.5 包括一系列预训练和微调模型，分为 6B、9B、3...……更多

2024-05-14 09:56:00万物,模型,国产,再次,排行榜,模型

阿里云CTO周靖人：全面投入升级AI大基建

...准，全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系，让数据中心成为一台超级计算机，为每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

大模型“价格战”重塑行业生态

本文转自：劳动报大模型“价格战”重塑行业生态应用市场定价或受影响■劳动报记者陈宁近期，一场由互联网巨头引领的大模型“价格战”在业内引发轩然大波。记者注意到，其连锁效应已逐渐渗透至应用市场，对用户使用...……更多

2024-05-29 00:15:00价格战,模型,生态,价格,行业,模型

硅谷大模型“价格战”上演，一味“卷”价格会有未来吗？

5月以来，国内大模型打响了“价格战”。从每百万个Token只要1块钱，到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力，有厂商甚至直接打出了“免费”的口号，震惊整个科技圈子。实际上，硅...……更多

2024-05-27 15:27:00硅谷,价格,价格战,一味,模型,模型

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...算力需求大爆发的转折之年，如今随着国内两批超20个大模型获得审批、种类多样的大模型相关应用显现，企业对私有化部署的需求也水涨船高。面向这一行业趋势，2023年世界互联网大会乌镇峰会上，国内云端RISC-V大芯片创企希...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

腾讯云升级 AI 全家桶，混元对标 GPT-4o

...腾讯云这次也公布了一系列进展。首先是发布了新一代大模型「混元 Turbo」，相较前代，混元 Turbo 性能大幅提升：训练效率提高 108%，推理效率提升 100%，推理成本降低 50%，目前，混元 Turbo 已在腾讯云上线，提供多个版本供企...……更多

2024-09-06 09:59:00腾讯,全家,升级,腾讯,模型,云智

大模型为何纷纷降价

本文转自：科技日报从以分计价到以厘计价大模型为何纷纷降价观众正在了解大模型相关产品。郭海鹏/视觉中国【AI世界】◎本报记者吴叶凡崔爽近日，各大电商平台开启了年中购物促销活动。但令人们始料未及的是，许多...……更多

2024-06-17 02:37:00模型,模型,厂商,张毅,用户,通义

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中，Baichuan3都展现了出色的能力，尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

豆包大模型公布价格清单支持国内最高并发标准

...网讯（记者姬文艳）近期，火山引擎官网更新了豆包大模型的定价详情，全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请...……更多

2024-05-21 11:57:00豆包,清单,模型,支持,标准,价格

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

...著的能力跟进，可见其技术发展与创新的潜力。除了Gemini模型外，Gemma这一系列轻量级的SOTA开放模型似乎与我们距离更近。它基于Gemini模型相同的研究和技术构建，旨在让每个人都拥有构建AI的工具。谷歌持续扩展Gemma家族，包...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...向合作伙伴开放“云天天书-2.0-68B”（680亿参数）行业大模型方案，从而把大模型应用成本降到千元级别。云天励飞表示，“深目”AI 模盒具备算法边缘侧在线学习能力，能够做到“3个90%”——覆盖场景超过90%、算法精度超过90%...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

商汤生成式AI业务飙涨256%，成为中国大模型、智算服务市场

...动做收缩调整。商汤在财报中指出，受惠于中国市场对大模型和智算服务的强劲需求、“日日新SenseNova”大模型能力的飞跃式提升以及推理成本的快速下降，带动模型调用量增长迅速。报告期内，“绝影”智能汽车业务的表现也...……更多

2024-09-13 13:50:00商汤,市场占有率,占有率,中国,生成,模型

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了！马斯克19天建成由10万块H100串联的世界最大超算，已全力投入Grok 3的训练中。与此同时，外媒爆料称，OpenAI和微软联手打造的下一个超算集群，将由10万块GB200组成。...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升。同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。在多个权威评测中，元象MoE效果大幅超越多...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...升还成本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来，大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...开的彻彻底底。这不，Meta一连放出三篇技术文章，从大模型适配方法出发，介绍了：如何使用特定领域数据微调LLM，如何确定微调适配自己的用例，以及如何管理良好训练数据集的经验法则。接下来，直接进入正题。适配大模...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

pytorchtorchao正式发布,提供了一系列优化工具集

...下架构优化库torchao现已正式发布，该优化库主要专注于模型的量化和稀疏性优化，能够在保证性能的同时降低模型的计算成本和RAM用量，从而提升模型运行效率，IT之家附GitHub页面地址（点此访问）。据介绍，torchao提供了一系...……更多

2024-10-03 02:58:00工具集,工具,模型,可将,训练,推理

百川智能、阿里云等进入开源大模型领域，开启商业化前奏

闭源商业化的“百模大战”暂告段落，开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后，基于该模型微调的大模型不断涌现。此外，阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B，国内8、9月份...……更多

2023-10-14 00:21:00百川,阿里,前奏,模型,领域,智能

阿里云通义千问主力模型价格直降97%，大模型商业化拐点已至

5月21日，阿里云抛出重磅炸弹：通义千问GPT-4级主力模型Qwen-Long，API输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%。这意味着，1块钱可以买200万tokens，相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本...……更多

2024-05-22 16:18:00通义,模型,阿里,拐点,主力,商业