推理,模型,成本,模型,团队,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降8

...将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出...……更多

2025-02-13 19:51:00豆包,字节,推理,架构,模型,团队

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减5

...授团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多

2025-03-14 17:22:00清华,推理,模型,团队,成本,硬件

全球科研团队竞逐低成本AI模型研发新范式

...基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

阿里最新开源推理模型发布：性能比肩DeepSeek-R1

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

豆包大模型公布价格清单支持国内最高并发标准

...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM...……更多

2024-05-21 11:57:00豆包,清单,模型,支持,标准,价格

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

复旦大学漆远：DeepSeek将推理成本降至百万token仅

...诞生聊天机器人产物。如今OpenAI o1、DeepSeek模型具备的强推理能力，让AI发展走到了又一重要分水岭。而未来研究方向或在于，像杨立昆提出的‘科学世界模型’，让AI更透彻的理解物理世界。”谈及最近爆火的国产AI“黑马”Deep...……更多

2025-02-22 11:50:00复旦大学,复旦,推理,人民币,成本,人民

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

国产大模型第一梯队玩家，为什么pick了CPU？

...占绝对大头的因素——算力。现在提及大模型的训练和推理，很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势，但它所存在“硬伤”也是比较明显，那便是供应不足、价格昂贵。何以破局？国产大模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...发布新的模型，最重要的方向主要是两个，一个是Reasoning推理，一个是Omin全模态融合。”刘伟光提到。在应用方向上，这次大会，阿里云宣布推出AI Agent Store，从生成式AI向代理式AI发展，并表示将首先推动阿里旗下所有服务走...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

空天信息+人工智能中国科研团队成功研发遥感智能训推一体机

...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型，能够在自然资源、...……更多

2023-10-27 16:57:00空天,智能,遥感,人工智能,一体机,中国

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

DeepSeek首次披露：理论成本利润率545%

...层涟漪。3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章，全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是，文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍，假定GPU租赁成本为2...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...9月12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

对话贾扬清：明年AI推理成本还会降低10倍以上，一两年内AI

...比之前更加乐观。他认为，“成本不是核心问题，Token的推理成本可能在接下去的一年还会再降低十倍，甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下，可能就是一两年的时间。”他表示，“核心...……更多

2024-10-30 13:59:00扬清,成本,推理,人工,对话,扬清

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

page 1/2334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

内功修炼+市场开拓河钢张宣科技镀锌产线强势创效

河北新闻网讯（董佳倩）近日，河钢集团张宣科技传来捷报，其镀锌产线凭借“内功修炼+市场开拓”实现经营创效。9月份，该公司镀锌丝产品销量环比增长77%

2025-10-27 18:01:00

合同管理系统公司格局分析：合同管理系统厂家AI与生态集成成为

全球合同管理系统市场正以15.5%的年复合增长率狂奔，443.9亿元的庞大市场背后，是AI技术对传统合同管理方式的彻底颠覆

2025-10-27 17:36:00

崂山区虚拟现实产业集聚效应凸显，剑指“全球VR第一园”

鲁网10月27日讯10月24日，记者在青岛市崂山区委宣传部召开的媒体见面会上获悉，近年来，青岛市崂山区以前瞻布局推动虚拟现实产业高质量发展

2025-10-27 16:24:00

京东11.11直播技术全面升级，立影3D技术、JoyAI大模

随着京东 11.11 大促的火热进行，京东直播再度升级技术布局，以 “立影 3D 技术”“JoyAI大模型”等创新技术

2025-10-27 15:39:00

电机能效提升领域再添标杆！25 项产品 / 技术入选全国节能

为深入贯彻国家 “双碳” 战略，加快电机领域节能降碳技术创新与成果转化，中国电子节能技术协会此前启动 “全国节能降碳示范产品 / 技术推荐” 征集工作

2025-10-27 15:42:00

吉刻现场｜硬核登场！吉林选手角逐第三届全国博士后创新创业大赛

10月26日，第三届全国博士后创新创业大赛在福建泉州（晋江）开幕。本届大赛，吉林省派出23个项目团队组成的参赛队伍角逐三个大赛道

2025-10-27 14:09:00

$厦心医院实现手术\$

厦心医院实现手术"跨洲同台" 全球首例跨国机器人心脏介入手术

厦门网讯（厦门日报记者楚燕通讯员许良友付磊刘云芳）10月23日，一项载入医学史册的创新手术在厦门大学附属心血管病医院（以下简称“厦心医院”）圆满完成

2025-10-27 08:11:00

新闻纵深·解码钢铁大模型｜邯钢构建六大领域全链条智能大模型：

邯钢构建六大领域全链条智能大模型“聪明大脑”带来极致能效编者按当钢铁遇上人工智能，一场“智变”正悄然发生。为生动展现人工智能为钢铁产业生产

2025-10-27 08:12:00

江苏规模最大，1400名软件工程师在宁“聚会”

第十一届NJSD软件开发者会议在软件谷举行江苏规模最大，1400名软件工程师在宁“聚会”南报网讯（记者于洁尘通讯员林园园）70多位业界“大咖”登台演讲

2025-10-27 08:20:00

南化公司首套除盐装置投用技术突破降本增效年可节约超500万

南报网讯（通讯员郑瑞于品华杨刚记者徐宁）近日，南化公司自主研发的橡胶防老剂中间产品RT培司（4-氨基二苯胺）除盐技术取得突破

2025-10-27 08:21:00

南林大携手乐惠国际共建智慧包装产业研究院

南报网讯（通讯员杨淏涵记者张希）日前，南京林业大学与乐惠国际南京基地签署《校企全面合作协议》《产业研究院共建协议》，全面开启校企战略合作

2025-10-27 08:22:00

高效，是都市青年的通行证：InstaShake以“一杯营养”

在生活节奏不断加速的上海，追求健康与追求效率似乎成为一道单选题。然而，新锐健康饮品品牌InstaShake正以其独特的“零添加

2025-10-27 08:39:00

济宁银行锚定金融“五篇大文章” 多维发力赋能区域经济高质量发

鲁网10月27日讯近年来，济宁银行围绕做好金融“五篇大文章”，深入洞察科技企业、中小微企业以及重点产业链金融需求，以产品创新破解融资难题

2025-10-27 11:07:00

量贩零食店，价廉味美才可能“长红”

汪昌莲据《经济日报》报道，“两三元就能买品牌饼干薯片”“上百种散装零食任意挑选”……从县城到乡镇，在街角与量贩零食店不期而遇已成逛街“标配”

2025-10-27 11:10:00

济南未来七天天气预报

受冷空气影响，气温先降后升，27日早晨气温较低。26日夜间到27日白天晴间多云，北风转南风2～3级，最低气温市区4℃左右

2025-10-27 11:28:00

头条订阅服务