推理,模型,成本,模型,团队,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降8

...将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出...……更多

2025-02-13 19:51:00豆包,字节,推理,架构,模型,团队

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减5

...授团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多

2025-03-14 17:22:00清华,推理,模型,团队,成本,硬件

全球科研团队竞逐低成本AI模型研发新范式

...基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

阿里最新开源推理模型发布：性能比肩DeepSeek-R1

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

豆包大模型公布价格清单支持国内最高并发标准

...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM...……更多

2024-05-21 11:57:00豆包,清单,模型,支持,标准,价格

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

复旦大学漆远：DeepSeek将推理成本降至百万token仅

...诞生聊天机器人产物。如今OpenAI o1、DeepSeek模型具备的强推理能力，让AI发展走到了又一重要分水岭。而未来研究方向或在于，像杨立昆提出的‘科学世界模型’，让AI更透彻的理解物理世界。”谈及最近爆火的国产AI“黑马”Deep...……更多

2025-02-22 11:50:00复旦大学,复旦,推理,人民币,成本,人民

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

国产大模型第一梯队玩家，为什么pick了CPU？

...占绝对大头的因素——算力。现在提及大模型的训练和推理，很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势，但它所存在“硬伤”也是比较明显，那便是供应不足、价格昂贵。何以破局？国产大模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...发布新的模型，最重要的方向主要是两个，一个是Reasoning推理，一个是Omin全模态融合。”刘伟光提到。在应用方向上，这次大会，阿里云宣布推出AI Agent Store，从生成式AI向代理式AI发展，并表示将首先推动阿里旗下所有服务走...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

空天信息+人工智能中国科研团队成功研发遥感智能训推一体机

...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型，能够在自然资源、...……更多

2023-10-27 16:57:00空天,智能,遥感,人工智能,一体机,中国

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

DeepSeek首次披露：理论成本利润率545%

...层涟漪。3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章，全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是，文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍，假定GPU租赁成本为2...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...9月12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

对话贾扬清：明年AI推理成本还会降低10倍以上，一两年内AI

...比之前更加乐观。他认为，“成本不是核心问题，Token的推理成本可能在接下去的一年还会再降低十倍，甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下，可能就是一两年的时间。”他表示，“核心...……更多

2024-10-30 13:59:00扬清,成本,推理,人工,对话,扬清

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

page 1/2334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

加速“买全球”，今年单量突破1亿单——义乌成为我国跨境电商进

浙江日报义乌12月3日电（记者拜喆喆何贤君共享联盟·义乌吴峰宇） 3日，义乌今年第1亿个跨境电商进口订单完成打包

2025-12-04 08:41:00

中国科大新实验终结爱因斯坦与玻尔世纪之辩

大皖新闻讯大皖新闻记者从中国科学技术大学获悉，该校潘建伟、陆朝阳、陈明城教授等组成的研究团队，利用光镊囚禁的量子基态单原子

2025-12-04 11:03:00

北京消协联合8家电商平台承诺：严禁AI换脸仿冒名人明星带货

中新经纬12月4日电 “北京市场监管”微信号4日消息，为应对AI合成技术滥用风险，规范电商直播行业秩序，近日，北京市消费者协会(以下简称“北京消协”)联合京东

2025-12-04 11:06:00

$用一张照片告别2025：富士胶片X-SPACE三城点亮\$

用一张照片告别2025：富士胶片X-SPACE三城点亮"影像

2025年11月起，富士胶片影像共享空间X-SPACE于上海、南京、杭州三地先后启动年末特别企划——"影像之树"作品征集与交流活动

2025-12-04 11:49:00

《2026年中国礼品行业展望白皮书》发布“差异化”和“质价比

2025年10月20-23日，第33届深圳礼品家居展于深圳国际会展中心举办，展会同期进行的2025中国礼业高峰论坛上，展会主办方励展华博第三次携手国际知名咨询公司凯度重磅首发《2026年中国礼品行业展望白皮书》

2025-12-04 11:55:00

体育总局：鼓励境外优质资本投资国内各级各类职业联赛

中国网12月4日讯据国家体育总局网站消息，体育总局日前印发《关于进一步推进篮球改革发展的意见》。其中提出，有序促进职业篮球开放

2025-12-04 12:16:00

短剧“薅”长剧羊毛保护原创等不得-中国吉林网

长白时评评论员刘颂寒12月1日，电视剧《家业》和制片方华策影视发文，谴责部分短剧投机取巧，擅自截取《家业》宣传物料中的创意元素“跟拍”

2025-12-04 13:48:00

清风相伴，智造新势力“拔节生长”

近年来，智能制造产业园引导企业顺应数字化浪潮，积极落实智改数转，推动科技创新与产业创新深度融合。以南汽集团为核心的汽车产业

2025-12-04 11:20:00

储热赋能双碳智慧引领供热泰山集团高电压直入式电储能技术破

鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下，电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈

2025-12-04 09:57:00

上海街头的数字生活指南，是城市数字品牌与公共艺术的对话

在上海，街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌，是“智云上海”这个城市信息化名片的立体呈现

2025-12-04 08:17:00

基于提示工程的模型输出不确定性量化分析

摘要：随着生成式人工智能技术在各行业的广泛应用，模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性，对输出不确定性进行量化分析成为重要方向

2025-12-04 06:17:00

给智能体装上“大脑”和“小脑”

杭州博士后用AI让机器懂协作、更安全杭州日报讯让机器从执行命令的“孤岛”，成为懂得协作的群体？让机器人安全走进人类生活

2025-12-04 06:38:00

紫林醋业产品通过欧盟认证

12月3日从紫林醋业获悉，紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification)，获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)

2025-12-04 07:31:00

豆包手机助手回应“侵犯用户隐私”：不存在任何黑客行为

中新经纬12月3日电 12月3日，豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应，称不存在任何黑客行为。具体来看

2025-12-04 07:42:00

支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖

12月1日-3日，由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上，首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式

2025-12-04 07:47:00

头条订阅服务