推理,模型,成本,模型,团队,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降8

...将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出...……更多

2025-02-13 19:51:00豆包,字节,推理,架构,模型,团队

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减5

...授团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多

2025-03-14 17:22:00清华,推理,模型,团队,成本,硬件

全球科研团队竞逐低成本AI模型研发新范式

...基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

阿里最新开源推理模型发布：性能比肩DeepSeek-R1

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

直面大模型“大成本”挑战，如何提高算力效率？

...算效率和算力开销两大问题成为新的行业焦点。对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE(混合专家模型)，就是优化推理成本很好的解决...……更多

2024-06-03 14:07:00模型,效率,成本,模型,推理,成本

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

豆包大模型公布价格清单支持国内最高并发标准

...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM...……更多

2024-05-21 11:57:00豆包,清单,模型,支持,标准,价格

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

复旦大学漆远：DeepSeek将推理成本降至百万token仅

...诞生聊天机器人产物。如今OpenAI o1、DeepSeek模型具备的强推理能力，让AI发展走到了又一重要分水岭。而未来研究方向或在于，像杨立昆提出的‘科学世界模型’，让AI更透彻的理解物理世界。”谈及最近爆火的国产AI“黑马”Deep...……更多

2025-02-22 11:50:00复旦大学,复旦,推理,人民币,成本,人民

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

国产大模型第一梯队玩家，为什么pick了CPU？

...占绝对大头的因素——算力。现在提及大模型的训练和推理，很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势，但它所存在“硬伤”也是比较明显，那便是供应不足、价格昂贵。何以破局？国产大模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...发布新的模型，最重要的方向主要是两个，一个是Reasoning推理，一个是Omin全模态融合。”刘伟光提到。在应用方向上，这次大会，阿里云宣布推出AI Agent Store，从生成式AI向代理式AI发展，并表示将首先推动阿里旗下所有服务走...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

空天信息+人工智能中国科研团队成功研发遥感智能训推一体机

...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型，能够在自然资源、...……更多

2023-10-27 16:57:00空天,智能,遥感,人工智能,一体机,中国

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

DeepSeek首次披露：理论成本利润率545%

...层涟漪。3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章，全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是，文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍，假定GPU租赁成本为2...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...9月12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

对话贾扬清：明年AI推理成本还会降低10倍以上，一两年内AI

...比之前更加乐观。他认为，“成本不是核心问题，Token的推理成本可能在接下去的一年还会再降低十倍，甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下，可能就是一两年的时间。”他表示，“核心...……更多

2024-10-30 13:59:00扬清,成本,推理,人工,对话,扬清

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

page 1/2667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

AI赋能千行百业一线故事（十六）：数智驱动，唤醒高校“沉睡”

数智驱动，唤醒高校“沉睡”的专利——AI赋能千行百业一线故事（十六）10月24日，邯郸职业技术学院知识产权学院工作人员演示AI+专利转化运用生态服务平台

2025-11-18 08:42:00

集思录｜以规则之光照亮平台经济前行之路

市场监管总局11月15日发布《互联网平台反垄断合规指引（征求意见稿）》，向社会公开征求意见。征求意见稿坚持问题导向，针对平台经济领域竞争行为的特点和趋势

2025-11-18 08:44:00

安费诺加码投资厦门位于厦门创新创业园新工厂正式投产

厦门网讯（厦门日报记者林露虹通讯员郭文晨）美资企业安费诺加码投资厦门。近日，位于厦门创新创业园的安费诺（厦门）高速线缆有限公司新工厂正式投产

2025-11-18 09:03:00

“‘一带一路’——我们共同的路”全球故事征集活动启动扫码阅

11月18日，由天津市政府新闻办指导，津云新媒体主办的“‘一带一路’——我们共同的路”全球故事征集活动启动。活动以高质量共建“一带一路”八项行动为指引

2025-11-18 09:06:00

陈兵：“它走得太像人了”——为什么必须由车企来完成这一步？

中新经纬11月18日电题：“它走得太像人了”——为什么必须由车企来完成这一步？作者陈兵南开大学法学院副院长、教授

2025-11-18 13:00:00

OceanBase发布首款AI数据库seekdb，探索数据库

11月18日，在2025 OceanBase年度发布会上，OceanBase发布并开源了其首款AI数据库OceanBase seekdb（简称seekdb）

2025-11-18 13:21:00

全面满足用户本地生活服务需求，京东外卖App、点评、真榜、七

11月17日晚，第三场京东品酒会在三亚保利瑰丽酒店举办。活动现场，京东宣布在本地生活领域密集落地一系列举措：推出京东外卖App

2025-11-18 13:21:00

安杰莱科技闪耀高交会：以科技赋能康复公益，斩获科技创新大奖

11月14日至16日，以“科技赋能产业，融合共创未来”为主旨的第二十七届中国国际高新技术成果交易会在深圳隆重举行。作为展现我国对外开放深度与广度的重要平台

2025-11-18 11:48:00

7×24小时自主巡检，杭州萧山机场添智能驱鸟装备

在航空运输业快速发展的今天，机场安全运行始终是行业关注的重点。鸟类撞击飞机的事件虽不常见，但一旦发生，可能对飞机引擎、机身结构造成损害

2025-11-18 10:47:00

“产业炬光灯”聚焦元之道生物科技

“产业炬光灯”聚焦厦门元之道生物科技有限公司。扫码看视频厦门网讯（厦门日报记者李晓平）小小微生物，蕴藏着改变健康的大能量

2025-11-18 09:03:00

“安徽省电竞产业研究合作基地”聘任10名顾问

大皖新闻讯 2025年11月16日，安徽电竞创新发展大会在合肥举行。汇聚来自政府部门、行业协会、知名企业及高校的众多嘉宾

2025-11-17 09:24:00

邮储银行唐山市分行开展“星暖燕赵星星闪耀”星级柜员竞赛活动

为进一步提升网点服务能力与柜员专业素养，夯实业务基础，打造有温度的金融服务，近日，邮储银行唐山市分行组织开展了“星暖燕赵星星闪耀”星级柜员竞赛活动

2025-11-17 10:07:00

张家口农商银行宣泰支行以数字互动升级客户体验

张家口农商银行宣泰支行打破传统服务边界，以“线上服务提质、直播互动破圈、短视频赋能”为抓手，将便捷与温度融入数字金融场景

2025-11-17 10:11:00

阿里全力进军AI to C市场千问APP上线公测

11月17日，阿里巴巴正式宣布“千问”项目，全力进军AI to C市场。当天，千问APP公测版上线，基于全球性能第一的开源模型Qwen3

2025-11-17 11:08:00

韩媒：三星集团计划未来五年对本土投资450万亿韩元

中新经纬11月17日电据韩联社报道，三星集团将在未来五年对本土科学研究与试验发展等领域共投资450万亿韩元(约合人民币2

2025-11-17 11:48:00

头条订阅服务