推理,模型,成本,参数,模型,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

李开复：中国大模型与美国顶尖差距从7年缩短至6个月

...战时，李开复表示，在一定程度上，整个大模型行业每年推理成本降低到1/10是可以期待的，而且是必然也应该发生的，通过降低价格让更多的人体验到大模型产品对行业是一件好事。不过他也提到，相信大部分大模型创业者不...……更多

2024-05-21 23:32:00李开复,美国,中国,顶尖,模型,差距

腾讯钟学丹：人工智能成为汽车行业新质生产力推动数智化升级

...方式，让大模型的训练效率提升至主流开源框架的2.6倍，推理加速比达到了2倍。在大模型应用方面，腾讯已经和十多家车企围绕研、产、销、服、管理等多场景展开合作。比如，在汽车软件研发环节，大语言模型不仅懂人类语...……更多

2024-03-19 14:00:00智化,腾讯,人工智能,汽车行业,生产力,人工

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o1的出现标志着大模型研发者开始把集中在训练阶段的投入，开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...较长的小说了。更重要的是，LLM真的能在这个长度上进行推理吗？近日，有两篇独立研究分别表明：长上下文水分很大！LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员，推出了一项针对性...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

超级干货丨360AI搜索如何准确识别用户意图？

...于算法和硬件上的提升，今年大模型的反应速度提升了，推理成本也降下来了，但仍然没办法在速度、智能、成本三者上达到很好的平衡。所以我们尝试用开放的思路解题，独创了一种专家协作模型技术架构CoE，召集了几乎行业...……更多

2024-11-05 09:45:00干货,意图,用户,搜索,搜索,模型

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

高文院士：鹏城实验室已训练3个大模型，今年底将拥有两万多块卡

...城实验室主任高文发表演讲，分享了鹏城实验室在打造大模型平台上的进展。他表示，大模型训练首先需要一个平台。“现在要想训练一个大模型，需要有几千块卡，甚至上万块卡。”他介绍到，鹏城实验室在2020年就搭建了这...……更多

2024-06-05 13:00:00高文,院士,实验室,模型,训练,实验

阶跃星辰宣布开源图生视频模型，多模态领域的DeepSeek时

...区、芯片、云厂商、产业方等。姜大昕还透露了阶跃星辰推理模型的最新研究进展——Open-Reasoner-Zero，采用了与OpenAI的o系列模型和DeepSeek-R1类似的强化学习算法，训练效率是DeepSeek-R1-Zero的25倍，这一探索的所有的实验结果、代码...……更多

2025-02-22 16:36:00时来,模态,星辰,模型,时刻,领域

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

...judge提示模板。除了给出评价结果，meta-judge还需要生成CoT推理过程。为减少meta-judge可能存在的位置偏好（可能倾向于选择最先出现的Judgment A），对同一对数据(jm, jn)会交换顺序让meta-judge进行两次评价，得到单次结果rmn：引入...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

2024北京国际车展｜加速智能汽车驶入AGI时代商汤绝影系

...向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力，DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。值得一提的是，前不久上市的小...……更多

2024-04-28 21:29:00商汤,原生态,北京,车展,模型,智能

机器人训练更高效低成本！英伟达官宣Isaac Sim4.2，

...发人员正在采用“three-computer solution”进行训练、模拟和推理，以取得突破。 ▲英伟达为人形机器人开发者提供的“three-computer solution”然而，在训练机器人系统的物理AI过程中，需要大量的训练数据集才能让机器人在部署中实...……更多

2024-12-05 09:45:00英伟,达官,机器人,机器,成本,性能

OpenAI未来猛料全曝光！奥特曼承认自己最大弱点是产品

...所删改。最后还有11个快问快答彩蛋～内容速览o1代表的推理模型这个方向对OpenAI非常重要。创业公司的主要业务不要对着现有模型打补丁。难道大家已经忘了几年前的模型表现多糟糕吗？其实才过去没几年。同样的价值下，...……更多

2024-11-06 09:42:00奥特,奥特曼,弱点,产品,模型,事情

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

李开复：已进入“AI教AI”时代，AI通过慢思考具备了反思能

...而且目前看起来远没有触及天花板。与此同时，大模型的推理成本在以每年降低10倍的速度快速下降，这为AI-First应用爆发提供了非常重要的条件。”在技术层面，李开复认为，虽然预训练阶段的Scaling Law（缩放法则）的增长趋势...……更多

2025-03-31 22:50:00李开复,迭代,能力,时代,模型,李开复

德国OpenAI加入开源大战！发布欧洲纯血版模型，曾获博世和

...（Group Query Attention，GQA）的技术。Aleph Alpha声称这提高了推理速度，且几乎没有牺牲质量。模型还采用了“旋转式位置编码”（Rotary Position Embedding，RoPE）的方法，使模型能够更好地理解句子中单词的相对位置。二、注重模型合...……更多

2024-08-28 09:43:00博世,纯血,惠普,欧洲,德国,模型

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...考虑到大模型和异构多芯发展趋势，为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片，飞桨与文心联合，在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说，动静统一的自动并行能...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

依托数据、平台、知识增强等优势夸克大模型降低问答幻觉率

...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面，夸克大模型的能力体现在四个方面，可以帮助用户提升工作、学习效率。知识能力，拥有广泛的知识覆盖、信息搜集和多语言支持等，...……更多

2023-11-23 11:11:00夸克,幻觉,模型,问答,优势,知识

努比亚宣布接入满血版DeepSeek：Z70 Ultra已在

...语言理解和生成能力，在自然语言处理、代码生成、逻辑推理等多个关键领域均表现优异。业内人士指出，DeepSeek的成功，不仅是中国AI技术的一次重大突破，更是全球AI格局重塑的重要标志，真正做到了花小钱办大事。通过更先...……更多

2025-02-10 10:17:00努比,努比亚,接入,努比,努比亚,接入

全国首个金融大模型成绩单：服务超2亿用户8大应用场景

...融安全、大数据决策、人机交互、消费者权益保护、逻辑推理泛化等多个关键领域，天镜 2.0 都有着显著的表现。以金融安全为例，生成式AI的繁荣发展，给这个行业带来不少的挑战，假单据、假人脸、假数据等欺诈手段变得愈...……更多

2024-12-07 09:52:00成绩单,模型,场景,成绩,金融,应用

还在人工炼丹？自动提示工程指南来了，还带从头实现

...状就是 LLM 难以正确应对的领域。对这些模型来说，空间推理和解释抽象视觉描述并不自然，而且它们常常无法完成人类认为相当容易的任务。这里的选择是来自 Big-Bench Hard（BBH）基准的 geometric_shapes 数据集：给定一个完整的 SVG...……更多

2024-09-10 13:39:00从头,人工,提示,指南,工程,提示

山东移动全面接入DeepSeek，加速产业数智升级

...模型训练提供强大的算力支撑，加速模型训练过程，优化推理效率。同时，平台提供大规模数据集处理能力，方便用户在平台提高模型训练数据的丰富性和准确性，让模型训练“既有速度更有精度”。提供快捷的大模型应用服...……更多

2025-02-22 08:22:00山东,接入,升级,移动,产业,模型

图灵奖得主Yoshua Bengio新作：Were RNNs

...常高效在测试时，循环序列模型会按顺序推出，从而使其推理更为高效。相反，传统 RNN 的瓶颈在于其训练，需要线性训练时间（通过时间反向传播），这导致其最终被淘汰。人们对循环序列模型重新产生兴趣，是因为许多新的...……更多

2024-10-15 09:56:00图灵奖,图灵,得主,新作,序列,训练

超擎数智重磅发布擎天、锋锐、元景系列AI服务器，打造人工智能

...擎天、锋锐、元景系列AI服务器产品,为大规模数据训练和推理提供强劲性能,帮助AI用户高效构建AI基础设施和应用环境,满足AI场景下的多元算力需求,为AI新质生产力提供强劲引擎。擎天系列L20 AI服务器,4U8卡PCle擎天系列L20 AI服务...……更多

2024-04-28 14:05:00人工智能,重磅,生产力,人工,服务器,引擎

大模型落地之战，百度靠什么突围

....8%，相比文心一言发布时，训练效率提升到当时的5.1倍，推理105倍，推理成本下降至最初的1%。6月，百度还推出了飞桨3.0，此次升级显著提高了飞桨框架与百度 AI 基础设施和文心大模型的兼容性，有望在未来进一步降低模型推...……更多

2024-08-23 09:49:00落地,模型,模型,智能,文心,开发

图结构转文本序列，大模型直接读懂！图推理性能大涨

...和属性，如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现？机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法：图中心性（PageRank和度）、图退化（k-core分解）...……更多

2024-12-03 13:33:00序列,推理,模型,文本,性能,结构

云鼎科技：基于DeepSeek，打造垂域矿山大模型

...模型的性能水平，从而显著增强自有模型在矿山行业中的推理能力，最终蒸馏出首个基于DeepSeek-R1的垂域矿山大模型。在降低算力消耗的同时，使更小参数的模型获得更加高效、精准的推理能力，应用于山能知识助手中，经测试...……更多

2025-02-26 22:55:00矿山,模型,科技,模型,应用,数据

腾讯云升级 AI 全家桶，混元对标 GPT-4o

...相较前代，混元 Turbo 性能大幅提升：训练效率提高 108%，推理效率提升 100%，推理成本降低 50%，目前，混元 Turbo 已在腾讯云上线，提供多个版本供企业和开发者使用。同时，在大会上，腾讯云还发布了 AI infra 品牌「腾讯云智算...……更多

2024-09-06 09:59:00腾讯,全家,升级,腾讯,模型,云智

DeepSeek的545%利润率，是对算力的核弹吗？

...出了更令人震惊的“彩蛋”——成本利润率高达545%，V3/R1推理系统理论日利润达到346万元人民币。而在市场为这超高“暴利”连连感叹的同时，也更关心这几个问题：如何解读545%这个利润率？是否是对算力的核弹？这对云产业...……更多

2025-03-02 22:32:00核弹,利润率,利润,利润率,利润,模型

page 17/2667 首页上一页 12 13 14 15 161718 19 20 21 22 下一页末页

更多关于科技的资讯：

基于提示工程的模型输出不确定性量化分析

摘要：随着生成式人工智能技术在各行业的广泛应用，模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性，对输出不确定性进行量化分析成为重要方向

2025-12-04 06:17:00

给智能体装上“大脑”和“小脑”

杭州博士后用AI让机器懂协作、更安全杭州日报讯让机器从执行命令的“孤岛”，成为懂得协作的群体？让机器人安全走进人类生活

2025-12-04 06:38:00

紫林醋业产品通过欧盟认证

12月3日从紫林醋业获悉，紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification)，获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)

2025-12-04 07:31:00

豆包手机助手回应“侵犯用户隐私”：不存在任何黑客行为

中新经纬12月3日电 12月3日，豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应，称不存在任何黑客行为。具体来看

2025-12-04 07:42:00

支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖

12月1日-3日，由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上，首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式

2025-12-04 07:47:00

海内外太空算力布局同步加速

近期，在“智绘星空胜算在天—太空数据中心建设工作推进会”上，北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统

2025-12-03 09:42:00

太极韵动武汉，一场独属于银发爱好者的健康之约

承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕

2025-12-03 13:40:00

“数字试错”替代“物理试错” 新一代AI质检平台在杭发布

杭州日报讯产品还没走下生产线，就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前，工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”

2025-12-03 13:41:00

“江苏制造”叩响中东商机

本报记者陆春花为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作，推动江苏制造高质量“走出去”、精准“引进来”

2025-12-03 13:41:00

曹操出行与越疆合作，人形机器人入驻行业首个“绿色智能通行岛”

12月1日，曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi（自动驾驶出租车）运营场景，共同探索机器人技术在车辆清洁

2025-12-03 13:41:00

江苏“领航工厂”引领“智造”变革

从“智慧车间”到“工业大脑”，“江苏智造”通过数据驱动全流程变革，赋能产业链协同升级近日，全国首批15家领航级智能工厂名单发布

2025-12-03 13:41:00

国内首款AI助盲眼镜发布，基于通义千问打造

12月3日，杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造，具有出行避障

2025-12-03 13:41:00

杭州市公共自行车公司发来短信绑卡租车功能即将取消想问一下

橙友“橙汁儿”向橙柿直通车反映：这几天收到了短信，是杭州市公共自行车公司发来的——“尊敬的用户，由于业务升级，您之前办理的绑卡租车功能即将在2025年12月底取消

2025-12-03 13:41:00

跳出“好评怪圈”，让好评回归本质

北京上班族李想称，健身私教课结束后，教练为索要好评，直接拿他手机代笔修改达3分钟。好评既影响消费者选择，也关联平台推流与服务者收益

2025-12-03 13:41:00

杭州这个社区成了杭州AI人的“线下聚集地”

找“搭子” 聊技术谈合作每日商报讯一个多星期前，“魔搭社区”（杭州）开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间

2025-12-03 13:41:00

头条订阅服务