逻辑推理,新论,推理,缺陷,逻辑,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升，在模型参数比业界同类模型小一个数量级的情况下，整体效果对标OpenAI o1和DeepSeek R1，再次证明了...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

能看风水夸我有情趣 Kimi现在都这么野了吗

...一个道理。在模型 “ 学好数学 ” 的基础上，再将这种逻辑推理的能力应用到物理、化学，乃至于咱们日常生活的方方面面，直到最后真正理解这个世界。而很显然， Kimi 推理模型的泛化能力已经开始显现出来了。在数据见顶...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

国内首个！百度文心大模型X1 Turbo斩获信通院最高评级证

...成为国内首款通过该测评的大模型。其中，文心X1 Turbo在逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。AI Day现场，百度吴甜系统性讲解了文心大模型最新版的技术创新。她介...……更多

2025-05-21 07:20:00信通,文心,模型,证书,文心,模型

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

大模型降价背后，国产大模型的竞争逻辑变了

...市场拱手让人。另一方面，随着大模型产业的快速发展，推理成本飞速下降，也成为终端降价的基础。据百度官方透露，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了1...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

算力逻辑修复！各大厂商接入DS催化港股AI基建概念李彦宏称

...极发展成本较低的自有ASIC方案，并把重心从AI训练转往AI推理，预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展。中信证券的研报也指出，DeepSeek通过工程化能力创新，实现了大模型训练和推理算力成...……更多

2025-02-17 16:31:00大厂,李彦,港股,基建,催化,接入

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...一代“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

百度智能云两大基础设施再升级！打造AI时代最开放的智能基础设

...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点：推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力，实现算力性能与成本的双重突破。本次大会...……更多

2025-04-25 16:27:00基础设施,设施,智能,基础,升级,开放

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型

...解释：“过去，ChatGPT等大模型像文科生，不擅长理科和逻辑推理。而对人类智慧来说，最底层的智慧是逻辑，逻辑之上是数学，再上面是物理、化学等科学。”去年9月，OpenAI发布的o1推理大模型改变了“文科生”形象，它擅长...……更多

2025-01-29 21:29:00上海,下岗,模型,智能,开发,企业

东大发布深度推理法律垂域大模型

实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯（记者何洁通讯员毕胜）近日，东南大学法学院数字法学团队依托东南大学大数据计算中心，正式发布国内高校首个深度推理法律垂域大模型—...……更多

2025-03-19 08:25:00东大,推理,深度,模型,法律,法律

第二届世界科学智能大赛启动向全球发起选手招募

...我们需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理，打造‘灰盒’可信大模型。具体而言，通过融合科学规律、观测数据和合成数据，开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席，上智...……更多

2024-07-05 14:45:00第二届,招募,选手,大赛,智能,科学

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

亚马逊推出“自动推理检查”工具，对抗 AI 幻觉

...拉斯维加斯举办的 re:Invent 2024 大会上，AWS 推出了“自动推理检查”（Automated Reasoning checks）工具，该工具通过交叉引用客户提供的信息来验证模型的响应准确性。AWS 宣称，这是“第一个”也是“唯一”的针对幻觉的防护措施。...……更多

2024-12-05 10:41:00亚马,亚马逊,幻觉,推理,对抗,检查

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

腾讯大模型混元Turbo：御气升昺云，梓桐金鼎开

...不足，腾讯还特别强化了模型在高质量文本创作、数学和逻辑推理等方面的能力。文本创作能力的显著提升在文本创作领域，大多数大模型表现平平，尤其在专业写作方面，常常缺乏足够的灵活性和精准度。混元Turbo在这方面...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

百川智能发布baichuan3稳定语言模型

...语言处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

香港金融科技周|度小满CEO朱光：推理大模型将深入到金融核心

...布了GPT-o1大模型，“思考能力”显著提升，能够进行复杂逻辑推理和问题拆解。在本次大会上，朱光也分享了度小满用推理大模型在风控场景上做的一些创新性探索。在信贷领域，推理大模型可以通过分析客户的征信报告、银行...……更多

2024-11-21 13:55:00金融,香港,推理,模型,核心,业务

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

火山引擎谭待：大模型的超低定价，来自对技术的信心

...大模型的超低价格引发行业震动。据悉，豆包主力模型的推理输入价格只有0.0008元/千Tokens，比行业便宜99.3%。对此，谭待坦言，“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这...……更多

2024-05-16 11:29:00火山,模型,定价,信心,引擎,技术

DeepSeek的能力，到底从哪里来？

...开评测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

人工智能的真面目到底是什么？是数学、逻辑学，还是计算机科学？

...在人工智能中发挥着重要作用。早期的专家系统就是基于逻辑推理构建的。逻辑学提供了一种形式化的方法来描述和推理世界，使得计算机能够模拟人类的思维方式进行推理和决策。虽然现代的深度学习技术已经不再直接使用逻...……更多

2024-08-05 09:46:00逻辑学,人工智能,真面目,人工,逻辑,数学

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...一在今年5月的 OpenCampass 测试榜单中，TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本，TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中，以 86.9 分的成绩排名第一。其通用能力较 Tele……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

位列第一梯队，腾讯混元再度领跑国内大模型

...、多维度的综合性测评基准，由十大基础任务组成，包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本，通过多维度综合性测评，真实准确地反映了国内外大模型...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

云天励飞发布14nm Chiplet大模型推理芯片

...理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型、Lla...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...数。ARC-AGI由Keras之父Fran ? ois Chollet开发，主要是通过图形逻辑推理来测试模型的推理能力。以100%为最高分的ARC-AGI评估结果显示，在低计算场景中，o3得分为75.7%，而在高计算测试中，它达到了87.5%。这标志着，o3的最佳成绩超过...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

智谱发布电脑智能体大模型GLM-PC：回车即用协助完成各类

...成各类电脑任务。GLM-PC的“深度思考”模式升级，强化了逻辑推理和代码生成能力，模仿人脑的分工合作，将逻辑推理与感知认知深度结合。GLM-PC的“左脑”负责代码生成与逻辑执行，具有规划、循环执行、长思考能力（动态反...……更多

2025-01-24 19:34:00电脑,模型,任务,智能,智能,认知

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能