新时代,推理,逻辑,模型,模型,问题头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

财联社9月13日讯北京时间周五凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

“AI科学家”登场科研自动化时代来了？

...自动化科研和开放式发现的综合AI系统，标志着科学发现新时代的开始。尽管它展现出非凡的潜力，但目前并不完美，应警惕“AI科学家”被滥用的风险。推进流程行云流水AI技术不断进步，让科学家能借助一些模型来集思广益或...……更多

2024-09-12 07:47:00科学家,科研,自动化,科学,时代,科学家

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出，数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

数字法理的根基与面向

...过程中，其范围、种类和功能也需要客观考量。从而催生新时代的数字法理。其二，数字法律关系。随着数字时代的到来，人类进入了不依赖于时间、地点的数字化生存模式，每个人都会在数字交往中形成碎片化的、多处“流动...……更多

2023-11-06 05:06:00数字,法律,算法,数据,法理,社会

利唐i人事：AI智能体员工驱动，实现HR管理效率新范式

...。其战略布局不仅引领企业走进智能体员工与人类协同的新时代，更为企业的智能化转型提供全方位的坚实支持。企业需要HR超级智能体员工？传统的科层制金字塔、矩阵式组织、敏捷型组织以及磁吸型组织等架构，在应对日益...……更多

2025-03-14 11:45:00范式,效率,人事,员工,驱动,智能

重庆市政协委员吴怡：利用AI大模型为民众提供法律服务

...伦理道德争议等挑战。她认为，在法律与科技相互交融的新时代，应更加清晰地界定并履行相关责任主体的权利与义务，充分利用科技推动司法公正。目前，该法律机器人已在社区、法院、派出所等场所为百姓提供法律咨询服务...……更多

2025-01-20 15:21:00重庆市,重庆,法律服务,政协委员,民众,模型

超星未来梁爽：软硬件协同优化，赋能AI 2.0新时代

...爽博士出席并发表主题演讲《软硬件协同优化，赋能AI2.0新时代》。大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键自ChatGPT发布以来，大模型引爆“第四次工业革命”，成为AI2.0时代的“蒸汽机”，驱动着...……更多

2024-07-22 13:00:00超星,梁爽,软硬,新时代,模型,超星

人工智能赋能法律服务市场，数智融合开创普惠新格局

...实现全流程案件追踪，显著降低争议复发率。然而，作为新时代技术，它面临的严峻挑战也不容忽视。当前法律人工智能仍处于弱人工智能阶段，落地应用面临多重障碍。在技术层面，法律制度与基础设施存在明显脱节，各国出...……更多

2025-06-28 06:21:00普惠,人工智能,法律服务,格局,人工,智能

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

梦想当“燃”｜不断破局！这个浪潮青年团队如何让大模型实现“量

...者，更是智能化转型的践行者，他们正用青春与智慧，为新时代新青年奋斗之路写下生动注脚。下面，一起来了解他们的故事。扎根一线，用代码重构治水底层逻辑近年来，大模型技术和智能体发展突飞猛进，智能体已成为驱动...……更多

2025-05-29 12:33:00浪潮,模型,团队,不断,青年,梦想

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

...了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

云鼎科技：基于DeepSeek，打造垂域矿山大模型

...化服务，以技术创新推动业务发展，赋能行业迈向智能化新时代。通讯员：李冬厚刘强张财王海涛 ……更多

2025-02-26 22:55:00矿山,模型,科技,模型,应用,数据

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

号称博士生水准！OpenAI最新模型仍分不出9.11和9.8

...科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1...……更多

2024-09-14 10:18:00博士生,水准,模型,博士,推理,模型

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

大模型降价背后，国产大模型的竞争逻辑变了

...市场拱手让人。另一方面，随着大模型产业的快速发展，推理成本飞速下降，也成为终端降价的基础。据百度官方透露，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了1...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

page 1/3334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

主动对接专项辅导太原税务助力经营主体应对消费旺季

从乡村直播间的农特产品，到城市商场的促销热潮，再到物流行业的高效运转……记者从太原市税务局获悉，随着“双11”将下半年消费市场带入旺季

2025-11-21 08:12:00

天阳科技发布“量子增强计划”，多方聚力共筑“量子金融”新生态

近日，以 “量子计算+AI：重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开，本次研讨会由天阳宏业科技股份有限公司（以下简称 “天阳科技”）主办

2025-11-21 08:29:00

奋进的河北·“十四五”答卷丨身边的“十四五”（四）：车间里的

向智而行，新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统，实现订单与产能高效匹配；石家庄四药集团应用生产执行系统

2025-11-21 08:36:00

华厦眼科发布《厦门市新闻工作者眼健康白皮书》打造职业健康保

“看见”，是新闻工作的起点。守护新闻工作者的清晰视野，就是守护社会公器的明亮窗口。11月18日，在厦门市新闻工作者协会指导下

2025-11-21 09:40:00

网易 UU 远程 Mac 被控功能上线，提升 macOS高效

网易 UU 远程全新版本上线，在已有 Mac 控制 PC 功能的基础上，正式开放 Mac 设备被控功能，自此 Mac 实现控制与被控的双向协作

2025-11-21 09:47:00

小米回应“潜水手表不能潜水”：相关报道失实

中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示

2025-11-21 11:11:00

阿里巴巴承办COP30中国角边会展示AI驱动气候治理新成果

第30届联合国气候变化大会（COP30）于11月10日至21日在巴西帕拉州首府贝伦市举办，这是2015年《巴黎协定》签署以来最受瞩目的气候大会

2025-11-21 11:36:00

数绘星云与腾讯云达成战略合作，共同推动AI出海电商智能化升级

11月18日，数绘星云（深圳）科技有限责任公司与腾讯云正式签订战略合作协议，双方将在云计算、大数据、AIGC等核心领域开展深度合作

2025-11-21 11:48:00

外媒：基于Gemini 3，谷歌再推AI图像生成器

中新经纬11月21日电据彭博社报道，当地时间20日，谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型

2025-11-21 11:53:00

陕西“十四五”科技创新发展特写|边研边产、产研互动这个团队

回望“十四五”，西安交通大学方涛教授说，他们团队倍感振奋。“在国家能源结构转型关键期，我们扎根国家‘双碳’战略，依托西安交大强大科研平台

2025-11-21 13:29:00

盲盒手办发展既要讲增长也要重安全

舒朗秋11月19日，工业和信息化部举行新闻发布会，介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍，我国建成了全球最为完善的玩具产业链

2025-11-21 14:19:00

从年度词汇看社会发展脉动

向长河英国剑桥大学出版社近日宣布，与追星相关的词语“准社交”（parasocial）成为2025年《剑桥词典》年度词汇

2025-11-21 14:19:00

2025世界计算大会发布全球计算十大创新成就

20日，2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括

2025-11-21 15:35:00

系统创业自由人生｜首届雨大王大健康私域 IP 创业峰会在深

2025年11月1日-2日，为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业，自由人生"为主题

2025-11-21 15:41:00

《保险AI智能体应用白皮书》发布，四层架构＋七大场景定义行业

随着人工智能技术加速重塑千行百业，以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业，伴随数字化进程的深入推进

2025-11-21 15:42:00

头条订阅服务