新时代,推理,逻辑,模型,模型,问题头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

财联社9月13日讯北京时间周五凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

“AI科学家”登场科研自动化时代来了？

...自动化科研和开放式发现的综合AI系统，标志着科学发现新时代的开始。尽管它展现出非凡的潜力，但目前并不完美，应警惕“AI科学家”被滥用的风险。推进流程行云流水AI技术不断进步，让科学家能借助一些模型来集思广益或...……更多

2024-09-12 07:47:00科学家,科研,自动化,科学,时代,科学家

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出，数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

数字法理的根基与面向

...过程中，其范围、种类和功能也需要客观考量。从而催生新时代的数字法理。其二，数字法律关系。随着数字时代的到来，人类进入了不依赖于时间、地点的数字化生存模式，每个人都会在数字交往中形成碎片化的、多处“流动...……更多

2023-11-06 05:06:00数字,法律,算法,数据,法理,社会

利唐i人事：AI智能体员工驱动，实现HR管理效率新范式

...。其战略布局不仅引领企业走进智能体员工与人类协同的新时代，更为企业的智能化转型提供全方位的坚实支持。企业需要HR超级智能体员工？传统的科层制金字塔、矩阵式组织、敏捷型组织以及磁吸型组织等架构，在应对日益...……更多

2025-03-14 11:45:00范式,效率,人事,员工,驱动,智能

重庆市政协委员吴怡：利用AI大模型为民众提供法律服务

...伦理道德争议等挑战。她认为，在法律与科技相互交融的新时代，应更加清晰地界定并履行相关责任主体的权利与义务，充分利用科技推动司法公正。目前，该法律机器人已在社区、法院、派出所等场所为百姓提供法律咨询服务...……更多

2025-01-20 15:21:00重庆市,重庆,法律服务,政协委员,民众,模型

超星未来梁爽：软硬件协同优化，赋能AI 2.0新时代

...爽博士出席并发表主题演讲《软硬件协同优化，赋能AI2.0新时代》。大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键自ChatGPT发布以来，大模型引爆“第四次工业革命”，成为AI2.0时代的“蒸汽机”，驱动着...……更多

2024-07-22 13:00:00超星,梁爽,软硬,新时代,模型,超星

人工智能赋能法律服务市场，数智融合开创普惠新格局

...实现全流程案件追踪，显著降低争议复发率。然而，作为新时代技术，它面临的严峻挑战也不容忽视。当前法律人工智能仍处于弱人工智能阶段，落地应用面临多重障碍。在技术层面，法律制度与基础设施存在明显脱节，各国出...……更多

2025-06-28 06:21:00普惠,人工智能,法律服务,格局,人工,智能

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

梦想当“燃”｜不断破局！这个浪潮青年团队如何让大模型实现“量

...者，更是智能化转型的践行者，他们正用青春与智慧，为新时代新青年奋斗之路写下生动注脚。下面，一起来了解他们的故事。扎根一线，用代码重构治水底层逻辑近年来，大模型技术和智能体发展突飞猛进，智能体已成为驱动...……更多

2025-05-29 12:33:00浪潮,模型,团队,不断,青年,梦想

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

...了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

云鼎科技：基于DeepSeek，打造垂域矿山大模型

...化服务，以技术创新推动业务发展，赋能行业迈向智能化新时代。通讯员：李冬厚刘强张财王海涛 ……更多

2025-02-26 22:55:00矿山,模型,科技,模型,应用,数据

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

号称博士生水准！OpenAI最新模型仍分不出9.11和9.8

...科技9月14日消息，OpenAI推出了OpenAI o1预览模型，官方宣称推理能力更强，可达理科博士生水准。按照官方技术博客说法，o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI o1的更多演示视频。比如使用OpenAI o1...……更多

2024-09-14 10:18:00博士生,水准,模型,博士,推理,模型

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

大模型降价背后，国产大模型的竞争逻辑变了

...市场拱手让人。另一方面，随着大模型产业的快速发展，推理成本飞速下降，也成为终端降价的基础。据百度官方透露，相比一年前，文心大模型的算法训练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了1...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

page 1/3334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

加速“买全球”，今年单量突破1亿单——义乌成为我国跨境电商进

浙江日报义乌12月3日电（记者拜喆喆何贤君共享联盟·义乌吴峰宇） 3日，义乌今年第1亿个跨境电商进口订单完成打包

2025-12-04 08:41:00

中国科大新实验终结爱因斯坦与玻尔世纪之辩

大皖新闻讯大皖新闻记者从中国科学技术大学获悉，该校潘建伟、陆朝阳、陈明城教授等组成的研究团队，利用光镊囚禁的量子基态单原子

2025-12-04 11:03:00

北京消协联合8家电商平台承诺：严禁AI换脸仿冒名人明星带货

中新经纬12月4日电 “北京市场监管”微信号4日消息，为应对AI合成技术滥用风险，规范电商直播行业秩序，近日，北京市消费者协会(以下简称“北京消协”)联合京东

2025-12-04 11:06:00

$用一张照片告别2025：富士胶片X-SPACE三城点亮\$

用一张照片告别2025：富士胶片X-SPACE三城点亮"影像

2025年11月起，富士胶片影像共享空间X-SPACE于上海、南京、杭州三地先后启动年末特别企划——"影像之树"作品征集与交流活动

2025-12-04 11:49:00

《2026年中国礼品行业展望白皮书》发布“差异化”和“质价比

2025年10月20-23日，第33届深圳礼品家居展于深圳国际会展中心举办，展会同期进行的2025中国礼业高峰论坛上，展会主办方励展华博第三次携手国际知名咨询公司凯度重磅首发《2026年中国礼品行业展望白皮书》

2025-12-04 11:55:00

体育总局：鼓励境外优质资本投资国内各级各类职业联赛

中国网12月4日讯据国家体育总局网站消息，体育总局日前印发《关于进一步推进篮球改革发展的意见》。其中提出，有序促进职业篮球开放

2025-12-04 12:16:00

短剧“薅”长剧羊毛保护原创等不得-中国吉林网

长白时评评论员刘颂寒12月1日，电视剧《家业》和制片方华策影视发文，谴责部分短剧投机取巧，擅自截取《家业》宣传物料中的创意元素“跟拍”

2025-12-04 13:48:00

清风相伴，智造新势力“拔节生长”

近年来，智能制造产业园引导企业顺应数字化浪潮，积极落实智改数转，推动科技创新与产业创新深度融合。以南汽集团为核心的汽车产业

2025-12-04 11:20:00

储热赋能双碳智慧引领供热泰山集团高电压直入式电储能技术破

鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下，电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈

2025-12-04 09:57:00

上海街头的数字生活指南，是城市数字品牌与公共艺术的对话

在上海，街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌，是“智云上海”这个城市信息化名片的立体呈现

2025-12-04 08:17:00

基于提示工程的模型输出不确定性量化分析

摘要：随着生成式人工智能技术在各行业的广泛应用，模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性，对输出不确定性进行量化分析成为重要方向

2025-12-04 06:17:00

给智能体装上“大脑”和“小脑”

杭州博士后用AI让机器懂协作、更安全杭州日报讯让机器从执行命令的“孤岛”，成为懂得协作的群体？让机器人安全走进人类生活

2025-12-04 06:38:00

紫林醋业产品通过欧盟认证

12月3日从紫林醋业获悉，紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification)，获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)

2025-12-04 07:31:00

豆包手机助手回应“侵犯用户隐私”：不存在任何黑客行为

中新经纬12月3日电 12月3日，豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应，称不存在任何黑客行为。具体来看

2025-12-04 07:42:00

支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖

12月1日-3日，由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上，首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式

2025-12-04 07:47:00

头条订阅服务