• 我的订阅
  • 头条热搜
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
财联社9月13日讯北京时间周五凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...去,如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份,OpenAI 正式公开前所未有的复杂推理大模型 o1,这是一个重大突破,新模型既具有通用的能力,也可以解决比此前的科学、代码和数学模型能...……更多
...自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。推进流程行云流水AI技术不断进步,让科学家能借助一些模型来集思广益或...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...tical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...伴生一系列 AI 相关的职业,催生 AI 程序员。ChatGPT 就是新时代的 OS,现在每个人都可以尝试把专业领域的知识以用户体验的方式传达出去,ChatGPT 可以观察到每一个问题的深度,准确地满足用户的需求。从人机交互的角度,王千...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
...科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能 【云从科技发布从容大模型 可支持图文理解、文案写作、逻辑推理等功能】《科创板日报》18日讯,云从科技发布从容大模型。在现场演示中,从容大模型可支...……更多
...过程中,其范围、种类和功能也需要客观考量。从而催生新时代的数字法理。其二,数字法律关系。随着数字时代的到来,人类进入了不依赖于时间、地点的数字化生存模式,每个人都会在数字交往中形成碎片化的、多处“流动...……更多
利唐i人事:AI智能体员工驱动,实现HR管理效率新范式
...。其战略布局不仅引领企业走进智能体员工与人类协同的新时代,更为企业的智能化转型提供全方位的坚实支持。 企业需要HR超级智能体员工?传统的科层制金字塔、矩阵式组织、敏捷型组织以及磁吸型组织等架构,在应对日益...……更多
...伦理道德争议等挑战。她认为,在法律与科技相互交融的新时代,应更加清晰地界定并履行相关责任主体的权利与义务,充分利用科技推动司法公正。目前,该法律机器人已在社区、法院、派出所等场所为百姓提供法律咨询服务...……更多
超星未来梁爽:软硬件协同优化,赋能AI 2.0新时代
...爽博士出席并发表主题演讲《软硬件协同优化,赋能AI2.0新时代》。 大模型是AI2.0时代的“蒸汽机” AI+X应用落地及边缘计算将成为关键 自ChatGPT发布以来,大模型引爆“第四次工业革命”,成为AI2.0时代的“蒸汽机”,驱动着...……更多
图灵奖得主杨立昆:AI的逻辑推理和规划能力有限,会犯事实错误和逻辑错误
...法国视频连线北京现场,发表了主题为《走向能够学习、推理和规划的大模型》的演讲,表达了对于人工智能的深度思考。搜狐科技在智源大会现场观看了这场演讲,从杨立昆演讲时面露微笑的表情中,可以感受到杨立昆对于人...……更多
大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
...型面临的最重要的挑战之一。第二,大模型的数学和逻辑推理能力仍然需要加强。虽然GPT-4在某些考试中表现优异,但在面对一些精心设计的逻辑推理问题时,大模型的回答与随机答案相差无几。因为在进行深度推理时,即便大...……更多
...实现全流程案件追踪,显著降低争议复发率。然而,作为新时代技术,它面临的严峻挑战也不容忽视。当前法律人工智能仍处于弱人工智能阶段,落地应用面临多重障碍。在技术层面,法律制度与基础设施存在明显脱节,各国出...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
本文转自:人民网-安徽频道4月20日,科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
人工智能的“胡言乱语”,有没有解法?
...只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复:ChatGPT的训练使用了前所未有的庞大数据,并通过深度神经网络、自监督学习、强化学习和提示学习等人工智能模型进行训练。目前披露的ChatGPT的上一代G...……更多
大模型权威报告:讯飞星火得分第一
...“最聪明”大模型的重要体现,本次逻辑思维评测在逻辑推理、思维链等方面设计了较多的题目,包含类比、常识推理、空间方位、演绎推理、逻辑谬误检测、因果推理等19个二级分类,题型上相对平均,其中填空题最多,多选...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
梦想当“燃”|不断破局!这个浪潮青年团队如何让大模型实现“量身定制”
...者,更是智能化转型的践行者,他们正用青春与智慧,为新时代新青年奋斗之路写下生动注脚。下面,一起来了解他们的故事。扎根一线,用代码重构治水底层逻辑近年来,大模型技术和智能体发展突飞猛进,智能体已成为驱动...……更多
更多关于科技的资讯:
AI重塑南京钢铁产业新图景
从“钢花飞溅”到“数据奔流”,蹲点一线看“南钢+华为”元冶·钢铁大模型——AI重塑南京钢铁产业新图景南钢智慧中心内部。智能金相实验室
2025-08-08 07:14:00
竞争难度大,全球每年仅十人入选 南航博士生获国际奖学金
王立晗在实验室里。图片由受访者提供南报网讯(通讯员周新华记者姜静)近日,南京航空航天大学天元实验室博士研究生王立晗,凭借在微波光子测量领域的突出表现
2025-08-08 07:14:00
南报网讯(记者徐宁)近日,工信部公示了首批质量管理能力高等级企业名单,全国43家、江苏7家,南京的南京南瑞继保电气有限公司
2025-08-08 07:13:00
从单一爆款到多元化产品矩阵 解码东诚大健康协同发展方程式
大众网记者 王丽 烟台报道在老龄化加速与健康消费升级的双重浪潮下,中国大健康产业正迎来黄金发展期。作为为国内原料药领域企业拓展大健康领域的标杆
2025-08-07 23:59:00
烟台银行数字化转型再提速 获评“数智化转型先锋企业”
大众网记者 李慧 通讯员 李东霞 烟台报道近日,由金科创新社主办的“2025金融科技创新发展论坛暨第八届金融科技管理人年会”在成都举行
2025-08-07 15:23:00
全球销量增20%,份额净增1.2pct!海尔空调郑州发布新成果
持续的高温炙烤与“以旧换新”政策叠加,让今年的空调市场格外火热。面对行业普遍面临的流量枯竭、行业内卷、高运营成本三大挑战
2025-08-07 15:36:00
强冷必然不舒适?海尔云溪“性能神机”两者兼得
长久以来,空调行业似乎藏着一个隐形难题:想拥抱快速制冷的强劲体验,就得忍受冷风直吹的不适;若追求柔和风感,又难免要和制冷效率妥协
2025-08-07 15:38:00
AI空调陷入红海!海尔空调率先主导AI空调标准领先一步
夏天离不开空调,但现在的“AI空调”是不是让你有点懵?语音喊半天它听不懂你的方言?功能按键一大堆,真正有用的没几个?宣传说得天花乱坠
2025-08-07 15:38:00
海尔空调主导制定行业首个AI空调标准
在人工智能技术重塑空调行业的浪潮中,市场涌现大量“AI概念”产品。然而,在快速发展过程中,部分产品未能真正聚焦用户对“智能便捷 + 健康舒适”的核心需求
2025-08-07 15:39:00
医渡科技多篇高质量科研论文见刊,“产品+服务”模式成效显著
近一年,国内AI医疗头部企业医渡科技(2158.HK)在“AI for Science”浪潮中持续发力,深度融合AI技术与疾病洞察力
2025-08-07 15:47:00
营养师团队深度护航,燕教授助力经销商突破事业瓶颈
在健康产业蓬勃发展的今天,经销商们既面临着广阔的市场机遇,也承受着日趋激烈的竞争压力。如何精准把握消费者需求、高效解决服务过程中的疑难问题
2025-08-07 15:47:00
新华网北京8月7日电(韩永先)6月25日,宁德时代(300750.SZ)以不正当竞争纠纷为由,对海辰储能等公司发起的专利技术型诉讼即将在8月12日开庭审理
2025-08-07 15:47:00
华鼎冷链赋能北京餐饮冷链 构建京津冀快速冷链配送网
在餐饮连锁化率突破20%的背景下,北京餐饮市场对冷链运输的需求呈现精细化、高效化特征。作为专注冷链物流基础设施建设的服务商
2025-08-07 15:47:00
企鹅获艾媒咨询“中国户外羽绒服开创者”等多项市场地位确认
近期,企鹅获全球领先的新经济产业第三方数据挖掘和分析机构iiMedia Research(艾媒咨询)授予的“中国户外羽绒服开创者”“企鹅·专注保暖服饰69年”双项市场地位确认
2025-08-07 15:47:00
全民健身日来袭!墨迹天气“AI 生活指数”守护全民健康,让运动更科学!
古语有言,冬练三九,夏练三伏。许多喜欢健身的人都将其奉为圭臬。然而,当运动健身逐渐成为全民共识,天气状况却常常成为人们体重管理计划外的“绊脚石”
2025-08-07 15:47:00