• 我的订阅
  • 头条热搜
逻辑的有效性与方向性
逻辑推理的有效性是指有效的推理,如果前提为真,其结论必然为真。 可是大家在认识过程中特别是在科学研究中还要用到其他推理形式,这些推理前提为真,结论可能真实,并因类型不同、条件不同,结论的可靠程度也不同...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度的影响,表现出类似的错误倾向。研究背景人类在推理过程中存在两种系统:“直觉系统”和“理性系...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...模型可能会导致模型混乱或导致收益递减。同时,CoT 的有效性还部分取决于所提供示例的质量。推理步骤越清晰、越符合逻辑,模型就能更好地学习并将这种推理应用于新问题。而这不仅有助于更准确地解决问题,还有助于以...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...答场景,取得了显著的精度提升,表明其在专业决策中的有效性。5) KAG 模型:定义 LLMs 与 KGs 之间的协同任务KAG 模型旨在降低大型语言模型(LLMs)与知识图谱(KGs)结合的成本,利用指令合成技术使较小模型在性能上接近更...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...务需求。4. 多领域数据集与综合评估为了验证TS-Reasoner的有效性,本文在金融和能源领域构建了多个新数据集,并设置了一系列复杂的推理任务。这些任务涉及金融决策、时间序列预测、因果关系挖掘等。实验结果表明,TS-Reasone...……更多
百川智能发布baichuan3稳定语言模型
...语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多
历史:题型归类训练 提升核心素养
...,将成为常考的题型。围绕主题特征构建知识结构对教材逻辑体系、知识内容的深入挖掘,是复习备考的基石。而高考真题是复习备考的重要资料,对高考真题的命题方向、高频考点及答案、语言风格的深入研究,是复习备考的...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...看看DoT长啥样。大模型复杂推理新框架 如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)。其框架内部管理三个关键角色:提议者:生成命题或推理步骤,添加新节点。 批评者:评估命题,识别错误、不...……更多
o1带火的CoT到底行不行?新论文引发了论战
... CoT 带来增益最大的三类任务分别是:符号推理、数学、逻辑推理。在这三个任务上,CoT 实现的平均性能为 56.9,而不使用 CoT 的表现为 45.5。而在其它任务上表现较好的个例(图中用黄色高亮标记出了 10 个),也或多或少与这...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...一在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 Tele……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...现模型的自我进化。在使用 LTM 数据以最大限度地提高其有效性和效率的过程中需要解决几个关键挑战,包括:适应持续更新的 LTM 数据。随着用户 LTM 数据的不断积累,模型必须在学习新信息和保留先前获取的知识之间取得平衡...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...证明了训练连续提示嵌入可以提高LLM在下游任务上的性能有效性。在RECIPE中,研究人员将每个知识陈述的编辑视为一项小任务,没有为每个小任务微调特定的提示编码器,而是通过训练生成连续提示的RECIPE模块来实现这些小任务...……更多
迷综脱胎于悬疑推理小说内容上要求很强的逻辑性和精巧的悬疑情节
...表达方式,节目的最终目标仍然是“解谜”,所以严密的逻辑、盘根错节的线索、错综复杂的人物关系显得尤其重要。《魔方新世界》剧照节目中往往有极高密度的信息输出,不仅需要创作者把握好节奏,更要求观众在观看过程...……更多
...需要对作战活动进行精确设计,才能增强作战的针对性、有效性,提高作战效益。作战中,运用精确思维,一要精确筹划作战。着眼达成作战目的,对主要作战方向、打击目标、战法、作战部署等关键内容进行精确设计和谋划,...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...度30个二级维度。报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。Super...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...,其核心是通过输入的字符串来预测下一个字符。而符号逻辑推理的典型代表是过去出现的专家系统。然而,由于各自的局限性,这两种方法在AI的发展过程中并未带来彻底的革命性变革。当前,联结主义的巅峰——AIGC 技术,...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...始在一些权威评测中取得领先。今天,国内首款具备中文逻辑推理能力的 o1 模型来了,它便是由昆仑万维推出的「天工大模型 4.0」 o1 版(英文名:Skywork o1)。这也是近一个月来,该公司在大模型及相关应用上的第三次大动作...……更多
人工智能应用场景不断拓展
...能,下一代的模型须具备更大规模、更复杂、更多层次的逻辑推理能力,全世界先进模型的投入门槛将达到数十亿、数百亿美元的级别。清华大学人工智能研究院副院长朱军说,大模型的发展一方面要让消费者参与和交互,另一...……更多
物理:情境命题,侧重考查逻辑推理
...些年,物理高考的数学计算量不大,但是物理情境分析、逻辑推理的题型较多,注重对主干知识和重要内容的考查,试题难度系数0.3以上(系数值越小难度越大)的分值有70—80分之多,中等及以下难度的题目占大部分,这对于...……更多
强推理强逻辑强现实 电视剧《大唐狄公案》2月6日开播
原标题:强推理强逻辑强现实电视剧《大唐狄公案》2月6日开播古装悬疑探案剧《大唐狄公案》将于2月6日登陆CCTV-8播出,优酷全网独播。该剧讲述了唐代名臣狄仁杰拜官之初,履职各地屡破奇案,惩治贪官、护海防、肃黑恶、...……更多
...析与定量计算有机融合,实现从数据关联到因果解释再到逻辑推理的认知智能跃迁。最终,通过数据驱动的智能预测范式,克服传统预测方法的局限性,充分挖掘数据价值,持续提升预测的精准性和鲁棒性,实现从经验驱动到智...……更多
...习效果,达成基本运用。密切联系实际,提高课堂教学的有效性。在教学过程中,教师如果能充分利用学生身边的生活现象引入新知,会使学生对所学知识产生亲切感,激起学生探求新知的强烈渴望。从学生的生活经验和已有的...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...23 年 2 月。当时,已经有一些研究团队开始使用大模型做逻辑推理和数学推理。赵子龙和合作者也认为这个方向很有前景。他表示让自己印象最深的例子就是 OpenAI 网站上的一道数学推理的题: Simplify tan100 + 4sin100。根据 OpenAI 自...……更多
时间的本质到底是什么?是客观存在的还是人们的错觉?
...”就不再是第一时刻,因为一定有比它更早的时间。这种逻辑推理表明,时间不可能有一个开始,同样也不可能有结束。时间是一个连续的、无始无终的存在,它与宇宙共存亡。宇宙的起源并不意味着时间的起源,时间在宇宙大...……更多
引导青年积极与时代深度对话
...名有理性的大学生,才是真正的现代人。因为其善于运用逻辑推理、批判思维、分析方法来认识世界、解决问题。“青年说”中的很多时评就是大学生以法律、道德和伦理为基础,理性认识世界的反映,它基于事实但又高于事实...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicArena——一个真正意义上的AI奥运竞技场。在这里,AI不...……更多
...个只有8%。研究人员根据答案是否正确以及答案所包含的逻辑推理是否有效,对大语言模型的答案进行了分类。实验的第一个结果是,在每个测试重复十次的情况下,答案是不一致的。例如,在同一个测试中,有的模型十次中答...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...二、社会评测与同行水平社会评测普遍认可o1 系列模型的逻辑推理能力优于 GPT-4o,但也有很多人提出了不同看法。差评XPIN邀请了理综三科的博士测评,物理评价较高,而生物、化学评价较低,综合认为o1在认知上达到硕士水平...……更多
塔伦斯:《洛基》变成了推理片,本森符合《奇异博士》的感觉
...个季度加入了恐怖片的元素,而且《蜘蛛侠》衍生作品的逻辑性有所增强,这些都是本森的强项。《奇异博士》给人的感觉就是:越来越不像宇宙电影,而是像全民破案的推理片,影迷们讨论凶手、反派的定位是什么,而不是超...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...节点的条件和前提进行审视性评判,并对节点和节点间的逻辑连接进行思考,以便判断当前步骤是否出错;其三,需要能够代入不同假设,或反事实地(counterfactually)针对未来的推理路径进行预演和分析,从而判断这一答案是...……更多
更多关于科技的资讯:
中国赴泰旅游不降反增:单日入境中国游客超2万人
1月18日消息,据国内媒体报道称,目前的情况是,中国赴泰旅游的人数不降反增,似乎并没有太受外界的影响。泰国旅游与体育部部长索拉翁先生透露
2025-01-18 21:28:00
与辉同行带货阿胶茶未检出驴成分:相关产品已下架
快科技1月18日消息,据媒体报道,有消费者反馈,与辉同行直播间销售的“千年珍红参阿胶女神茶”未检验出驴源性成分。根据消费者提供的检测报告
2025-01-18 21:58:00
券商海通造小米与蔚来“绯闻”:两家车企高管同时下场辟谣
快科技1月18日消息,近日,海通国际证券公司发布研究报告,提出2025年五大猜想。其中一个猜想将蔚来与小米联系在了一起
2025-01-18 22:28:00
选主板务必要看PCIe插槽:教你怎么选
在计算机硬件领域,PCIe(PCI Express)扮演着至关重要的角色,它不仅为高性能硬件设备提供了数据传输的高速通道
2025-01-18 22:58:00
日本特大地震警告:概率升至80%
1月18日消息,据媒体报道,近日日本地震调查小组警告称,未来三十年内南海海槽发生“特大地震”(即8级及以上)的概率已经提升至80%
2025-01-18 22:58:00
下周今年来最大范围雨雪将上线:注意防范
1月18日消息,据气象台消息,从下周开始,也就是春节前几天,我国会有一轮雨雪过程发展。据报道,1月23-25日,中东部地区将自西向东出现一次较大范围降水过程
2025-01-18 22:58:00
2024年全球显示器出货量1.27亿台:戴尔夺第一
快科技1月18日消息,根据洛图科技(RUNTO)最新数据显示,2024年全球显示器市场品牌整机出货量达1.27亿台,较2023年增长1
2025-01-18 17:58:00
那些总戴假睫毛的人 现在都怎么样了
不少女性朋友热衷于过年“三件套”:烫发、美甲、接睫毛。过年新造型,迎接好心情,过年前的仪式感满满。浓密纤长又卷翘的漂亮睫毛能让眼睛变大变美变漂亮
2025-01-18 17:58:00
借鉴visionOS 苹果iOS 19相机界面迎来重大改版:更加简洁透明
快科技1月18日消息,据媒体报道,苹果iOS 19将会借鉴visionOS,对相机界面进行重大调整。根据曝光的渲染图,iOS 19相机界面底部是照片和视频两大按钮
2025-01-18 18:28:00
联想发布异能者S130:英特尔N100处理器+3K触控屏
快科技1月18日消息,联想推出了一款全新的二合一电脑,异能者 S130,该设备属于联想的“生态品牌”系列。外观设计方面
2025-01-18 18:28:00
苏州微短剧产业联盟成立
江南时报讯 1月16日,苏州微短剧产业联盟成立仪式暨《微短剧遇见苏州》主题活动举行。新成立的苏州微短剧产业联盟致力于破解微短剧创作
2025-01-18 18:42:00
买齐至少500元 《王者荣耀》六款蛇限皮肤正式公布:灵感来自南斗六星
快科技1月18日消息,今天《王者荣耀》正式公布了蛇限皮肤,共计6款,将于1月28日(除夕)起正式上线。官方推出了好运卡活动
2025-01-18 18:58:00
OLED屏无望!苹果新款MacBook Air将拥抱TFT LCD屏幕
快科技1月18日消息,苹果公司正在研发一款新的MacBook Air,预计将在2027年发布,笔记本将采用氧化物薄膜晶体管(TFT)液晶显示屏(LCD)
2025-01-18 19:28:00
容貌巨变 确诊渐冻症女生求助蔡磊:我真的快要坚持不下去了
快科技1月18日消息,据媒体报道,湖南渐冻症女生陈静雯发布视频求助蔡磊,因她本人无法说话,所以视频声音为代录。在视频中陈静雯表示
2025-01-18 19:28:00
广东都快干成厂东了:久未下雨 空气湿度不足30%
1月18日消息,据气象台消息,广东久未下雨,多地空气湿度不足30%,南雄更是低至23%。天气如此干燥,有网友表示,广东都快干成“厂东”了
2025-01-18 19:58:00