• 我的订阅
  • 头条热搜
逻辑的有效性与方向性
逻辑推理的有效性是指有效的推理,如果前提为真,其结论必然为真。 可是大家在认识过程中特别是在科学研究中还要用到其他推理形式,这些推理前提为真,结论可能真实,并因类型不同、条件不同,结论的可靠程度也不同...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度的影响,表现出类似的错误倾向。研究背景人类在推理过程中存在两种系统:“直觉系统”和“理性系...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...模型可能会导致模型混乱或导致收益递减。同时,CoT 的有效性还部分取决于所提供示例的质量。推理步骤越清晰、越符合逻辑,模型就能更好地学习并将这种推理应用于新问题。而这不仅有助于更准确地解决问题,还有助于以...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...答场景,取得了显著的精度提升,表明其在专业决策中的有效性。5) KAG 模型:定义 LLMs 与 KGs 之间的协同任务KAG 模型旨在降低大型语言模型(LLMs)与知识图谱(KGs)结合的成本,利用指令合成技术使较小模型在性能上接近更...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...务需求。4. 多领域数据集与综合评估为了验证TS-Reasoner的有效性,本文在金融和能源领域构建了多个新数据集,并设置了一系列复杂的推理任务。这些任务涉及金融决策、时间序列预测、因果关系挖掘等。实验结果表明,TS-Reasone...……更多
百川智能发布baichuan3稳定语言模型
...语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”...……更多
历史:题型归类训练 提升核心素养
...,将成为常考的题型。围绕主题特征构建知识结构对教材逻辑体系、知识内容的深入挖掘,是复习备考的基石。而高考真题是复习备考的重要资料,对高考真题的命题方向、高频考点及答案、语言风格的深入研究,是复习备考的...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...看看DoT长啥样。大模型复杂推理新框架 如前所述,DoT将逻辑推理过程建模为在单个LLM内构建有向无环图(DAG)。其框架内部管理三个关键角色:提议者:生成命题或推理步骤,添加新节点。 批评者:评估命题,识别错误、不...……更多
o1带火的CoT到底行不行?新论文引发了论战
... CoT 带来增益最大的三类任务分别是:符号推理、数学、逻辑推理。在这三个任务上,CoT 实现的平均性能为 56.9,而不使用 CoT 的表现为 45.5。而在其它任务上表现较好的个例(图中用黄色高亮标记出了 10 个),也或多或少与这...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...一在今年5月的 OpenCampass 测试榜单中,TeleChat 系列模型的逻辑推理能力名列开源大模型榜单第一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 Tele……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...现模型的自我进化。在使用 LTM 数据以最大限度地提高其有效性和效率的过程中需要解决几个关键挑战,包括:适应持续更新的 LTM 数据。随着用户 LTM 数据的不断积累,模型必须在学习新信息和保留先前获取的知识之间取得平衡...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...证明了训练连续提示嵌入可以提高LLM在下游任务上的性能有效性。在RECIPE中,研究人员将每个知识陈述的编辑视为一项小任务,没有为每个小任务微调特定的提示编码器,而是通过训练生成连续提示的RECIPE模块来实现这些小任务...……更多
迷综脱胎于悬疑推理小说内容上要求很强的逻辑性和精巧的悬疑情节
...表达方式,节目的最终目标仍然是“解谜”,所以严密的逻辑、盘根错节的线索、错综复杂的人物关系显得尤其重要。《魔方新世界》剧照节目中往往有极高密度的信息输出,不仅需要创作者把握好节奏,更要求观众在观看过程...……更多
...需要对作战活动进行精确设计,才能增强作战的针对性、有效性,提高作战效益。作战中,运用精确思维,一要精确筹划作战。着眼达成作战目的,对主要作战方向、打击目标、战法、作战部署等关键内容进行精确设计和谋划,...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...度30个二级维度。报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。Super...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...,其核心是通过输入的字符串来预测下一个字符。而符号逻辑推理的典型代表是过去出现的专家系统。然而,由于各自的局限性,这两种方法在AI的发展过程中并未带来彻底的革命性变革。当前,联结主义的巅峰——AIGC 技术,...……更多
人工智能应用场景不断拓展
...能,下一代的模型须具备更大规模、更复杂、更多层次的逻辑推理能力,全世界先进模型的投入门槛将达到数十亿、数百亿美元的级别。清华大学人工智能研究院副院长朱军说,大模型的发展一方面要让消费者参与和交互,另一...……更多
物理:情境命题,侧重考查逻辑推理
...些年,物理高考的数学计算量不大,但是物理情境分析、逻辑推理的题型较多,注重对主干知识和重要内容的考查,试题难度系数0.3以上(系数值越小难度越大)的分值有70—80分之多,中等及以下难度的题目占大部分,这对于...……更多
强推理强逻辑强现实 电视剧《大唐狄公案》2月6日开播
原标题:强推理强逻辑强现实电视剧《大唐狄公案》2月6日开播古装悬疑探案剧《大唐狄公案》将于2月6日登陆CCTV-8播出,优酷全网独播。该剧讲述了唐代名臣狄仁杰拜官之初,履职各地屡破奇案,惩治贪官、护海防、肃黑恶、...……更多
...习效果,达成基本运用。密切联系实际,提高课堂教学的有效性。在教学过程中,教师如果能充分利用学生身边的生活现象引入新知,会使学生对所学知识产生亲切感,激起学生探求新知的强烈渴望。从学生的生活经验和已有的...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...23 年 2 月。当时,已经有一些研究团队开始使用大模型做逻辑推理和数学推理。赵子龙和合作者也认为这个方向很有前景。他表示让自己印象最深的例子就是 OpenAI 网站上的一道数学推理的题: Simplify tan100 + 4sin100。根据 OpenAI 自...……更多
时间的本质到底是什么?是客观存在的还是人们的错觉?
...”就不再是第一时刻,因为一定有比它更早的时间。这种逻辑推理表明,时间不可能有一个开始,同样也不可能有结束。时间是一个连续的、无始无终的存在,它与宇宙共存亡。宇宙的起源并不意味着时间的起源,时间在宇宙大...……更多
引导青年积极与时代深度对话
...名有理性的大学生,才是真正的现代人。因为其善于运用逻辑推理、批判思维、分析方法来认识世界、解决问题。“青年说”中的很多时评就是大学生以法律、道德和伦理为基础,理性认识世界的反映,它基于事实但又高于事实...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡量AI与“超级智能”距离的重要标尺。OlympicArena——一个真正意义上的AI奥运竞技场。在这里,AI不...……更多
...个只有8%。研究人员根据答案是否正确以及答案所包含的逻辑推理是否有效,对大语言模型的答案进行了分类。实验的第一个结果是,在每个测试重复十次的情况下,答案是不一致的。例如,在同一个测试中,有的模型十次中答...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...二、社会评测与同行水平社会评测普遍认可o1 系列模型的逻辑推理能力优于 GPT-4o,但也有很多人提出了不同看法。差评XPIN邀请了理综三科的博士测评,物理评价较高,而生物、化学评价较低,综合认为o1在认知上达到硕士水平...……更多
塔伦斯:《洛基》变成了推理片,本森符合《奇异博士》的感觉
...个季度加入了恐怖片的元素,而且《蜘蛛侠》衍生作品的逻辑性有所增强,这些都是本森的强项。《奇异博士》给人的感觉就是:越来越不像宇宙电影,而是像全民破案的推理片,影迷们讨论凶手、反派的定位是什么,而不是超...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...节点的条件和前提进行审视性评判,并对节点和节点间的逻辑连接进行思考,以便判断当前步骤是否出错;其三,需要能够代入不同假设,或反事实地(counterfactually)针对未来的推理路径进行预演和分析,从而判断这一答案是...……更多
惠州升学率高学校|高中生数学基础很差,该怎么办?
...实际情况和学习进度及时调整。保持灵活性,确保计划的有效性和可行性。四、培养良好的学习习惯课前预习:提前预习将要学习的内容,了解重点和难点,以便在课堂上更好地理解和吸收知识。认真听课:在课堂上保持高度集...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...一代“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“...……更多
更多关于科技的资讯:
2788元起!大疆DJI Flip可折叠航拍无人机发布:掌上起飞 录制有声Vlog
快科技1月14日消息,大疆官方今日发布了DJl Flip全能Vlog航拍机,搭载1/1.3英寸影像传感器,支持拍摄4K/60fps HDR视频
2025-01-14 22:24:00
当你拥有一个智能家居生活的好“搭子”,是什么感受?
在刚刚结束的2025年美国消费电子展(CES2025)上,三星AI(智能)伴侣机器人Ballie,这款形似保龄球的小精灵
2025-01-14 22:45:00
河北唐山:推动“应用场景”变身“产业风景”
唐山全面创建“场景创新之城”推动“应用场景”变身“产业风景”1月3日,在河北鹰眼智能科技有限公司车间,工作人员正在检查机器人设备
2025-01-14 23:11:00
3000亿市值寒武纪依然深陷亏损泥潭:2024年预计净亏损近4亿元
快科技1月14日消息,今晚,国内领先的AI芯片供应商寒武纪发布了2024年的业绩预告。公告显示,公司预计2024年全年实现营业收入在10
2025-01-14 23:24:00
小米澎湃OS 12月全球发版321个全量版本:平均每天11.88个
快科技1月14日消息,小米公司应用软件部总监@DaWang王乐 今天发文表示,小米澎湃OS的发版效率在不断提升,12月全球共发版OTA 321个全量版本
2025-01-14 20:54:00
近日,全球瞩目的2025年国际消费类电子产品展览会(简称“CES 2025”)在美国拉斯维加斯盛大启幕。山西数据流量谷入谷企业天娱数科创携自研Behavision空间智能MaaS平台首次登上CES 2025
2025-01-14 21:07:00
高铁站里的“科技范”
本文转自:人民网-江西频道南昌东站智能扫地机器人。舒文彬摄人民网南昌1月14日电 1月14日,随着G5002次列车驶离站台
2025-01-14 21:21:00
美国星巴克不再免费开放!中国区官方回应来了
快科技1月14日消息,近日星巴克宣布一项新规定,推翻了2018年来实施的开放政策,北美各地门店不再免费开放,进店需要消费
2025-01-14 21:24:00
余承东回应智界汽车方向盘太轻:大部分用户喜欢
快科技1月14日消息,近日,针对部分用户反映的智界R7方向盘手感过轻的问题,华为余承东今天进行了详细回应。余承东首先解释了智界R7方向盘默认采用舒适模式的原因
2025-01-14 21:24:00
全球首个!华为完成智能基站试点改造:网络增幅超过60%
快科技1月14日消息,最近,中国移动和华为联手推出了一款名为智能追焦单元(BTU)的新技术,并在广东省深圳市成功进行了全球首次试点
2025-01-14 21:24:00
今年春运“夜间高铁”又开了 平时为什么不开
2025年春运自1月14日起到2月22日结束为期40天,全国铁路预计发送旅客5.1亿人次,日均发送1275万人次,同比增长5
2025-01-14 21:24:00
高德地图启动2025年“温暖回家路”服务计划 多措并举提升春运出行服务效率
1月14日,2025年的春运拉开了大幕。据官方预计,2025年春运期间,跨区域人员流动量将达到90亿人次,自驾出行预计达到72亿人次
2025-01-14 21:47:00
威马电动车加装柴油取暖器开着开着冒烟了:非法改装 车辆被扣
快科技1月14日消息,据上海交警,近日,上海一辆威马电动车行驶到路口时,车辆突然冒出大量白烟。路口监控显示,看到车辆冒烟后
2025-01-14 21:54:00
一批中科大校友创业项目落地南京鼓楼 涉及人工智能等领域
本文转自:人民网-江苏频道活动现场。鼓轩摄1月12日,中国科学技术大学江苏校友发展大会在南京市鼓楼区召开,一批校友创业项目落地
2025-01-14 22:07:00
润泽园教育举办开年第一课,为小微企业揭示经营背后的小微大道
1月12日,润泽园教育举办了2025年第一次公开课,深度剖析了小微企业的生存现状和背后的大环境及经济发展趋势,并为小微企业提出了未来的生存建议
2025-01-14 22:06:00