• 我的订阅
  • 科技

混合架构赋予AI人类推理能力

类别:科技 发布时间:2024-06-12 18:15:00 来源:每日看点快看

本文转自:参考消息

参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。

聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技术已大大改进,但仍因为无法像人类一样理解语境或在推理任务方面表现出色而受限。

但是,麻省理工学院的科学家们现在宣称,已通过创建能够产生更强大人工智能模型的自然语言“抽象”“宝库”,破解了这个难题。自然语言抽象将复杂的主题转变为高级特征并省略不重要的信息,这可能有助于聊天机器人像人一样推理、学习、感知和描绘知识。

科学家认为,目前大语言模型还难以像人那样提取信息。但他们把自然语言抽象分成三个资料库,希望它们能够增强情境意识,从而做出更多类似人类的回应。

科学家们于2023年10月、2023年12月13日和今年2月28日在阿奇夫论文预印本网站上发表了三篇论文,详细介绍了他们的研究结果。第一个资料库叫作“语言观察归纳资料库”,负责合成、压缩并记录计算机代码;第二个叫作“动作域获取”,覆盖人工智能的顺序决策;最后一个名为“语言引导的抽象”,帮助机器人更好地理解环境并规划动作。

这些论文探索了语言如何为人工智能系统提供重要的背景,以便它们能够处理较复杂的任务。5月11日,这些论文提交给了在奥地利维也纳举行的国际学习表征会议。威斯康星大学麦迪逊分校心理学助理教授罗伯特·霍金斯在声明中说:“资料库学习代表着人工智能领域一个最令人兴奋的前沿,为朝着发现和推理合成抽象提供了一条途径。”未参与这项研究的霍金斯还说,以往的类似研究计算成本太高,难以大规模应用。

科学家们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构的机器学习算法集合。

编码更加智能

大语言模型已成为人类软件工程师的强大工具,包括GitHub公司的Copilot模型等。但研究人员说,它们不能用于创建全面软件资料库。要做到这一点,它们必须能够对代码进行分类,并将其集成到更易于读取和重用的较小程序中,这正是“语言观察归纳资料库”的作用所在。

科学家把之前开发的能够找出抽象概念的算法——即“缝合”算法——与大语言模型合并,形成“语言观察归纳资料库”神经符号框架。根据这种方法,当大语言模型编写代码时,它就与“缝合”算法配对,确定语言抽象在资料库里的位置。

由于“语言观察归纳资料库”可以理解自然语言,它就可以像人类软件工程师那样利用常识完成任务。通过更好地理解提示词中使用的文字,大语言模型有朝一日可以绘制2D图像,回答与视觉效果相关的问题,操作Excel电子表格文档等。

制定战略规划

研究人员说,大语言模型目前还不能使用推理技能创建灵活计划,例如烹饪早餐涉及的步骤。但是,“动作域获取”框架可能是让它们在虚拟环境中执行此类任务时进行适应和规划的一种方式。

该框架通过使用大语言模型从与烹饪和游戏计划相关的自然语言库中查找抽象来建立资料库,其中最好的计划由人类操作员评分、过滤并添加到库中。通过将开放人工智能研究中心的GPT-4与该框架相结合,研究人员在执行厨房模拟和游戏任务时击败了作为AI决策水平基线的“代码即策略”。

通过找到隐藏的自然语言信息,该模型理解了诸如把冰镇葡萄酒放入厨房橱柜和铺床这样的任务,与没有“动作域获取”影响的情况下执行相同任务相比,准确率分别提高了59%和89%。研究人员希望在可预见的未来为“动作域获取”找到其他家务用途。

能够解决问题

“语言引导的抽象”框架也让机器人能够像人一样更好地理解环境——从周围环境去除不必要的细节,找到更好的抽象,以便能够更有效地执行任务。

“语言引导的抽象”在自然语言提示词(例如“把帽子拿给我”)中找到任务抽象,并根据训练视频执行动作。

研究人员使用波士顿动力公司的四足类犬机器人“斑点”机器狗,去完成取水果和回收饮料瓶的任务,证明了“语言引导的抽象”的效果。实验表明,机器人可以有效扫描世界,在混乱的环境中制定计划。

研究人员相信,“语言观察归纳资料库”“动作域获取”和“语言引导的抽象”这样的神经符号框架将赋予人工智能模型解决问题的技能,并且更好地驾驭环境,从而为“更像人一样的”人工智能模型打下基础。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-12 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式
2024-06-25 09:45:00
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同
2024-12-11 09:53:00
图灵奖得主杨立昆:AI的逻辑推理和规划能力有限,会犯事实错误和逻辑错误
...法国视频连线北京现场,发表了主题为《走向能够学习、推理和规划的大模型》的演讲,表达了对于人工智能的深度思考。搜狐科技在智源大会现场观看了这场演讲,从杨立昆演讲时面露微笑的表情
2023-06-10 05:00:00
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基
2024-09-24 13:36:00
【2025数博会】莫干山地信实验室执行主任张继贤:地理空间智能赋能低空经济
...维与地理空间表征与理解,实现对该领域的感知、认知、推理与决策。地理空间智能具备四大特征:以人类智能为宗旨、时空语义三位一体、数据-模型-知识混合驱动以及强大的空间认知与预测能
2025-08-28 01:53:00
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人
2024-03-21 16:13:00
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,
2024-09-16 17:42:00
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难
2025-03-22 00:29:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务
2024-08-22 09:49:00
更多关于科技的资讯:
健康之旅,“媒”好同行!爱康集团烟威区域媒体开放日圆满结束
为构建与公众的沟通桥梁,让烟威人民更好地了解爱康的医疗品质及优质体检服务,9月25日下午爱康集团烟威区域媒体开放日活动于爱康莱山区分院成功举办
2025-10-01 20:51:00
人工智能不仅能分析人脸情绪,还能读取脑电波信号,为人定制香氛;恐龙变为AI数字虚拟形象,成为人们的“萌宠”——这不是科幻电影
2025-09-30 08:09:00
从线上学习到山水修行:简知文旅×简橙教育共同打造银发文旅的深度与温度
近日,长江三峡见证了一场别开生面的银发游学盛事。"三峡简橙号·年度盛典"游学项目在历时七天的精彩行程后圆满落下帷幕。该项目由简知科技旗下两大知名品牌"简知文旅"与"简橙教育"联合策划执行
2025-09-30 08:17:00
聊城智汇 链接全球丨锚定国际市场,力得汽车科技加速布局海外
齐鲁晚报·齐鲁壹点 国晓宁 崔宇晴走进山东力得汽车科技股份有限公司的生产车间,机器轰鸣声不绝于耳,一条条先进的生产线正有序运转
2025-09-30 09:20:00
国庆黄金周变身“家电焕新周”,三联家电门店人气爆棚
随着国庆与中秋双节同庆的长假来临,消费市场迎来了一年之中最炙手可热的“黄金销售季”。与以往不同的是,这个假期在旅游、探亲等传统主题之外
2025-09-30 09:22:00
壹点观察 | 蔚来城商业广场十一开业,德州商业格局再迎新变化
在商业竞争日益激烈的今天,一座全新的商业综合体——蔚来城商业广场,即将于十一正式开门迎客。它的到来,为德州商业市场增添了新的变化
2025-09-30 09:24:00
鲁网9月29日讯(记者 杨勇)秋分时节,聊城市莘县升鑫金属制品有限公司的生产车间内,员工工作紧张有序,各种机器设备高效运转
2025-09-30 10:04:00
Aritco与Dezeen联合举办设计论坛 共探\
苏州2024年9月16日 -- 近日,瑞典家用电梯品牌Aritco瑞特科与全球知名设计媒体Dezeen设志在苏州联合举办了一场主题为"摒弃风格
2025-09-30 10:18:00
小微企业在传统银行承兑汇票(简称“银承”)业务办理中常常面临诸多难题。企业需要多次往返银行网点,提交大量纸质材料,流程烦琐
2025-09-30 10:45:00
中国数据研究中心:中之杰荣膺月饼行业智造先锋奖榜首
9月28日,中国数据研究中心正式发布《2025中国月饼行业白皮书》及“2025中国月饼行业智造先锋奖”十强品牌榜单,吉林中之杰食品科技发展有限公司凭借其位于长春的智能新厂
2025-09-30 11:15:00
鲁网9月30日讯近日,省科技厅公布了2025年度科技型中小企业创新能力提升工程(先投后股类)项目名单,全市共4家企业入选
2025-09-30 11:16:00
浪潮海晏荣获2025年“数据要素×”大赛山东分赛决赛三等奖
近日,由国家数据局、山东省人民政府联合指导,山东省大数据局等21家单位联合主办的2025年“数据要素×”大赛山东分赛决赛获奖名单正式公布
2025-09-30 11:21:00
据人民日报报道,近期国家网信办指导多地网信部门,对微博、快手、小红书、今日头条等多家平台进行约谈,责令限期整改热搜热榜存在的问题
2025-09-30 12:33:00
朱琳:品牌要让Z世代体验“设计师”般的快感
齐鲁晚报·齐鲁壹点 记者 牟静萍 实习生 葛同同 当下,Z世代正在以其独特的消费观念、多元的兴趣取向和对精神体验的重视
2025-09-30 12:46:00
大皖新闻讯 算力作为数字经济时代的核心生产力,已成为城市竞争的关键赛道。“十四五”期间,芜湖紧抓“东数西算”国家战略机遇
2025-09-30 13:57:00