• 我的订阅
  • 科技

混合架构赋予AI人类推理能力

类别:科技 发布时间:2024-06-12 18:15:00 来源:每日看点快看

本文转自:参考消息

参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。

聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技术已大大改进,但仍因为无法像人类一样理解语境或在推理任务方面表现出色而受限。

但是,麻省理工学院的科学家们现在宣称,已通过创建能够产生更强大人工智能模型的自然语言“抽象”“宝库”,破解了这个难题。自然语言抽象将复杂的主题转变为高级特征并省略不重要的信息,这可能有助于聊天机器人像人一样推理、学习、感知和描绘知识。

科学家认为,目前大语言模型还难以像人那样提取信息。但他们把自然语言抽象分成三个资料库,希望它们能够增强情境意识,从而做出更多类似人类的回应。

科学家们于2023年10月、2023年12月13日和今年2月28日在阿奇夫论文预印本网站上发表了三篇论文,详细介绍了他们的研究结果。第一个资料库叫作“语言观察归纳资料库”,负责合成、压缩并记录计算机代码;第二个叫作“动作域获取”,覆盖人工智能的顺序决策;最后一个名为“语言引导的抽象”,帮助机器人更好地理解环境并规划动作。

这些论文探索了语言如何为人工智能系统提供重要的背景,以便它们能够处理较复杂的任务。5月11日,这些论文提交给了在奥地利维也纳举行的国际学习表征会议。威斯康星大学麦迪逊分校心理学助理教授罗伯特·霍金斯在声明中说:“资料库学习代表着人工智能领域一个最令人兴奋的前沿,为朝着发现和推理合成抽象提供了一条途径。”未参与这项研究的霍金斯还说,以往的类似研究计算成本太高,难以大规模应用。

科学家们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构的机器学习算法集合。

编码更加智能

大语言模型已成为人类软件工程师的强大工具,包括GitHub公司的Copilot模型等。但研究人员说,它们不能用于创建全面软件资料库。要做到这一点,它们必须能够对代码进行分类,并将其集成到更易于读取和重用的较小程序中,这正是“语言观察归纳资料库”的作用所在。

科学家把之前开发的能够找出抽象概念的算法——即“缝合”算法——与大语言模型合并,形成“语言观察归纳资料库”神经符号框架。根据这种方法,当大语言模型编写代码时,它就与“缝合”算法配对,确定语言抽象在资料库里的位置。

由于“语言观察归纳资料库”可以理解自然语言,它就可以像人类软件工程师那样利用常识完成任务。通过更好地理解提示词中使用的文字,大语言模型有朝一日可以绘制2D图像,回答与视觉效果相关的问题,操作Excel电子表格文档等。

制定战略规划

研究人员说,大语言模型目前还不能使用推理技能创建灵活计划,例如烹饪早餐涉及的步骤。但是,“动作域获取”框架可能是让它们在虚拟环境中执行此类任务时进行适应和规划的一种方式。

该框架通过使用大语言模型从与烹饪和游戏计划相关的自然语言库中查找抽象来建立资料库,其中最好的计划由人类操作员评分、过滤并添加到库中。通过将开放人工智能研究中心的GPT-4与该框架相结合,研究人员在执行厨房模拟和游戏任务时击败了作为AI决策水平基线的“代码即策略”。

通过找到隐藏的自然语言信息,该模型理解了诸如把冰镇葡萄酒放入厨房橱柜和铺床这样的任务,与没有“动作域获取”影响的情况下执行相同任务相比,准确率分别提高了59%和89%。研究人员希望在可预见的未来为“动作域获取”找到其他家务用途。

能够解决问题

“语言引导的抽象”框架也让机器人能够像人一样更好地理解环境——从周围环境去除不必要的细节,找到更好的抽象,以便能够更有效地执行任务。

“语言引导的抽象”在自然语言提示词(例如“把帽子拿给我”)中找到任务抽象,并根据训练视频执行动作。

研究人员使用波士顿动力公司的四足类犬机器人“斑点”机器狗,去完成取水果和回收饮料瓶的任务,证明了“语言引导的抽象”的效果。实验表明,机器人可以有效扫描世界,在混乱的环境中制定计划。

研究人员相信,“语言观察归纳资料库”“动作域获取”和“语言引导的抽象”这样的神经符号框架将赋予人工智能模型解决问题的技能,并且更好地驾驭环境,从而为“更像人一样的”人工智能模型打下基础。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-12 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式
2024-06-25 09:45:00
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同
2024-12-11 09:53:00
图灵奖得主杨立昆:AI的逻辑推理和规划能力有限,会犯事实错误和逻辑错误
...法国视频连线北京现场,发表了主题为《走向能够学习、推理和规划的大模型》的演讲,表达了对于人工智能的深度思考。搜狐科技在智源大会现场观看了这场演讲,从杨立昆演讲时面露微笑的表情
2023-06-10 05:00:00
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基
2024-09-24 13:36:00
【2025数博会】莫干山地信实验室执行主任张继贤:地理空间智能赋能低空经济
...维与地理空间表征与理解,实现对该领域的感知、认知、推理与决策。地理空间智能具备四大特征:以人类智能为宗旨、时空语义三位一体、数据-模型-知识混合驱动以及强大的空间认知与预测能
2025-08-28 01:53:00
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人
2024-03-21 16:13:00
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,
2024-09-16 17:42:00
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难
2025-03-22 00:29:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务
2024-08-22 09:49:00
更多关于科技的资讯:
专访复旦大学教授沈涵:打造“城市级剧本游”,发动“全民共创”
齐鲁晚报•齐鲁壹点 高雅洁 李潇10月22日,“数智文旅 媒动山海”城市文旅品牌建设交流会在青岛举行。复旦大学旅游学系教授
2025-10-22 20:32:00
10月21日小店政务发布信息,小店区审批局积极推进“开办便利店一件事”集成服务改革,通过流程再造、帮办代办服务、市场需求调研等
2025-10-22 18:56:00
10月22日从中北高新区获悉,该区企业山西天成半导体材料有限公司继今年成功研制12英寸导电型碳化硅单晶材料后,依托自主研发设备再度攻克12英寸高纯半绝缘碳化硅单晶材料技术难关
2025-10-22 18:56:00
亚太森博装备技术创新中心正式投入使用
随着日照市“亚太森博杯”浆纸产业链职工职业技能大赛的盛大启幕,公司装备技术创新中心同步正式启用。创新中心充分整合多方资源
2025-10-22 19:21:00
山东外国语职业技术大学教授入选“全球前2%顶尖科学家”榜单
近日,美国斯坦福大学联合爱思唯尔数据库(Elsevier Data Repository)发布了《全球前2%顶尖科学家榜单(World's Top 2% Scientists)》
2025-10-22 19:23:00
富士康储能项目量产,致力于打造全球首个“储能灯塔工厂”
大河网讯 预计年均省电超千万元,年产能将达到3GWh的规模……富士康旗下储能品牌“富储科能”近日在郑州航空港举行富士康储能量产暨新品发布会
2025-10-22 19:27:00
华为鸿蒙操作系统 6 正式发布!余承东评论区被“催产”mate80
华为鸿蒙6.0系统正式版于今日(10月22日)发布,Mate 80系列预计将首发搭载。鸿蒙6.0系统以更好看、更好用、更智能
2025-10-22 15:56:00
视源股份肖航:“中国制造”正成为传递创新、可靠与高品质的“新名片”
肖航接受人民日报海外网采访“通过建立深度本地化的运营与服务团队,我们的MAXHUB已成功在全球超过140个国家和地区提供服务
2025-10-22 14:05:00
中国消费名品全国行(河北站)“清河羊绒”供需对接活动举办供需双向奔赴 品牌加速出圈10月21日,中国消费名品全国行(河北站)“清河羊绒”供需对接活动在邢台市清河县举办
2025-10-22 08:10:00
雄安建设者拍雄安|你好,雄安图书馆!
9月26日拍摄的雄安图书馆。9月27日,雄安图书馆少儿阅览区,图书管理员带着小读者通过智能书架挑选图书。拍摄者:齐劲青 中建八局(北京)建设投资有限公司市场部业务经理拍摄时间
2025-10-22 08:19:00
五年千亿研发淬炼,小米携手粤港澳大湾区共筑“同心圆”
10月15日,以“同心湾区,论道未来”为主题的2025粤港澳大湾区人工智能技术发展论坛在珠海美高梅华府酒店隆重举行。本次论坛由珠海市委统一战线工作部指导
2025-10-22 08:30:00
鞍矿爆破“露天矿山智能爆破关键技术研究与应用”项目入选“中国好技术”项目库
近日,由中国生产力促进中心协会联合全国各级生产力促进中心、行业协会及专业机构共同发起的2024年度“中国好技术”评选正式落下帷幕
2025-10-22 08:30:00
厦门网讯(厦门日报记者 李晓平)机器人赛道正吸引越来越多厦企参与。20日,联合星辰(厦门)科技有限公司(以下简称“联合星辰”)
2025-10-22 08:57:00
从场景破题 大力推进福建省(厦门)人工智能产业园建设
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏) 走进厦门软件园,你会发现“人工智能 +”的创新应用图景正徐徐展开
2025-10-22 08:57:00
《全国中老年艺术等级考评规范》团体标准深圳秘书处挂牌
日前,《全国中老年艺术等级考评规范》团体标准深圳秘书处在十方融海梨花教育办公区正式挂牌。当前,我国人口老龄化程度持续加深
2025-10-22 09:05:00