• 我的订阅
  • 科技

混合架构赋予AI人类推理能力

类别:科技 发布时间:2024-06-12 18:15:00 来源:每日看点快看

本文转自:参考消息

参考消息网6月12日报道 据美国趣味科学网站5月13日报道,麻省理工学院研究人员开发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。

聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技术已大大改进,但仍因为无法像人类一样理解语境或在推理任务方面表现出色而受限。

但是,麻省理工学院的科学家们现在宣称,已通过创建能够产生更强大人工智能模型的自然语言“抽象”“宝库”,破解了这个难题。自然语言抽象将复杂的主题转变为高级特征并省略不重要的信息,这可能有助于聊天机器人像人一样推理、学习、感知和描绘知识。

科学家认为,目前大语言模型还难以像人那样提取信息。但他们把自然语言抽象分成三个资料库,希望它们能够增强情境意识,从而做出更多类似人类的回应。

科学家们于2023年10月、2023年12月13日和今年2月28日在阿奇夫论文预印本网站上发表了三篇论文,详细介绍了他们的研究结果。第一个资料库叫作“语言观察归纳资料库”,负责合成、压缩并记录计算机代码;第二个叫作“动作域获取”,覆盖人工智能的顺序决策;最后一个名为“语言引导的抽象”,帮助机器人更好地理解环境并规划动作。

这些论文探索了语言如何为人工智能系统提供重要的背景,以便它们能够处理较复杂的任务。5月11日,这些论文提交给了在奥地利维也纳举行的国际学习表征会议。威斯康星大学麦迪逊分校心理学助理教授罗伯特·霍金斯在声明中说:“资料库学习代表着人工智能领域一个最令人兴奋的前沿,为朝着发现和推理合成抽象提供了一条途径。”未参与这项研究的霍金斯还说,以往的类似研究计算成本太高,难以大规模应用。

科学家们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构的机器学习算法集合。

编码更加智能

大语言模型已成为人类软件工程师的强大工具,包括GitHub公司的Copilot模型等。但研究人员说,它们不能用于创建全面软件资料库。要做到这一点,它们必须能够对代码进行分类,并将其集成到更易于读取和重用的较小程序中,这正是“语言观察归纳资料库”的作用所在。

科学家把之前开发的能够找出抽象概念的算法——即“缝合”算法——与大语言模型合并,形成“语言观察归纳资料库”神经符号框架。根据这种方法,当大语言模型编写代码时,它就与“缝合”算法配对,确定语言抽象在资料库里的位置。

由于“语言观察归纳资料库”可以理解自然语言,它就可以像人类软件工程师那样利用常识完成任务。通过更好地理解提示词中使用的文字,大语言模型有朝一日可以绘制2D图像,回答与视觉效果相关的问题,操作Excel电子表格文档等。

制定战略规划

研究人员说,大语言模型目前还不能使用推理技能创建灵活计划,例如烹饪早餐涉及的步骤。但是,“动作域获取”框架可能是让它们在虚拟环境中执行此类任务时进行适应和规划的一种方式。

该框架通过使用大语言模型从与烹饪和游戏计划相关的自然语言库中查找抽象来建立资料库,其中最好的计划由人类操作员评分、过滤并添加到库中。通过将开放人工智能研究中心的GPT-4与该框架相结合,研究人员在执行厨房模拟和游戏任务时击败了作为AI决策水平基线的“代码即策略”。

通过找到隐藏的自然语言信息,该模型理解了诸如把冰镇葡萄酒放入厨房橱柜和铺床这样的任务,与没有“动作域获取”影响的情况下执行相同任务相比,准确率分别提高了59%和89%。研究人员希望在可预见的未来为“动作域获取”找到其他家务用途。

能够解决问题

“语言引导的抽象”框架也让机器人能够像人一样更好地理解环境——从周围环境去除不必要的细节,找到更好的抽象,以便能够更有效地执行任务。

“语言引导的抽象”在自然语言提示词(例如“把帽子拿给我”)中找到任务抽象,并根据训练视频执行动作。

研究人员使用波士顿动力公司的四足类犬机器人“斑点”机器狗,去完成取水果和回收饮料瓶的任务,证明了“语言引导的抽象”的效果。实验表明,机器人可以有效扫描世界,在混乱的环境中制定计划。

研究人员相信,“语言观察归纳资料库”“动作域获取”和“语言引导的抽象”这样的神经符号框架将赋予人工智能模型解决问题的技能,并且更好地驾驭环境,从而为“更像人一样的”人工智能模型打下基础。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-12 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式
2024-06-25 09:45:00
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同
2024-12-11 09:53:00
图灵奖得主杨立昆:AI的逻辑推理和规划能力有限,会犯事实错误和逻辑错误
...法国视频连线北京现场,发表了主题为《走向能够学习、推理和规划的大模型》的演讲,表达了对于人工智能的深度思考。搜狐科技在智源大会现场观看了这场演讲,从杨立昆演讲时面露微笑的表情
2023-06-10 05:00:00
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基
2024-09-24 13:36:00
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人
2024-03-21 16:13:00
9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问题,
2024-09-16 17:42:00
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...了自研深度思考模型混元T1正式版,这是腾讯自研的最强推理模型。腾讯表示,T1不仅吐字快、能秒回,还擅长超长文处理。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难
2025-03-22 00:29:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务
2024-08-22 09:49:00
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示,不同于仅仅识别图像中的物体,具有具身感知能力的智能体必须在物理世界中移动并与环境互动,这需要对
2024-07-29 09:39:00
更多关于科技的资讯:
抹茶刚到手,价格就暴涨,国产品牌正迎向新风口
作者:郑艺阳其实你早就在喝国产抹茶。“本来以为是冲动消费,居然一夜间变成理财产品”。海外消费者王擎夏(化名)向《消费者报道》记者报料说
2025-08-06 05:54:00
杭州日报讯 “作为塑料建材专业生产企业,南美地区是我们重点开拓的海外市场。”近日,德清企业华之杰塑料建材有限公司(以下简称“华之杰”)总经理丁凌烨向记者介绍
2025-08-06 06:29:00
“中国陶瓷煲都”的另一面:黎川人悄然拿下办公家具半壁江山
赣地灵泉润物功,千家木色出山蓬。在办公家具行业舞台上,黎川人正上演一场令人惊叹的逆袭传奇。如今,遍布全国的黎川人创办家具企业超3000家
2025-08-06 06:38:00
人形机器人领域以398.1%增速居榜首每日商报讯 从生产车间复杂装配的熟练操作,到展会上为大家递出的现磨咖啡,再到开渔现场第一网江鲜的运送……如今
2025-08-06 07:00:00
杭州日报讯 近日,上城资本集团参与投资的北京智谱华章科技股份有限公司(下称“智谱”)正式发布新一代旗舰大模型GLM-4
2025-08-06 06:29:00
韶音闪耀2025ChinaJoy:OpenDots ONE斩获黑金奖,引领开放聆听新风尚
8月1日,2025第22届中国国际数码互动娱乐展览会(ChinaJoy)在上海新国际博览中心正式拉开序幕,作为全球开放式耳机领域的知名品牌
2025-08-05 11:05:00
宠咕咕饮水、喂食科学守护,为您打造一体化健康养宠体验
在宠物成为“家人”的当下,我们发现,爱不仅是陪伴,更是理解与守护。而真正的守护,离不开科学的工具与智慧的洞察。成立以来
2025-08-05 11:05:00
近日,当中国工程院信息与电子工程学部、中国信息与电子工程科技发展战略研究中心发布《新一代信息工程科技 人工智能新兴技术备选清单》时
2025-08-05 11:19:00
四川省大竹县“盛夏狂欢购”圆满落幕 点燃夏日消费热潮
消费日报网讯(记者 冯举)“没想到买洗衣机能够抽中汽车,这得好好谢谢党委政府搭的好平台!没中奖的老乡们也别着急,接着买接着抽
2025-08-05 11:19:00
本报讯 近日,为期四天的2025国际低空经济博览会在国家会展中心(上海)闭幕。这场以“启航低空经济,赋能千行百业”为主题的国际性展会
2025-08-05 11:19:00
“1+1>2” 的质变:山东中邮与中国重汽书写两业融合降本增效新范本
大众网记者 魏俊怡 实习生 孟潇南 通讯员 崔鹏森 济南报道在制造业转型升级的关键时期,物流业与制造业的深度融合成为推动产业链降本增效的重要路径
2025-08-05 11:29:00
8月5日,具身智能整机及传感器企业“帕西尼”完成新一轮A轮融资,由京东战略领投,浦耀信晔、宏兆基金、张科垚坤等多家跟投
2025-08-05 11:47:00
盒马全国会员店8月31日前全部停业
7月29日,盒马X会员店北京世界之花门店的公告显示,该店于7月31日停止营业;同在7月31日,盒马X会员店的苏州相城店
2025-08-05 12:05:00
养老机器人四大痛点尚需破解
形形色色的机器人充满了未来感北京联讯科技的全套设备打通线上线下服务老年人正在体验搭载智慧养老照护系统的护理床 外骨骼机器人助力腿脚不便的老人行走
2025-08-05 14:14:00
果然财经|威海桨板产业:从“小众运动”到“蓝色经济”新引擎
齐鲁晚报·齐鲁壹点 于佳霖 苗润鹏在威海近千公里的蔚蓝海岸线上,一项曾被视为“小众”的水上运动正悄然崛起,成为激活区域经济的新动能
2025-08-05 14:19:00