我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
11月28-29日,36氪WISE2023 商业之王大会在北京国际会议中心盛大举办。本届大会以“太阳照常升起 The Sun Always Rises”为主题,横跨一个主会场与六大垂直领域专场。主会场聚焦“未来3650天”、“在产业洪流中”、“进击中的万联网”、“AI与商业增量”、“全球品牌看中国”、“科技至上 共鉴创新”六大篇章重点议程,邀请全领域商业大咖展开为期两天的顶级商业对话,向现在提问,给未来答案。
ChatGPT的出现,让人们初步看到了智能涌现的萌芽。但是,下一次的智能涌现,会诞生在哪里?以何种形式出现?
在11月29日的开场演讲中,清华大学计算机系长聘副教授、面壁智能联合创始人刘知远在题为《大模型驱动的自主智能体和群体智能:迎接智能的第二次涌现》的演讲中给出了答案:AI的第二次智能涌现,是群体智能的涌现。在计算机自然语言处理领域潜心研究近20年,如今的刘知远不仅传道受业,还作为AI初创企业面壁智能联合创始人,加入到AI创业的滚滚红尘中。
清华大学计算机系长聘副教授、面壁智能联合创始人刘知远
不久前,面壁智能在11月15日推出了智能软件开发平台“ChatDev”,将AI Agents(人工智能体)群体智能协作技术应用于软件开发。根据用户设定的需求,ChatDev中的智能体们就会根据各自的角色各司其事、统一协作,就像真正的人类团队一样。刘知远将ChatDev视作群体智能的一次重要实践。同时他预言,就像互联网连接了人和人、机器和人,未来,AI可以把更多的人、更多的设备、更多不同的物品,进一步地互联在一起。
非常感谢36氪邀请,也非常荣幸有机会跟所有对科技创新感兴趣的朋友们一起交流。我今天分享的题目是《大模型驱动的自主智能体和群体智能:迎接智能的第二次涌现》。
今年,我们看到了大模型是作为人机交互非常重要的创新形式。然而面向未来,我们有什么样可以开展的工作,就是我今天希望跟大家分享的。我们如果想要看清楚面向未来的发展趋势,那么就应该看到在整个人工智能的发展历史上,大模型具有非常重要的价值。
如果我们去回顾整个人工智能的发展史,实际上是经历了大概70年的一个跌宕起伏的时间。但是在不同的阶段,人工智能的核心命题一直没有发生改变,那就是如何能够让计算机来掌握完成各种各样复杂任务的知识和能力。
如果我们以这个作为核心命题去看整个人工智能的发展阶段,实际上我们大致可以把它划分为三个阶段。
第一个阶段,是人工智能最开始的这30年的时间。它提出了所谓的符号智能,一个基本的思想就是要让各个领域的专家去手工总结完成各个任务的知识和规则,从而去完成这些相关的任务。但是这种手工总结的方式,当然可以非常准确,但是它没有办法很好地去完整覆盖一些复杂的任务。譬如说像人脸识别、机器翻译等,是很难通过专家手工总结的形式去建立复杂系统的。
第二个阶段,从上个世纪90年代开始,一直到最近的2018年,我们进入到所谓的专用智能阶段。大家发现,我们可以通过一些机器学习的方法,专门去为指定的任务准备相应的标注好的数据。譬如说机器翻译,我们可以去收集对应的语料来交给计算机。通过机器学习的方法,去学习完成这个任务的相关知识。
这个阶段取得了非常大的成功,大家耳熟能详的从2010年开始的这种深度学习的革命,实际上就是专用智能的一个非常大的突破。在这个阶段,我们会看到小模型存储一些专用的知识,就能够在人脸识别、机器翻译、语音识别等等各个方面,取得非常好的成绩。
但是这个阶段的一个非常重要的问题在于,它所学到的这些能力都是一些专用的能力。它需要专门地为这个任务去标注数据,然后学习专用的模型,来完成这个专用的任务。它没有办法像我们的人脑一样,可以完成各种各样的复杂任务。
第三个阶段,从2018年开始,我们已经进入到一个越来越通用的智能阶段,由大模型所驱动的一种自监督学习的方法。它可以利用互联网上没有任何标注的通用数据,用一些通用的方法来学习相应的知识。而学习得到的这些大模型可以非常的通用,一个模型就可以去完成非常多的任务。
所以我们大致可以总结,整个人工智能发展的历史,实际上是经历了从符号智能到专用智能,到越来越通用的智能的这么一个阶段。在这个阶段中呈现了知识从手工总结到自动学习,从离散的符号到连续的参数,从比较专用的智能到越来越通用的阶段。
这种通用的智能大概体现在哪些方面呢?我们总结它其实体现在三个方面。
第一,越来越通用的机器学习框架。在2018年之前,即使是在深度学习领域,针对不同类型的数据,实际上对应不同的相关神经网络的架构。譬如说专门的针对文本和语音这种一维的序列数据,我们有循环神经网络。专门针对二维的图片数据,我们有卷积神经网络。为了解决结构化、半结构化的图数据,产生了图神经网络。但是2018年之后,我们越来越多地发现所有的这些不同类型的数据,不同领域的数据,不同任务的数据,我们都可以用一个统一神经网络架构来去处理,就是Transformer。这个其实体现了通用智能一个非常重要的特点,就是它用来存储知识的神经网络框架实际上变得越来越统一。
第二,在我们处理这种序列化的数据的时候,如何从文本数据或者是其他序列化数据里面去学习知识呢?这个学习的过程也在变得越来越统一。在大模型初期,我们会有不同的学习方法,包括Mask Language Model, 包括Next Token Prediction等等。也就是说我们可以把所有学习任务都转换成为,“在序列上已经看到了前面的几个词,然后去预测下一个词”,这样的一个过程。
第三,正是在这种统一框架、统一方法的支持下,我们建立了一个统一的大模型,这个大模型可以像我们的人脑一样去完成在过去看上去非常不同的任务。譬如说我现在的一个大语言模型,可以去完成机器翻译、信息检索、文本生成、智能问答等。但是在过去,几乎所有的不同任务都需要用不同的方法,不同的模型去完成。而现在我们都把它统一在了一个大模型下,这就是大模型的一个非常重要的特点,即它的通用性。
正是在越来越通用的智能的支持下,我们会看到“大数据+大算力”实际上能够支持我们去得到一个更具通用能力的大的基础模型。而今年ChatGPT的兴起,只不过是这种大模型被我们社会各界,被几乎所有的人看到了它非常重要的价值。我们进入到了一个几乎所有人看到了它价值的阶段。接下来一定会进入到大模型发展和应用的快车道。
从信息时代开始,我们几乎所有的不同阶段都有不同的基础设施、不同的通用软件来支撑着我们的发展。譬如说为了实现对数据的管理能力,产生了像数据库系统这样的通用软件来成为我们数据管理的基础设施。为了能够解决萃取大数据有效信息的需求,产生了包括MapReduce这样的分析系统来成为我们信息管理的基础设施。
我们相信大模型作为从通用数据里去萃取和学习通用知识的这么一种通用方法,它将会成为我们进行知识管理的基础设施。在这个基础上,我们认为大模型将会成为接下来去追求越来越通用的人工智能的一个非常重要的基础。
未来我们应该做些什么呢?我们认为至少应该在四个方面来开展工作。第一,拥有像人脑一样更加高效的大脑来思考这个世界。第二,应该有更敏锐的感官,来感知这个世界,这就是多模态计算。第三,要有像我们人类一样灵活的双手来操作工具。第四,我们要有有效的沟通来形成文明。
今天由于时间关系,我更多介绍后面的这两个部分,即未来对于智能体、群体智能,我们可以做一些什么样的工作。
首先,我们知道工具是改善人类生活条件,提高生产效率,推动科技和文明进步的非常重要的一种方式。但在过去的时候,我们会说只有人是制造和使用工具的主体。那么我们现在就要问一个问题,人工智能能不能像我们人类一样去创造工具、使用工具?答案显然是肯定的。实际上我们在过去一年的时间里,已经探索出非常多不同的方法来让大模型作为一个人工智能去学习使用工具。
我们可以通过向人类的行为进行学习的“模仿学习”方法,或像人去阅读一些教程的“教程学习”方法,也可以像人通过自主探索的“强化学习”方法。
我们其实有非常多不同的方法,去越来越自主地进行工具学习。在过去的这一段时间,我们其实也看到,包括OpenAI在内,包括我们自己的团队在内,可以让大模型去像我们人一样使用搜索引擎。我们能够做到在30%的情况下和用户使用搜索引擎的水平保持一致,甚至超越。我们还可以让大模型通过阅读API的教程,去学习使用各种各样的API。我们还可以让大模型通过使用工作流的方式来自动化提高工作效率。
总之,我们会看到大模型已经能够越来越像人一样,去进行工具的调用,进行规划和决策,然后去完成一些更加复杂的任务。这其实已经体现了智能体的一个非常重要的方面。
再进一步,假如我们已经具备了一个非常强大的智能体,我们在过去的五年时间里见证了一个又一个的单个大模型。然后随着模型规模的增大,大模型智能涌现的情况可以看成是个体智能的涌现。然而,接下来我们将会迎来一个新的涌现,或者说第二次涌现,就是群体智能的涌现。
正如在生物领域会有蜂群、蚁群、鸟群、鱼群,在人类社会有不同的群体、团队、小组,群体展现出来完成一些复杂任务的能力。我们可以想象一下,由大模型所驱动的这些智能体,他们各有所长,如果把他们关联在一起,实际上可以形成一个更加复杂的群体智能的涌现。而这件事情的重要核心就在于智能体之间的自然语言交互能力。
我们今年看到了ChatGPT, 它其实能够实现人和机器之间的自然语言的复杂交互能力。我们可以通过自然语言的方式与以ChatGPT为代表的大模型进行交互。那么,这种自然语言交互难道只能发生在人机之间吗?机器和机器之间能不能进行复杂的自然语言交互?答案依然是肯定的。
我们通过这种语言交互的方式,实际上可以进行非常好的任务分工和协作执行。我们在过去的这一段时间探索出来的ChatDev,实际上就组建了群体智能的这么一个团队。在这个团队里面,有CEO、CTO、程序员、产品经理、设计师等等。他们在得到一项任务之后,通过讨论可以确定用什么样的编程语言去进行开发,以及开发算法是什么。通过这种复杂的自然语言的交互,这些智能体之间就可以分工协作来完成一些相对比较复杂的任务。
我们也跟清华大学的数据库团队,去合作完成了由群体智能支持复杂数据库系统运维的工作。在这里,不同模块有不同的智能体去负责问题的检测和诊断。我们可以看到,在典型问题上,其诊断水平能够接近我们人类,这些方面都能够证明群体智能具备非常重要的未来前景。
面壁智能是由清华大学孵化出来的大模型团队,我们一直是以AGI 作为奋斗的目标。早在2019年,我们就发布了全球首个知识增强大模型(ERNIE)。随后,我们也进行了大模型全流程高效计算的研发工作。我们在今年也是开展了大量与智能体、群体智能相关的研发工作。目前,我们已经形成了由AgentVerse、XAgent、ChatDev协同的智能体和群体智能的“三驾马车”。接下来,我们希望在这三个开源项目的支持下,去开展基础大模型的智能体和群体智能的进一步研发工作。
正如历史上,互联网把全世界的所有的信息和人类关联在一起,物联网把全世界的设备关联在一起。面向未来,我们认为,通过大模型驱动的AI智能体平台可以把更多的人、设备和物品连接起来,推动万物互联进阶万物智联,进入人机交互的“Internet of Agents”智联网新时代。在这种情况下,我们可以迎来属于人工智能的第二次涌现,也就是“群体智能”。它将能够实现比人类社会更加强大的智能能力。这些智能体互相之间的协作能够帮助我们人类去探索这个世界更不一样的未来。
今天的这个报告,就是希望跟大家分享,属于大模型的非常重要的历史地位,它实际上是吹响了迈向通用智能的号角。我们花了一些时间给大家介绍工具智能所代表的智能体发展方向,以及以群体智能为代表的多个智能体所形成的智联网。面向未来,我们认为群体智能,或者一个更加强大的智能体,以及更加强大的智能群体,将会帮助我们迎来人工智能的第二次涌现。我特别期待能够跟国内外的相关学者同行,一起来推动第二次智能涌现的的产生。这就是今天给大家的分享,谢谢大家。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2023-11-30 18:45:16
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: