• 我的订阅
  • 财经

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

类别:财经 发布时间:2024-03-15 09:40:00 来源:汽车很听话

“如果说一年前的那一天我们是在爬山,那么经过了这一段时间的攀登,我们有了更多的积累,现在我们可以比较自豪地说,我们已经积累了非常丰富的研发经验和积淀。”3月14日,在智谱AI媒体小型沟通会上智谱AI CEO张鹏表示,站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是完全自主可控的,是自己从零到一研发的。

3月14日,由央视网“人人都爱中国造”品牌助力行动和智谱AI联合主办的“智领,万象新生”智谱AI媒体小型沟通会在北京搜狐网络大厦举办。总台央视网主持人常婷介绍,“人人都爱中国造”品牌助力行动是2020年在国家相关部委指导下发起的,以“支持国货,赋能品牌”为核心。“中国制造”到“中国智造”的创新热潮方兴未艾,中国创新的的浪潮已经席卷到每一个人的身边。在不久前刚刚召开的全国两会上,“人工智能+”这个概念被首次写入到了政府报告当中。新质生产力引擎开启,万象新生时代正在来临。活动还通过总台央视网、小央视频视频号以及智谱AI视频号同步直播。

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

大模型(人工智能)三个阶段

首先,智谱AI的CEO张鹏向大家回归了大模型(人工智能)三个阶段:从2017年谷歌提出Transformer开始迅速席卷了整个人工智能领域的研究和产业,成为自然语言处理等相关研究的一种最主要的方法,2018到2020年这段时间先后出现了像谷歌的BERT、GPT-1/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习方法的预训练模型。当时尤其是BERT在十多个自然语言理解任务当中大大地超越传统的机器算法的精度,掀起了一种全新的研究范式;一直到2019年GPT-2的实现,它提供了自然流畅的文本内容的生成能力,彼时GPT-2的应用Talk2Transformer确实让大家很惊艳,当然对比现在的ChatGPT以及我们自己的ChatGLM等一系列的应用来说还是比较粗糙的,但正因为这些技术坚定了我们投身生成式人工智能的决心;到2020年谷歌的T5将自然语言的翻译、分类、回归、摘要等一系列任务统一成了一个简单的Text-to-Text的任务。

张鹏强调,可以说2018-2020是大模型的原始算法创新的一个阶段。也是在这个阶段里边,智谱AI也从0到1开发了自己的具有完全独立知识产权的预训练模型,我们叫它 GLM(General Language Model),它采用了自回归填空的方式,综合了GPT和Bert这几种优秀的预训练框架的优点。

大模型与小模型的讨论

张鹏认为,在当时国内学术界和产业界都对大模型的发展和产业化没有形成共识,有很多的讨论,甚至很多人提出成本这么高,我们不应该发展大模型,而应该专注于发展所谓的“小”模型。

“说实话在那个时间段,我们自己内部也有很多的思考和讨论,也有一些争论,正如大家所知,这件事情的投入成本非常高、非常大的,作为一家刚刚建立不久的创业型企业,我们如何来支撑这么大的资源,而且我们的研发人员团队是否能支撑这样一个任务?”张鹏说,外部市场对于大模型的认知少,对这个概念还非常陌生,各方面都处于一个非常艰难的情况和境地,换而言之,其实当时的智谱是有那么一点孤注一掷的意思,大家的压力,尤其是研发人员的压力是非常大的。大家最近可能也听说了 OpenAI 团队内部的一些非常卷的故事的一些情况,其实我们当时的情况甚至比他们更严重,非常类似。

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

GLM-130B唯一来自亚洲被列入评测的对象

张鹏说,2022年我们在训练自己的千亿模型的时候,我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群,凌晨三点多的故障,我们可以在5分钟之内我们的算法人员先发现,然后通知远程的运维人员,让他们及时解决问题,10分钟、15分钟之内就能解决这样的一个掉卡甚至是硬件故障的问题,这是非常难的一件事情,也都是我们亲身经历的经过。

“所以在2022年我们推出并且开源了基于GLM算法训练的千亿基座模型GLM-130B,这是我们研发团队心血的积累,当时也引起了非常广泛的关注,尤其是在国外,包括像斯坦福、谷歌、OpenAI、Apple、Meta这些非常知名的研究机构和大型的科技公司都对我们的模型进行了深入的研究、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告,报告的名称缩写叫HEOM,对全球的几十个开源和闭源的模型进行了深入的评测,有幸我们的GLM-130B作为一个唯一来自中国,甚至唯一一个来自亚洲的这样一个模型被列入评测的对象,并且从评测的结果上来看,在一些指标,比如准确性、公平性等很重要的核心指标上与当时最先进的GPT-3 175B的模型是持平或者是接近的,在有一些特殊的指标,比如说像鲁棒性、校准偏差和无偏性等方面甚至要比它们表现的更好。”张鹏介绍说,这个成绩一出来,整个团队都非常激动。我们八九个月的辛苦得到了回报,也证明了我们团队有这个能力、有这个实力、更有这个激情去做到这样一件事情。所以站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是什么?是这一切是在我们完全自主可控的,是我们自己从零到一研发的。

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

ChatGLM是国内最早可以线上测试使用的千亿级的对话模型

张鹏介绍,2022年11月30日OpenAI发布了ChatGPT真正让大家认识到大模型能做到什么样的事情,大模型也开始出圈,扩散到整个社会、全球,让所有人都认识到大模型。一夜之间,几乎所有人都对必须发展大模型都达成了一个高度的共识。大模型的发展不再仅限于模型技术的发展和模型训练本身,更重要的是如何实现模型的产业化应用,这个问题已经提上大家的日程。

“大模型开始在各个领域尝试落地生根,在金融、互联网和教育等众多行业当中开始落地,也得益于我们GLM-130B基座模型的优秀能力,我们很快在2023年2月份就研发出了第一代ChatGLM,这也是我们去年3月14号发布的这个产品的基座,这应该是国内最早可以线上测试使用的千亿级的对话模型,基于它我们开发了刚才大家看到的演示当中的智谱清言这样一款C端的应用,并在8月第一批通过了国家的备案认证,正式的面向公众上线使用。”张鹏说,这个是我们在2023年取得的一些成绩,我们实现了2000+生态合作伙伴、1000+大模型规模化应用、200多家企业跟我们进行了深度的共创,解决它们的问题,切切实实的、潜移默化的在改变着每一个客户的业务、效率,甚至更深度的改变着客户的业务范式和组织架构,这是我们所希望看到的。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-15 12:45:19

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...为何发挥着关键作用?新华网就此专访智谱AI首席执行官张鹏。他表示,人工智能应用目前主要集中在语言类模型,随着大模型的不断进化,未来必然会出现更多的新模态场景,智谱AI将与终端
2024-05-17 10:14:00
融资超25亿元,他们的目标和OpenAI很像
...近举行的2023中国计算机大会(CNCC2023)上,智谱AI推出了自主研发的第三代基座大模型ChatGLM3及相关系列产品
2023-11-13 07:44:00
对话智谱AI CEO张鹏:我们不做中国的ChatGPT|36氪专访
...户量和用户数据反馈最直接的通路,团队也基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,正式上线了首款生成式AI助手——“智谱清言”
2023-09-05 09:22:00
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...以交给Agent来完成。这样具有科技感的画面,来自智谱CEO张鹏对新升级的AutoGLM的现场演示。智东西11月29日报道
2024-12-02 09:50:00
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...最好回应。“我们交出了一份还不错的答卷。”智谱AI CEO张鹏说。截止目前,智谱AI已经有2000+生态合作伙伴、1000+大模型规模化应用
2024-03-15 09:19:00
让AI像人一样操作手机电脑!智谱董事长刘德兵:智能体将让“光说不干”成为现实
...大模型具有更大潜力的地方。相较外界更为熟知的智谱CEO张鹏,刘德兵相对低调,但在推动智谱商业化方面起到了重要作用。‌他是中国工程院高文院士的弟子,担任过清华数据科学研究院科技
2024-11-29 15:19:00
“泰昌”以塔尖创新引领未来
...列前茅。纵观泰昌三十多年的发展历程,在董事长兼总裁张鹏飞看来,集团几经生死考验,又屡屡化险为夷大步前进的“法宝”就是创新。在科技不断进步和全球化的浪潮中,不断创新超越,提升长
2024-01-15 14:11:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...科技,在创立当年已经完成了近亿元的天使轮融资。基于自主研发的多模态通用大模型,生数科技对外提供To B的MaaS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员
2024-03-14 15:12:00
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...体验智谱AI新一代基座大模型GLM-4的强大能力。 智谱AI CEO张鹏表示:“人工智能大模型技术已成为国际科技竞赛必争之地
2024-02-04 14:00:00
更多关于财经的资讯:
■张陈南摘要:在不确定性显著上升的产业环境中,企业面临的经营风险呈现多样化与系统化并存的特征。产业链纵向整合作为企业重要的战略选择
2026-02-07 05:16:00
借力资本市场,聚力燕赵智造。2月8日,河北资本市场大讲堂系列活动第四期将走进邯郸,围绕上市公司高质量发展、深耕主业推动价值提升等内容
2026-02-07 07:30:00
烟台农商银行芝罘区幸福支行为新业态群体“上门办卡”送温暖
胶东在线2月4日讯(通讯员 刘萌莉)新春临近,年味渐浓。为进一步增强新业态、新就业群体的幸福感和归属感,推动“幸福家园”共建走深走实
2026-02-07 04:03:00
鸿蒙生态赋能 光大手机银行13.0解锁便民新体验
多彩贵州网讯(记者 金星)近日,中国光大银行发布鸿蒙版手机银行13.0。本次升级以技术创新为引擎,重构五大主页,持续强化设备适配能力
2026-02-06 21:26:00
学前教育作为国民教育体系的重要基石,承载着家庭的期盼。近日,工行兴义坪东支行精准对接民生需求,向辖内某民办幼儿园成功发放110万元普惠金融贷款
2026-02-06 21:57:00
“十五五”规划建议明确指出:“坚持扩大内需这个战略基点,坚持惠民生和促消费、投资于物和投资于人紧密结合。”惠民生是促消费的前提基础
2026-02-06 21:57:00
工行凯里榕江支行:暖冬围炉话反诈 守护百姓“钱袋子”
寒冬腊月,暖意融融。2026年1月26日,工行凯里榕江支行组织反诈宣传小分队,深入榕江县忠诚镇定弄村,开展“金融反诈进侗寨”主题宣传活动
2026-02-06 21:57:00
金融活水润“椒”田,普惠服务助振兴——工行毕节纳雍支行精准赋能特色产业发展
近年来,工行毕节纳雍支行锚定乡村振兴战略部署,聚焦地方特色辣椒产业发展痛点,以普惠金融创新实践为抓手,将金融服务深度嵌入辣椒种植
2026-02-06 21:58:00
工行遵义赤水支行成功落地遵义市首个加油站“支付即开票”场景业务
2026年以来,工行遵义赤水支行紧跟上级行数字化转型战略步伐,聚焦传统开票流程中的痛点问题,积极探索金融科技与消费场景的深度融合
2026-02-06 21:58:00
在“双碳”目标引领与绿色发展浪潮下,工行兴义分行始终将绿色金融作为战略重点,深耕新能源、环保、低碳等关键领域,以金融活水精准滴灌绿色产业
2026-02-06 21:58:00
工行毕节黔西支行:金融活水助力黄牛产业越来越“牛”
数九寒天,贵州黔西市林泉村的山坳间,一座座崭新牛舍整齐矗立。养牛大户王大哥穿梭其中,为膘肥体壮的牛群添料加草,脸上洋溢着满足的笑容
2026-02-06 21:58:00
多彩贵州网讯(记者 金星)在贵州遵义,一座温暖的养老院正悄然发生着变化。走进遵义市康宁世纪养老服务有限公司,整洁的环境
2026-02-06 21:58:00
据Wind数据统计,节前最后一周,A股限售股上市规模大幅减少,数量仅有24.4亿股,较本周降近一半,以周五收盘价计算,解禁市值约350
2026-02-06 22:22:00
周五,A股低开后震荡上行,尾盘有所回落,盘面热点相对分散。光伏设备产业链午后拉升,中药概念股表现强势,有色金属概念回暖
2026-02-06 22:22:00
2026年开年以来,科创板市场再现回购热潮。据Wind数据统计,截至2月6日,已有55家科创板上市公司实施或完成股票回购
2026-02-06 22:22:00