• 我的订阅
  • 财经

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

类别:财经 发布时间:2024-03-15 09:40:00 来源:汽车很听话

“如果说一年前的那一天我们是在爬山,那么经过了这一段时间的攀登,我们有了更多的积累,现在我们可以比较自豪地说,我们已经积累了非常丰富的研发经验和积淀。”3月14日,在智谱AI媒体小型沟通会上智谱AI CEO张鹏表示,站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是完全自主可控的,是自己从零到一研发的。

3月14日,由央视网“人人都爱中国造”品牌助力行动和智谱AI联合主办的“智领,万象新生”智谱AI媒体小型沟通会在北京搜狐网络大厦举办。总台央视网主持人常婷介绍,“人人都爱中国造”品牌助力行动是2020年在国家相关部委指导下发起的,以“支持国货,赋能品牌”为核心。“中国制造”到“中国智造”的创新热潮方兴未艾,中国创新的的浪潮已经席卷到每一个人的身边。在不久前刚刚召开的全国两会上,“人工智能+”这个概念被首次写入到了政府报告当中。新质生产力引擎开启,万象新生时代正在来临。活动还通过总台央视网、小央视频视频号以及智谱AI视频号同步直播。

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

大模型(人工智能)三个阶段

首先,智谱AI的CEO张鹏向大家回归了大模型(人工智能)三个阶段:从2017年谷歌提出Transformer开始迅速席卷了整个人工智能领域的研究和产业,成为自然语言处理等相关研究的一种最主要的方法,2018到2020年这段时间先后出现了像谷歌的BERT、GPT-1/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习方法的预训练模型。当时尤其是BERT在十多个自然语言理解任务当中大大地超越传统的机器算法的精度,掀起了一种全新的研究范式;一直到2019年GPT-2的实现,它提供了自然流畅的文本内容的生成能力,彼时GPT-2的应用Talk2Transformer确实让大家很惊艳,当然对比现在的ChatGPT以及我们自己的ChatGLM等一系列的应用来说还是比较粗糙的,但正因为这些技术坚定了我们投身生成式人工智能的决心;到2020年谷歌的T5将自然语言的翻译、分类、回归、摘要等一系列任务统一成了一个简单的Text-to-Text的任务。

张鹏强调,可以说2018-2020是大模型的原始算法创新的一个阶段。也是在这个阶段里边,智谱AI也从0到1开发了自己的具有完全独立知识产权的预训练模型,我们叫它 GLM(General Language Model),它采用了自回归填空的方式,综合了GPT和Bert这几种优秀的预训练框架的优点。

大模型与小模型的讨论

张鹏认为,在当时国内学术界和产业界都对大模型的发展和产业化没有形成共识,有很多的讨论,甚至很多人提出成本这么高,我们不应该发展大模型,而应该专注于发展所谓的“小”模型。

“说实话在那个时间段,我们自己内部也有很多的思考和讨论,也有一些争论,正如大家所知,这件事情的投入成本非常高、非常大的,作为一家刚刚建立不久的创业型企业,我们如何来支撑这么大的资源,而且我们的研发人员团队是否能支撑这样一个任务?”张鹏说,外部市场对于大模型的认知少,对这个概念还非常陌生,各方面都处于一个非常艰难的情况和境地,换而言之,其实当时的智谱是有那么一点孤注一掷的意思,大家的压力,尤其是研发人员的压力是非常大的。大家最近可能也听说了 OpenAI 团队内部的一些非常卷的故事的一些情况,其实我们当时的情况甚至比他们更严重,非常类似。

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

GLM-130B唯一来自亚洲被列入评测的对象

张鹏说,2022年我们在训练自己的千亿模型的时候,我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群,凌晨三点多的故障,我们可以在5分钟之内我们的算法人员先发现,然后通知远程的运维人员,让他们及时解决问题,10分钟、15分钟之内就能解决这样的一个掉卡甚至是硬件故障的问题,这是非常难的一件事情,也都是我们亲身经历的经过。

“所以在2022年我们推出并且开源了基于GLM算法训练的千亿基座模型GLM-130B,这是我们研发团队心血的积累,当时也引起了非常广泛的关注,尤其是在国外,包括像斯坦福、谷歌、OpenAI、Apple、Meta这些非常知名的研究机构和大型的科技公司都对我们的模型进行了深入的研究、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告,报告的名称缩写叫HEOM,对全球的几十个开源和闭源的模型进行了深入的评测,有幸我们的GLM-130B作为一个唯一来自中国,甚至唯一一个来自亚洲的这样一个模型被列入评测的对象,并且从评测的结果上来看,在一些指标,比如准确性、公平性等很重要的核心指标上与当时最先进的GPT-3 175B的模型是持平或者是接近的,在有一些特殊的指标,比如说像鲁棒性、校准偏差和无偏性等方面甚至要比它们表现的更好。”张鹏介绍说,这个成绩一出来,整个团队都非常激动。我们八九个月的辛苦得到了回报,也证明了我们团队有这个能力、有这个实力、更有这个激情去做到这样一件事情。所以站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是什么?是这一切是在我们完全自主可控的,是我们自己从零到一研发的。

智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

ChatGLM是国内最早可以线上测试使用的千亿级的对话模型

张鹏介绍,2022年11月30日OpenAI发布了ChatGPT真正让大家认识到大模型能做到什么样的事情,大模型也开始出圈,扩散到整个社会、全球,让所有人都认识到大模型。一夜之间,几乎所有人都对必须发展大模型都达成了一个高度的共识。大模型的发展不再仅限于模型技术的发展和模型训练本身,更重要的是如何实现模型的产业化应用,这个问题已经提上大家的日程。

“大模型开始在各个领域尝试落地生根,在金融、互联网和教育等众多行业当中开始落地,也得益于我们GLM-130B基座模型的优秀能力,我们很快在2023年2月份就研发出了第一代ChatGLM,这也是我们去年3月14号发布的这个产品的基座,这应该是国内最早可以线上测试使用的千亿级的对话模型,基于它我们开发了刚才大家看到的演示当中的智谱清言这样一款C端的应用,并在8月第一批通过了国家的备案认证,正式的面向公众上线使用。”张鹏说,这个是我们在2023年取得的一些成绩,我们实现了2000+生态合作伙伴、1000+大模型规模化应用、200多家企业跟我们进行了深度的共创,解决它们的问题,切切实实的、潜移默化的在改变着每一个客户的业务、效率,甚至更深度的改变着客户的业务范式和组织架构,这是我们所希望看到的。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-15 12:45:19

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...为何发挥着关键作用?新华网就此专访智谱AI首席执行官张鹏。他表示,人工智能应用目前主要集中在语言类模型,随着大模型的不断进化,未来必然会出现更多的新模态场景,智谱AI将与终端
2024-05-17 10:14:00
融资超25亿元,他们的目标和OpenAI很像
...近举行的2023中国计算机大会(CNCC2023)上,智谱AI推出了自主研发的第三代基座大模型ChatGLM3及相关系列产品
2023-11-13 07:44:00
对话智谱AI CEO张鹏:我们不做中国的ChatGPT|36氪专访
...户量和用户数据反馈最直接的通路,团队也基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,正式上线了首款生成式AI助手——“智谱清言”
2023-09-05 09:22:00
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...以交给Agent来完成。这样具有科技感的画面,来自智谱CEO张鹏对新升级的AutoGLM的现场演示。智东西11月29日报道
2024-12-02 09:50:00
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...最好回应。“我们交出了一份还不错的答卷。”智谱AI CEO张鹏说。截止目前,智谱AI已经有2000+生态合作伙伴、1000+大模型规模化应用
2024-03-15 09:19:00
让AI像人一样操作手机电脑!智谱董事长刘德兵:智能体将让“光说不干”成为现实
...大模型具有更大潜力的地方。相较外界更为熟知的智谱CEO张鹏,刘德兵相对低调,但在推动智谱商业化方面起到了重要作用。‌他是中国工程院高文院士的弟子,担任过清华数据科学研究院科技
2024-11-29 15:19:00
“泰昌”以塔尖创新引领未来
...列前茅。纵观泰昌三十多年的发展历程,在董事长兼总裁张鹏飞看来,集团几经生死考验,又屡屡化险为夷大步前进的“法宝”就是创新。在科技不断进步和全球化的浪潮中,不断创新超越,提升长
2024-01-15 14:11:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...科技,在创立当年已经完成了近亿元的天使轮融资。基于自主研发的多模态通用大模型,生数科技对外提供To B的MaaS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员
2024-03-14 15:12:00
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...体验智谱AI新一代基座大模型GLM-4的强大能力。 智谱AI CEO张鹏表示:“人工智能大模型技术已成为国际科技竞赛必争之地
2024-02-04 14:00:00
更多关于财经的资讯:
厦企超15亿元收购算力产业链企业
厦门网讯(厦门日报记者 李晓平)9月29日,华懋(厦门)新材料科技股份有限公司(以下简称“华懋科技”)发布重组方案,将以15
2025-10-04 09:20:00
我爱你中国丨走过四季,中国石油人用行动诠释
编辑:林辉审核 :莫韶华
2025-10-04 20:16:00
河北中行创新金融工具助企化解汇率风险
帮助外贸企业有效应对汇率风险,是企业走出去、走得稳、走得远的关键。位于河北石家庄的国家级专精特新“小巨人”——先控捷联电气股份有限公司是一家专注于数据中心基础设施
2025-10-04 09:37:00
大众点评“必吃榜”发布“十一”假期首日寻味数据,烟火小店流量涨超125%、订单涨超178%
“十一”假期,第一批“吃货”已跟着“必吃榜”深入大街小巷,“吃”出了一份“味蕾游”指南。10月2日,大众点评“必吃榜”发布“十一”假期首日寻味数据
2025-10-03 10:34:00
节假不停歇!织金摩天冲磷矿日均采矿量维持高位
井下胶带运输机轰鸣声不绝于耳,选矿厂浮选设备转动不停,调度中心大屏数据闪烁不断……这个国庆中秋假期,位于毕节市织金县大山深处的西南能矿集团贵州锦麟化工公司摩天冲磷矿项目日均采矿量仍保持高位运行
2025-10-03 22:01:00
农行烟台龙口市支行营业部开展专项宣传 筑牢企业金融安全墙
近日,农行烟台龙口市支行营业部以“金融教育宣传周”为契机,组织业务骨干深入企业,开展“普惠金融与风险防范”专项宣传。活动聚焦小微企业融资难题及新市民群体金融需求
2025-10-04 02:03:00
贵阳燕楼镇保障房项目建设不停歇|大抓项目看进度
10月3日,贵阳市花溪区燕楼镇保障性租赁住房项目施工现场一派火热。室内区域内,施工队正严守成品精装标准开展墙面处理、管线布设等装修收尾工作
2025-10-04 02:10:00
速度刷新!又一省重点项目全面封顶
10月1日,随着最后一立方混凝土浇筑完成,由中建八局一公司承建的山东中医药大学附属医院东院区综合楼建设项目顺利完成主体结构全面封顶
2025-10-03 17:54:00
油田一案例入选“十四五”石油和化工行业数字化转型优秀案例
近日,胜利油田“数据治理赋能企业数字化转型”案例成功入选石油和化工行业“十四五”数字化转型优秀案例,这标志着油田在数字化转型领域的创新实践成果成为行业标杆
2025-10-02 10:26:00
金汇泉城 共绘未来|天津银行这场对接会让普惠金融更“有温度”
9月23日,一场以“金汇市中·融聚未来”为主题的政银企对接会在济南市市中区火热召开。天津银行济南分行携手市中区政府,联合市中区金融运行监测中心
2025-10-02 16:43:00
黎平县“企业之家”为12家企业协调资金约8000万元
9月25日,黔东南州黎平县委常委、副县长张泽猛在“企业之家”主持召开企业融资需求协调推进会议,聚焦企业融资瓶颈问题,凝聚多方力量为企业发展注入金融活水
2025-10-03 02:14:00
北大教授亲自为您支招,家庭保险配置“三步法”助您快上手
买保险,对大多数老百姓来说,就图个心安,不仅要买好,还需买对。可以说,这本白皮书给出了新选择,家庭保险配置“三步法”给出了最佳路径
2025-10-02 16:09:00
在青岛楼市,海景房才是真改善……
摘要:买到的不只是房子,是一片海,更是青岛的历史与未来!从崂山前海住区到市南滨海区,青岛的一线海景房已经越来越少……如今
2025-10-01 10:17:00
有色行业迎来政策利好
有色金属行业迎来指导高质量发展的重磅文件。9月28日,工业和信息化部等八部门印发《有色金属行业稳增长工作方案(2025-2026年)》
2025-10-01 10:58:00
招商银行科创贷,为科技企业腾飞插上金融羽翼
齐鲁晚报·齐鲁壹点记者 尚青龙招商银行面向科创企业客群焕新推出“科创贷”专属产品第三版,以金融产品创新助推科技企业健康发展
2025-10-01 11:57:00