• 我的订阅
  • 科技

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

类别:科技 发布时间:2023-10-28 14:00:00 来源:36氪

文|周鑫雨

编辑|邓咏仪

2023年10月26日开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。

这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果,他们更是为了秀出各家厂商的大模型“肌肉”,展示产业落地的成功:

这也意味着,如今落地成果代替技术参数,成了大模型厂商最重要的竞争力。

10月27日,作为AI赛道备受瞩目的独角兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△在CNCC,智谱AI CEO张鹏发布新一代模型

在论坛上,智谱AI发布了新一代的中英双语对话模型ChatGLM3和生成式AI助手智谱清言,并在智谱AI开放平台上推出了新的模型训练和部署方案。据智谱AI CEO张鹏介绍:

ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△在最新AgentBench上,ChatGLM3-turbo版本的Agent能力

智谱AI的下半年可谓好事连连:

8月31日,在8家首批获网信办批准向公众提供大模型产品服务的公司中,智谱AI占有一席。其研发的千亿参数对话模型“智谱清言”顺势面向公众开放;

在近几个月完成的B-4轮融资中,智谱AI的股东出现了腾讯战投、阿里云战投等头部互联网战投和基金的名字。2023年,智谱AI已经累计获得超25亿人民币融资,一跃成为AI赛道的独角兽。

如今的智谱AI的核心团队,除了首席科学家唐杰、CEO张鹏等清华知识工程实验室出身的创始人,还迎来了新面孔——智源研究院副院长刘江,曾经光年之外(王慧文创立的AI公司)的核心成员,如今首次以“智谱首席生态官”的角色出席CNCC。

新一代ChatGLM3发布,特定任务下接近GPT-3.5水平

论坛上,智谱AI对标GPT-4V发布了新一代的对话模型ChatGLM3,并推出了1.5B、3B、6B规模参数的不同版本。相较于ChatGLM2新增的1.5B版本,已经能够部署在笔记本电脑、手机和汽车上。

CEO张鹏介绍,ChatGLM3主要在4四个方面进行了性能提升:

接入了具有多模态理解能力的模型CogVLM,提升看图识语义能力。

接入了代码增强模块 Code Interpreter,能根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务。

接入了网络搜索增强模型WebGLM,进行了联网。

增强了语义理解和逻辑理解能力。

值得一提的是,如今AI Agent(智能体)已经成为构建AI原生应用的新风向。为此,ChatGLM3集成了智谱AI自研的AgentTuning技术。

如何理解这项技术?就像义务教育和专科教育之间的关系,对于大模型而言,通用性和特定场景下的能力往往成反比:通用性强的大模型构建的Agent,执行特性任务的能力反而会变弱。

AgentTuning技术的关键点在于构建了一个轻量但高质的指令调整数据集。通过这一指令调整数据集,大模型可以在增强对特定任务的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。

智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。

“大模型元年”,在开场演讲上,智谱AI首席科学家、清华大学计算机系教授唐杰如此戏称今年的“百模大战”。

他表示,今年预训练模型真正的创新型的学术研究少了,而基于一个强大底座疯狂训练模型的人变多了,只需要加个名字,就成了新的模型。

那么,智谱AI如何理解创新型的学术研究?

此前在36氪的专访中,张鹏就表示“智谱AI不做中国的OpenAI”。在他看来,中国没有自己的预训练模型框架,市面上最主流的三种模型训练路径(GPT、BERT、T5)都来自西方。

为了打破西方的路径垄断,智谱AI提出了全新的GLM(通用语言模型)路径。若GPT的原理可以被比作“根据上文做完形填空”,那么GLM完形填空的依据则从上文扩充到上下文——理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△GLM训练原理

基于GLM这个通用大模型底座,目前智谱AI已经开源了中英双语对话模型ChatGLM-6B,还推出了针对代码、视频、图像生成的一系列模型。目前,针对B端企业的模型训练、微调、部署等服务,是智谱AI的主要业务形式。

C端助手编程、搜索更强了,B端API价格下降50%

即便不做中国的OpenAI,但产品线对标OpenAI,是智谱AI成立第一天就写在企业目标中的重点。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△智谱AI对标OpenAI的产品线

此前,智谱AI已经基于ChatGLM推出了生成式AI助手智谱清言。

在CNCC上,智谱AI发布了基于ChatGLM3的新版本智谱清言。相较于上一代,智谱清言的功能不再只是聊天吹水、写诗作画,而是增强了编程、搜索等工具型能力。

除了自然语言,智谱清言将人机交互界面扩展为了多模态,用户可输入代码、图片、图表进行交互。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

智谱清言能力。

不过,在现场演示过程中,智谱清言在代码理解上出了一些bug。当输入其自身给出的“生成一颗红心”的代码,智谱清言最后的绘画结果却是两条函数。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

bug。

张鹏回应,针对bug,智谱清言具有对代码的自动修正能力。不过,目前智谱清言对代码的修证能力还有待提升。

而面对市场不断增长的智能应用构建需求,智谱AI的MaaS平台“智谱AI开放平台”推出了更为经济的ChatGML商用部署方案:ChatGLM-turbo版本,其API价格相较于直接部署ChatGLM降低了50%。

与此同时,智谱AI开放平台还支持企业直接利用智能应用开发工具,实现5分钟构建应用。

论坛上,智谱的合作伙伴,也带来了最新的模型研究成果。

比如如何合法合规地利用手机等终端设备上的私域数据?Epoch AI Research团队的研究报告就指出:公域中高质量的存量语言数据将在2026年耗尽。数据的短缺让大模型训练不可避免地转向利用私域数据,但数据安全隐患也随之浮出水面。

论坛上,微众银行首席人工智能官、加拿大工程院及加拿大皇家学院院士杨强介绍了“联邦迁移大模型”。所谓的“联邦”,一方面是将公域和私域数据分别进行分布式存储,另一方面是在训练过程中,利用分布式架构将模型在不同数据上进行训练。

长按添加「智涌」小助手入群

???????? 添加请备注:公司+职务 ????????

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

欢迎交流

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-28 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AMD又甩了颗“核弹”,这次是商用
...P4架构网络引擎之外,AMD也为企业客户端上了StrixPro这道商用AIPC的大餐。三代积累,AMD商用AIPC处理器日臻成熟作为面向商用AIPC市场推出的第三代产品
2024-10-27 13:44:00
IBM,通用大模型商用“保守主义者”
(图片来源:东方IC)经济观察报 记者 沈怡然 宋笛 8月24日,IBM在大中华区启动了IBM watsonx,这是一个开放式的AI技术平台
2023-08-26 11:00:00
纽约大学教授 Nature 发文:为了科学界的未来
...和广义线性模型在政治科学中的应用。研究人员应该避免商用模型的诱惑,共同开发透明的大型语言模型,以确保可重复性。拥抱开源,拒绝垄断似乎每天都有一个全新的大型语言模型(LLM)推
2023-05-10 15:10:00
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...推动了人工智能从单一智能向全面智能的进化。 Token的商用化路径,云计算如何成为关键推手?Token技术,虽然在理论和实验室环境中展现了巨大的潜力,但将其推向大规模商用并
2024-09-20 09:51:00
麒麟商用大模型发布,有连云率先落地金融AIGC商业化
...与运营成本的高度浪费。有连云国内首款“麒麟金融场景商用AI大模型”,基于对金融行业敏锐的需求洞察力、以AIGC赋能革新传统解决方案,推出了云创、云连和云数的闭环产品矩阵,站在
2023-07-28 16:40:00
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。130亿参数、两大模型
2023-10-30 15:35:00
微软加速AI变现:办公copilot 30美元/月,产品最高涨240%,接入Meta开源模型
...显著提高微软办公业务的ARPU。今年第一季度,微软Office商用产品营收同比增长13%,其中商用版Office 365营收同比增长14%
2023-07-20 01:00:00
OpenAI商用订阅用户数突破100万 新模型传出惊人涨价传言
...费用。(来源:OpenAI官网)OpenAI此前在4月披露,当时的商用订阅用户数量超过60万。不过考虑到公司在5月推出大学特供产品,目前并不清楚过去5个月里有多少新增企业用户
2024-09-06 10:02:00
降价90%,OpenAI开放ChatGPT模型API,国内上市公司机会几何?
...口对此,中信证券表示,OpenAI团队本次通过开放ChatGPT API商用所展现出更加成熟的对模型成本优化的流程,即先训练千亿参数级别甚至更大的大语言模型,再通过蒸馏等技术
2023-03-07 01:00:00
更多关于科技的资讯: