• 我的订阅
  • 科技

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

类别:科技 发布时间:2023-10-28 14:00:00 来源:36氪

文|周鑫雨

编辑|邓咏仪

2023年10月26日开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。

这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果,他们更是为了秀出各家厂商的大模型“肌肉”,展示产业落地的成功:

这也意味着,如今落地成果代替技术参数,成了大模型厂商最重要的竞争力。

10月27日,作为AI赛道备受瞩目的独角兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△在CNCC,智谱AI CEO张鹏发布新一代模型

在论坛上,智谱AI发布了新一代的中英双语对话模型ChatGLM3和生成式AI助手智谱清言,并在智谱AI开放平台上推出了新的模型训练和部署方案。据智谱AI CEO张鹏介绍:

ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△在最新AgentBench上,ChatGLM3-turbo版本的Agent能力

智谱AI的下半年可谓好事连连:

8月31日,在8家首批获网信办批准向公众提供大模型产品服务的公司中,智谱AI占有一席。其研发的千亿参数对话模型“智谱清言”顺势面向公众开放;

在近几个月完成的B-4轮融资中,智谱AI的股东出现了腾讯战投、阿里云战投等头部互联网战投和基金的名字。2023年,智谱AI已经累计获得超25亿人民币融资,一跃成为AI赛道的独角兽。

如今的智谱AI的核心团队,除了首席科学家唐杰、CEO张鹏等清华知识工程实验室出身的创始人,还迎来了新面孔——智源研究院副院长刘江,曾经光年之外(王慧文创立的AI公司)的核心成员,如今首次以“智谱首席生态官”的角色出席CNCC。

新一代ChatGLM3发布,特定任务下接近GPT-3.5水平

论坛上,智谱AI对标GPT-4V发布了新一代的对话模型ChatGLM3,并推出了1.5B、3B、6B规模参数的不同版本。相较于ChatGLM2新增的1.5B版本,已经能够部署在笔记本电脑、手机和汽车上。

CEO张鹏介绍,ChatGLM3主要在4四个方面进行了性能提升:

接入了具有多模态理解能力的模型CogVLM,提升看图识语义能力。

接入了代码增强模块 Code Interpreter,能根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务。

接入了网络搜索增强模型WebGLM,进行了联网。

增强了语义理解和逻辑理解能力。

值得一提的是,如今AI Agent(智能体)已经成为构建AI原生应用的新风向。为此,ChatGLM3集成了智谱AI自研的AgentTuning技术。

如何理解这项技术?就像义务教育和专科教育之间的关系,对于大模型而言,通用性和特定场景下的能力往往成反比:通用性强的大模型构建的Agent,执行特性任务的能力反而会变弱。

AgentTuning技术的关键点在于构建了一个轻量但高质的指令调整数据集。通过这一指令调整数据集,大模型可以在增强对特定任务的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。

智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。

“大模型元年”,在开场演讲上,智谱AI首席科学家、清华大学计算机系教授唐杰如此戏称今年的“百模大战”。

他表示,今年预训练模型真正的创新型的学术研究少了,而基于一个强大底座疯狂训练模型的人变多了,只需要加个名字,就成了新的模型。

那么,智谱AI如何理解创新型的学术研究?

此前在36氪的专访中,张鹏就表示“智谱AI不做中国的OpenAI”。在他看来,中国没有自己的预训练模型框架,市面上最主流的三种模型训练路径(GPT、BERT、T5)都来自西方。

为了打破西方的路径垄断,智谱AI提出了全新的GLM(通用语言模型)路径。若GPT的原理可以被比作“根据上文做完形填空”,那么GLM完形填空的依据则从上文扩充到上下文——理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△GLM训练原理

基于GLM这个通用大模型底座,目前智谱AI已经开源了中英双语对话模型ChatGLM-6B,还推出了针对代码、视频、图像生成的一系列模型。目前,针对B端企业的模型训练、微调、部署等服务,是智谱AI的主要业务形式。

C端助手编程、搜索更强了,B端API价格下降50%

即便不做中国的OpenAI,但产品线对标OpenAI,是智谱AI成立第一天就写在企业目标中的重点。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

△智谱AI对标OpenAI的产品线

此前,智谱AI已经基于ChatGLM推出了生成式AI助手智谱清言。

在CNCC上,智谱AI发布了基于ChatGLM3的新版本智谱清言。相较于上一代,智谱清言的功能不再只是聊天吹水、写诗作画,而是增强了编程、搜索等工具型能力。

除了自然语言,智谱清言将人机交互界面扩展为了多模态,用户可输入代码、图片、图表进行交互。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

智谱清言能力。

不过,在现场演示过程中,智谱清言在代码理解上出了一些bug。当输入其自身给出的“生成一颗红心”的代码,智谱清言最后的绘画结果却是两条函数。

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

bug。

张鹏回应,针对bug,智谱清言具有对代码的自动修正能力。不过,目前智谱清言对代码的修证能力还有待提升。

而面对市场不断增长的智能应用构建需求,智谱AI的MaaS平台“智谱AI开放平台”推出了更为经济的ChatGML商用部署方案:ChatGLM-turbo版本,其API价格相较于直接部署ChatGLM降低了50%。

与此同时,智谱AI开放平台还支持企业直接利用智能应用开发工具,实现5分钟构建应用。

论坛上,智谱的合作伙伴,也带来了最新的模型研究成果。

比如如何合法合规地利用手机等终端设备上的私域数据?Epoch AI Research团队的研究报告就指出:公域中高质量的存量语言数据将在2026年耗尽。数据的短缺让大模型训练不可避免地转向利用私域数据,但数据安全隐患也随之浮出水面。

论坛上,微众银行首席人工智能官、加拿大工程院及加拿大皇家学院院士杨强介绍了“联邦迁移大模型”。所谓的“联邦”,一方面是将公域和私域数据分别进行分布式存储,另一方面是在训练过程中,利用分布式架构将模型在不同数据上进行训练。

长按添加「智涌」小助手入群

???????? 添加请备注:公司+职务 ????????

智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线

欢迎交流

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-28 14:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AMD又甩了颗“核弹”,这次是商用
...P4架构网络引擎之外,AMD也为企业客户端上了StrixPro这道商用AIPC的大餐。三代积累,AMD商用AIPC处理器日臻成熟作为面向商用AIPC市场推出的第三代产品
2024-10-27 13:44:00
IBM,通用大模型商用“保守主义者”
(图片来源:东方IC)经济观察报 记者 沈怡然 宋笛 8月24日,IBM在大中华区启动了IBM watsonx,这是一个开放式的AI技术平台
2023-08-26 11:00:00
纽约大学教授 Nature 发文:为了科学界的未来
...和广义线性模型在政治科学中的应用。研究人员应该避免商用模型的诱惑,共同开发透明的大型语言模型,以确保可重复性。拥抱开源,拒绝垄断似乎每天都有一个全新的大型语言模型(LLM)推
2023-05-10 15:10:00
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...推动了人工智能从单一智能向全面智能的进化。 Token的商用化路径,云计算如何成为关键推手?Token技术,虽然在理论和实验室环境中展现了巨大的潜力,但将其推向大规模商用并
2024-09-20 09:51:00
麒麟商用大模型发布,有连云率先落地金融AIGC商业化
...与运营成本的高度浪费。有连云国内首款“麒麟金融场景商用AI大模型”,基于对金融行业敏锐的需求洞察力、以AIGC赋能革新传统解决方案,推出了云创、云连和云数的闭环产品矩阵,站在
2023-07-28 16:40:00
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。130亿参数、两大模型
2023-10-30 15:35:00
微软加速AI变现:办公copilot 30美元/月,产品最高涨240%,接入Meta开源模型
...显著提高微软办公业务的ARPU。今年第一季度,微软Office商用产品营收同比增长13%,其中商用版Office 365营收同比增长14%
2023-07-20 01:00:00
OpenAI商用订阅用户数突破100万 新模型传出惊人涨价传言
...费用。(来源:OpenAI官网)OpenAI此前在4月披露,当时的商用订阅用户数量超过60万。不过考虑到公司在5月推出大学特供产品,目前并不清楚过去5个月里有多少新增企业用户
2024-09-06 10:02:00
降价90%,OpenAI开放ChatGPT模型API,国内上市公司机会几何?
...口对此,中信证券表示,OpenAI团队本次通过开放ChatGPT API商用所展现出更加成熟的对模型成本优化的流程,即先训练千亿参数级别甚至更大的大语言模型,再通过蒸馏等技术
2023-03-07 01:00:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者何洁 实习生杨久久国际审计留学来华学什么?中国审计智慧如何推动高质量共建“一带一路”行稳致远
2025-10-30 07:57:00
近日,第五届青年企业家创新创业盛典(简称“青创盛典”)在深圳成功举办。本次活动由北京、上海、深圳、广州、厦门等12个省市“双创”机构重点支持
2025-10-29 14:31:00
中新经纬10月29日电 (魏薇)“中国民营火箭企业正加速突破可重复使用技术瓶颈,预计一年内攻克液体可重复使用火箭核心难题
2025-10-29 14:41:00
大皖新闻讯 近日,知名火锅品牌巴奴毛肚火锅(以下简称巴奴)宣布11月1日起对会员体系进行全新升级,核心变动为会员等级判定标准从“消费次数”改为“消费金额”
2025-10-29 15:32:00
从频繁捡耳机到狂甩不掉,听智慧定制蓝牙耳机如何终结佩戴尴尬
通勤路上刚戴上耳机,一个哈欠就让右耳的耳塞滑进了衣领;晨跑时耳机随着步伐甩动,耳塞在耳道里反复松动,最后干脆“跳”出耳朵
2025-10-29 15:46:00
六大巨头携手唯欧口腔集团,战略合作共建产业新生态
在中国口腔医疗行业迈向高质量发展的重要阶段,产业链协同与国际化合作已成为推动行业升级的关键力量。2025年10月16日
2025-10-29 15:49:00
灵芝孢子油什么品牌好吃 2025年灵芝孢子油品牌排行榜TOP5
灵芝孢子油什么品牌好吃?这是消费者选购时最关注的核心问题。作为灵芝孢子油领域研究人员,本文结合行业数据与用户真实反馈,从有效含量
2025-10-29 15:50:00
远征 A2 完成第五次 OTA 升级,智元迈向场景应用”全面智能体”
近日,智元机器人正式宣布远征A2人形机器人完成第五次全量OTA升级。本次升级聚焦于机器人在动态环境下的语义理解、路径规划
2025-10-29 15:51:00
双11哪些家电值得买?抄作业!上榜的都是爆款
今年双11与往年复杂的促销玩法不同,今年各大电商平台进一步简化规则,通过热卖榜、新品榜等不同维度的榜单,为消费者提供更直观的购物参考
2025-10-29 16:29:00
双11家电市场观察:理性消费时代,品质与体验成破局关键
今年双11,各大平台简化玩法,推广“官方立减”“单件直降”等,以降低用户的决策成本、提升购物体验。同时,大促的日常化和高频化
2025-10-29 16:32:00
济宁移动智慧医疗与人工智能实验室揭牌成立
鲁网10月29日讯10月28日,由济宁移动、济宁市第一人民医院、国家健康医疗大数据研究院三方合作共建的智慧医疗与人工智能实验室揭牌仪式
2025-10-29 17:45:00
10月28日,太钢出口欧洲的首批绿钢产品启运。此次启运标志着太钢绿钢成功突破欧盟绿色产品市场,正式跻身产业链中高端。此次出口的304L不锈钢中板
2025-10-29 18:00:00
日前,“一键和解跨域共建放心消费多元共享”主题活动在杭州举行。太原市市场监督管理局与杭州、成都、厦门、南宁、兰州等五市共同签署《共建共享优化消费环境合作协议》
2025-10-29 18:00:00
【劲牌故事荟 大家谈友好】一金一铜背后是企业的创新升维
□楚青萱10月17日至19日,第二十九届全国发明展览会在石家庄国际会展中心举行,同期举办了“一带一路”暨金砖国家技能发展与技术创新大赛
2025-10-29 18:28:00
“码”上雄安,一触即发!雄安新区“企业码”创新应用系统上线
据中国雄安网消息,当数字中国的脉搏在雄安跳动,一座“未来之城”再次按下加速键。10月29日,雄安新区企业码创新应用系统正式上线
2025-10-29 18:28:00