• 我的订阅
  • 科技

蜜度CTO刘益东:AI技术发展的成果要让普通人都能理解 | 最前线

类别:科技 发布时间:2023-07-13 14:00:00 来源:36氪

文 | 周鑫雨

编辑 | 邓咏仪

在今年的世界人工智能大会(WAIC)逛蜜度的展台,会有一种来到了做AIGC应用的To C企业的错觉,与会者可以体验用AI写诗、作画,并领取AI制作的明信片。

蜜度CTO刘益东:AI技术发展的成果要让普通人都能理解 | 最前线

WAIC蜜度展厅。图源:蜜度

此次,长年为政企提供语言智能服务的蜜度在WAIC上一口气发布了三个垂直领域的大语言模型:蜜巢知识问答与内容生成大语言模型、蜜巢智能舆情分析大语言模型、智能校对领域大语言模型“蜜度文修”。这三款语言大模型主要为新闻出版、媒体采编、政府公文领域提供智能化的服务。

蜜度CTO刘益东告诉36氪,以前蜜度参加过不少展会,采取的都是在屏幕上展示产品专业参数的形式。从去年WAIC开始,蜜度开始用普通用户都能理解的形式呈现技术能力,观众可以对AI技术进行现场体验。

他打了个比方:“我们的展台,想让爷爷奶奶辈也感受到AI的智能便利。好比大诗人杜甫常将写好的诗念给不识字的老婆婆听,以便通俗易懂。”

7月6日的WAIC开幕式上,“深度学习之父”杨立昆重申“LLM不会是那条通往人类智能的道路”。这也让许多厂商跳脱出Transformer的框架,去做创新。

发布自研的行业基座大模型,是今年蜜度的目标。刘益东觉得,自研行业基座大模型是蜜度的方向:“下一个创造风口的可能就不是OpenAI,国内厂商要抓住机会。”

以下是刘益东和36氪的对话:

先垂直,后通用

36氪:这次蜜度和友商们同台秀大模型肌肉,为此蜜度做了哪些准备?

刘益东:我觉得这次WAIC大家会有一些同行竞争的压力,但更多地是抱着交流学习的态度。虽然很多厂商都推出了大模型,但是聚焦的垂直领域是有差异的。我觉得作为企业,需要更多地思考我们的优势在哪里,以及怎么为客户和用户带来实用、便捷、高性价比的AI服务。

36氪:那关于这个问题,蜜度的思考结果是怎样的?

刘益东:在过去的十多年时间里,蜜度主要服务的是政务、媒体、企事业单位的办公需求,也积累了一定规模的客户,所以我们接下来发力的点还是会从这些行业延伸,包括会慢慢地触及教育行业的B端客户。

我觉得蜜度的优势首先在数据能力,在2017、2018年的时候我们已经把AI的一些能力通过产品赋能用户了,在大量高质量行业数据的基础上,蜜度能够更好地实现应用落地。

其次是客户经验的积累,我们对客户需求的认知和理解程度还是很高的,虽说现在方案仍需要精细打磨,但至少现在我们已经有相关的基础,能在未来给客户提供“开箱即用”的成熟方案。

最后是蜜度对科研的投入,2019年公司成立了专门的科研机构“微热点研究院”,主要用于与学界科研力量一起追踪前沿科技。

36氪:大会上蜜度先发了三个垂直领域的大模型,而不是一个通用的基座。

刘益东:是的,这次我们发布的几个模型是针对垂直领域的。

我们的目标是在今年下半年在已经发布的模型的基础上,去训练一个参数规模在千亿级的行业基座模型。当然这个基座模型还是会倾向于政务和媒体的场景。

36氪:先基于开源模型训练垂直领域的模型有怎样的考虑?

刘益东:大模型领域的发展可以说是日新月异,我们选择先做垂直领域的模型主要是考虑了现实应用的需求。因为基座模型的训练是一个漫长、投入大的过程,同时不是说一次就能得到很好的效果,而是要做很多方向的调整。为了满足客户当下的需求,我们考虑先推出垂直领域的大模型,满足垂直行业应用的需求。

36氪:华为也有自己的“盘古大模型”,提出了垂直领域的模型解决方案,作为华为昇腾的客户,蜜度与华为会不会也形成竞争关系?

刘益东:在我的理解中,华为更多的是做一些底层基础设施的工作,而我们的定位是偏中上层的应用。整个AI生态不是说一个人就能把所有事都干完,大家各自都在做擅长的事,所以我们一直和华为都有良好的合作。

最难的是工程落地

36氪:ChatGPT带起的AI热潮也已经过去大半年了,您觉得算力、数据等哪些难点得到了一定的解决?哪些还是“卡脖子”问题?

刘益东:我觉得算力、算法、数据,还有一些工程性的挑战都是非常关键的因素。

先从算力讲起。过去半年多的时间里,各地的算力网络建设也很快。比如上海的超算中心就在过去半年里提供给了我们很大的算力支持,其实建设的速度很快,并且它能够支持国产的异构算力,算力这个难点还是得到一定的解决。

接着是算法。整个大模型开源生态在过去半年里发展得非常快。最开始开源模型有千亿的参数,我们只能用小数据做试验。后来更多的快速训练的框架面世,就能帮助我们仅用百卡的级别来训练一个百亿参数级别的模型。所以通过半年的观察和摸索,下半年我们具备了自主训练基座大模型的条件。

不过,在数据层面我们仍然面临一些挑战。因为中文高质量的数据生态发展才几个月的时间,当然这段时间内各行各业都在建立高质量的数据训练集,其中一些是以开放的方式,我觉得这是非常好的趋势。如果解决了中文训练数据的问题,至少从大模型的算力、算法和数据三个角度而言,基本上不会有太多问题。

而最大的挑战来源于工程落地。大模型前期的落地步骤包括用户应用,成本很高。如何让大模型在内部落地,并且让客户高效利用好,这是蜜度这半年来在思考和在实施的。目前我们已经做到把蜜度的大语言模型部署在消费级的显卡上,比如说国产的华为昇腾NPU卡。

AI技术发展的成果要让普通人都能理解

36氪:蜜度大模型的优势主要在哪些方面?

刘益东:主要在部署成本上。我们的大模型已经能够做到用消费级显卡就能部署,对于企业客户而言,考虑到安全保障,这个成本是可接受的。

同时用户要把大模型用好,和单纯部署中间有一个gap,弥合这个gap对于我们来说就是要去契合地接入各种业务场景,设计交互友好的产品界面,我们做了很多工程性的工作,把整体的功能用简单易用的形态交付给客户。

36氪:这次展示的AI作诗、绘画等模型功能,看上去都很toC,蜜度是有做toC应用的计划吗?

刘益东:以前我们参加过很多展会,更多地是把比较专业的细节在屏幕上展示。但参展者就会觉得很陌生,这其实不利于普通客户的传播和理解。所以从去年的WAIC开始我们就以普通用户可以理解的形式把我们的技术能力展现出来。

36氪:这次大会杨立昆也提到大语言模型不是通往AGI的最优解,您对此是怎么看的?蜜度是否会跳脱出Transformer的路径去做新的尝试?

刘益东:我们内部一直在启动一些创新,不管是基于Transformer的还是新的技术路径。那么我们的创新能不能超越Transformer?这其实并不是拍拍脑袋就能实现的,而是需要大量的科研投入。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-13 18:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

大模型有收费有免费 开源代码是一种共享商报讯 免费的AI真香啊!从豆包、通义到Kimi、文小言,又到DeepSeek,普通大众的各种问题几乎都能在这些AI APP上得到答案。其实
2025-03-06 08:29:00
Tech100 | 哈工大深圳团队入局多模态大模型,自研「若愚-九天」荣登OpenCompass榜首
...智能研究院团队,依托学校的哈深资产经营有限公司进行成果转化,成立了多模态大模型研发企业--深圳若愚科技有限公司(以下简称“若愚科技”)。若愚科技旗下首款多模态大模型“若愚-九
2023-08-09 09:55:00
云栖通道上演AI“实战秀”:守护珊瑚、助盲出行、千元机器人勾勒落地新图景
...,而他始终坚持的理念,就是让具身智能“接地气”——普通人花几千元就能开发属于自己的机器人。“通义大模型帮我打破了学科壁垒!”张子豪分享道,机器人开发涉及自动化、电子、视觉等多
2025-09-25 20:58:00
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...新一代基座大模型GLM-4是智谱 AI专注于大模型创新的最新成果。智谱 AI愿与人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区和学术界一同努力,为中国人工智能产业
2024-02-04 14:00:00
B站公布了多项自主研发的AI技术成果和AIGC多元创意
...哩哔哩(以下简称“B站”)公布了多项自主研发的AI技术成果和AIGC多元创意,包括最新定制的AI语音声库、自研音视频大模型必剪Studio以及自研AI动态漫技术等
2024-07-06 03:04:00
京港洽谈会海淀专场圆满落幕,智谱积极响应共绘两地合作蓝图
...淀”为主题,围绕京港两地在人工智能等优势领域的前沿成果、科技投资、产业资源对接、人才交流等议题展开了深入交流。智谱作为海淀区的代表性企业之一,荣幸受邀参与此次活动,与130余
2024-09-25 09:21:00
杭州国资再出手 加码投资国产大模型
...。2019 年,智谱从清华大学计算机系知识工程实验室技术成果转化而来,后提出自己的模型算法GLM。2024年智谱从基座模型能力延展为多模态和Agent
2025-03-03 18:32:00
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...用于后续的对话回忆、问题引导和精准回答。这一合作的成果显著。据统计,该应用通过准确性、完整性、实用性三个维度的评测,全链路测评分数可达80+。这便是对大模型商业价值的直观诠释
2024-03-15 09:19:00
...)上,北京人工智能新晋独角兽、清华大学计算机系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3
2023-10-28 08:25:00
更多关于科技的资讯:
新春佳节,浙江不少企业春节“不打烊”,抢订单、赶交付、跑海外,把年过在了车间里和海外展台前。走进宁波这家科技企业,工作人员正紧盯屏幕
2026-02-20 15:04:00
马年春节,杭城消费市场持续升温。一批全国首店、浙江首店、杭州首店密集登陆湖滨、武林、钱江新城、奥体等核心商圈,覆盖潮玩
2026-02-20 07:31:00
大年初三,杭州苏宁易购庆春路店暖意融融。大厅里“焕新幸福年”的红色标语格外醒目。店内客流平稳,多为全家同行的家庭顾客,虽不似年前拥挤
2026-02-20 08:01:00
“库迪咖啡竟然涨价了,9.9元的咖啡以后还能闭眼冲吗?”春节前最后一个工作日,东北姑娘小乔中午赶到杭州火车东站,准备坐高铁回老家
2026-02-20 08:01:00
潮声丨从“Made in”到“Design by”,浙江品牌出海记
新春,义乌老板们已经忙碌起来。这几天,24家义乌企业亮相2026年美国拉斯维加斯服装服饰及面料展,带着新品抢订单、拓市场
2026-02-19 16:24:00
新春走基层|“解码”潮玩盲盒:Z世代用情绪消费点亮团圆年
中青报·中青网记者沈杰群余冰玥李怡蒙见习记者蒋欣雨95后北京职员王之怡在新加坡休假时,特意去了环球影城附近的泡泡玛特,店内挤满了年轻人
2026-02-19 12:05:00
大年初一,匆匆赶到湖州的生产基地,给春节坚持留守在生产一线的一百多名员工发完新春红包后,金羽新能董事长兼总经理黄杜斌又拿起了手机
2026-02-19 08:20:00
以下为报道原文:从“猜你喜欢”到“懂你需要” 人工智能加速“嵌入”日常生活人民日报 记者 谷业凯“帮我订春节假期南京到三亚的往返机票
2026-02-18 17:52:00
重要突破!中国科大发现新型有序物态——理想非晶体
大皖新闻讯 2月18日,大皖新闻记者从中国科学技术大学获悉,该校童华教授、徐宁教授及其合作者在非晶物态理论研究中取得重要突破
2026-02-18 17:53:00
新岁启程,马蹄声疾。骉(biāo),《说文解字》解读为“众马也”。单从字形便觉气势如虹,三马叠加,并辔而行。从一马当先
2026-02-18 14:39:00
以“兴趣”为引,开启银龄健康生活新方式:简橙太极如何助力科学养生、乐享晚年
在当今社会,随着健康老龄化的理念日益深入人心,越来越多的中老年人开始积极追求丰富多彩的退休生活和身心和谐的健康状态。这一趋势催生了对优质
2026-02-18 12:53:00
【网络中国节·春节】AI机器人带来新春消费新体验 带旺厦门文旅市场
AI机器人带来新春消费新体验厦门通过AI赋能打造新业态新场景,带旺假期文旅消费市场市民游客观看机器人咖啡师制作咖啡。(夏商咖啡供图)厦门网讯(厦门日报记者 沈彦彦 王元晖)厦门中山路“两岸数智非遗年”现场
2026-02-18 09:55:00
全力保交付 海辰储能厦门基地春节期间维持满负荷生产
位于同翔高新城的海辰储能厦门基地春节期间——满负荷生产 全力保交付春节期间,海辰储能满负荷生产。(厦门日报记者 卢剑豪 摄)厦门网讯(厦门日报记者 林露虹)大年初一
2026-02-18 10:26:00
成功捕获到约6500光年外的宇宙线信号网通院参研的LACT首台望远镜完成“首光”河北新闻网讯(河北日报记者王璐丹)近日
2026-02-18 07:58:00