• 我的订阅
  • 科技

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

类别:科技 发布时间:2024-09-23 09:53:00 来源:量子位

两个AI现场攻防,翻车了人类就在旁边“蛐蛐”。

现在的AI比赛真是越来越因吹斯汀了。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

这不,一个拿着“花开富贵”大姨人设的Agent直接甩了个链接,对面的AI客服就开始大段大段冗长回复,几个回合都是如此。

围观人类一点儿都不留情面,马上锐评:

我都看不下去这么长的回复,不擅长网购的“阿姨”能有这样的耐心?可能看不到一半就走了。

遇到妙语连珠的,人类也纷纷爆灯。

还是这个“阿姨”人设的Agent,她打了个错别字,问AI“九空”是什么意思。

对方AI客服立马发现它想说的其实是“九腔”,还给出了正确的解释。

在云栖大会现场,我们围观了这样一场精彩有趣的AI比赛。

比赛规则是让8家企业在一周内构建智能客服,不仅要现场展示效果和技术方案,还要接受各种人设Agent的情景考验。都是难以应对的那种,要么是不会网购且爱打错别字的阿姨,要么是正在气头上的都市丽人。

结果就上演了刚刚那精彩一幕。

更有意思的是,还有选手找公司财务搞定了这一项目。

要知道,他的对手都是业内颇有来头的企业,不乏已经上市的那种。

所以,这到底是个啥比赛啊?

1周搞定“说人话”AI客服

如上提到的比赛,是业界首个企业级AI应用开发挑战赛:百炼杯“智能好客服”PK赛。

为啥能称得上企业级?

不仅参赛选手都是企业,而且比赛重要的参考维度是能否实际落地。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

比赛为选手提供百炼开发平台,可使用通义千问系列模型作为底层模型,平台提供Prompt优化工具、RAG、Agent构建等能力,支持低代码、高代码等不同需求开发。

对参赛作品的要求很简洁,就是打造一个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法,并且有情商、说人话、能面对各种复杂情景。

而且上手门槛很低。

比如参赛选手云蝠智能,他们的主打业务是电话客服,在文本客服方面的积累不多。这次参赛,他们压根没让工程师参与,而是找公司财务完成了整个业务流程的交付。

从Qwen Max的学习引擎到数据规范、再到提示词调优,我就手把手教了他20分钟。

之所以这样做,是因为云蝠智能认为智能客服产品的最终用户很多都是小型或中小型企业,他们对于无代码、低代码开发的需求很高。他们这么做也是进一步验证,如今的大模型平台已经可以提供零门槛的智能客服构建流程。

另一位参赛选手合力亿捷也提到,职场新人通过1-2天的学习,就能在百炼平台上自己开发Agent。

比如打造一个电商客服,具体技术方案如下:

用户输入问题后,通义千问会先进行意图理解和分类,然后系统将提取关键数据并调用API,再利用RAG技术进行知识检索,最后把经过封装的Prompt提交给通义千问大模型,最后生成答案给客户。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

根据比赛数据的多场景特性,拆解了应答服务流程。按照场景特征将意图与知识细分为8大类和若干小类。

合力亿捷介绍,开发过程中也遇到了一些问题。一开始完全依赖百炼平台的输出能力进行意图分类,但是在上下文意图不连贯的时候,就会出现分类和输出不稳定的情况。为此选手对提示词进行优化,强调关键特征和要求。

经过三次迭代后,回复准确率从最初的80%提升到了96%。

要知道,这解决了目前智能客服行业面临的很多挑战。

智能客服作为一个普及度非常高的AI应用,大众满意度却不尽如人意。大家都调侃,AI客服的作用就是为了“转人工”。

这一方面是因为传统AI客服的底层技术不够先进,导致回复比较机械化,不能满足人类真正的服务需求,也缺乏情感价值。

参赛选手亚信科技解释,用户对于智能客服的期待是“像真人交谈一样自然”。这背后需要智能客服可以理解用户意图、懂得结合上下文语境、提供个性化的建议。

随着大模型趋势到来,底层技术瓶颈得到进一步改善。

但是企业用上大模型开发智能客服,还存在诸多门槛。

合力亿捷提到,通用模型需要进一步微调才能满足个性化需求。但实际情况中,往往是懂开发的人不懂业务,懂业务的人不懂开发。

而且本身智能客服给大模型提出的要求也很高。需要精准理解用户意图、强大的上下文能力、可以调用工具等。模型生成的内容也要与时俱进,数据库更新不及时也会导致理解和识别准确率降低。

这意味着企业自己做模型开发的门槛和成本都很高。加之智能客服领域本身竞争激烈、收益比较低,企业面临的智能化升级压力很大。

不过随着大模型开发平台不断升级完善,云厂商们为企业们提供了更便捷的工具。

这次PK赛中,选手们就是完全利用百炼平台进行开发。

其中一些功能都给选手留下了深刻印象。比如亚信科技和合力亿捷都提到了工作流应用。它无需通过构建智能体实现工作流,能让应用调试、修改Prompt等都变得更方便,而且执行效率稳定,性能可靠。

本次比赛的主题智能客服,只是百炼平台典型应用场景之一。

阿里云披露,今年5-7月,百炼服务客户数量快速从9万增长至23万,涨幅超150%。

AI应用开发,拖拉拽即可

去年10月,阿里云发布了百炼大模型平台,主要功能就是让开发者通过简单的拖拉拽,在5分钟开发一款大模型应用,几小时炼出一个专属模型。

今年5月,百炼升级为2.0版本,成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。

它可分为计算层、模型层和应用层。

底层计算依托于强大阿里云基础设施。

刚刚结束的云栖大会上,阿里云CTO周靖人宣布,阿里云全面投入升级AI大基建,AI驱动的全系产品家族完成升级。包括磐久AI服务器、HPN7.0高性能网络架构等,都为AI训练、推理、部署和应用更高效而来。

模型层提供通义系列、行业大模型以及丰富第三方模型(如Llama、百川等)。

支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。

最新进展中,通义方面发布了最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。

应用层方面,百炼提供开放的Agent构建框架,支持灵活的应用编排能力。构建了丰富的模型应用生态,比如智能座舱、智能客服、智能零售、AI数字人等。

主要支持的开发范式有三种:

提示词优化:提示词扩写、案例优化、反馈优化。 检索增强生成(RAG):企业级知识管理、灵活优化各组件效果。 模型微调:多模态模型微调、多类型微调方式。

并且提供多款开箱即用的AI原生应用。

比如智能客服大模型应用晓蜜、多模态内容创作工具全妙、AI原生智能数据分析产品析言GBI等。

而且基于阿里云深厚的云计算基础,百炼可以提供更加高效、稳定、极具性价比的大模型服务。

没有AI的应用没有竞争力

最后,回到这场PK赛本身,为啥阿里云想要办一场智能客服挑战赛?

其实,早在大模型掀起技术风暴之前,AI客服就是NLP相关研究的应用重点:

一方面,客服是信息时代每个企业、每个人都会接触到、有需求的场景。另一方面,这种大量、高重复度场景,恰恰是AI技术能最快见效的应用领域。

而当大模型完全改变了人机交互的模式和对话生成的质量,AI客服也自然而然迎来质变时刻,成为大模型应用落地最好的试验田之一。

IDC报告《中国智能客服市场份额, 2023 :新旧交替,增长可期》中显示,2023年智能客服解决方案整体市场规模达到了30.8亿人民币,较2022年增长了近36.9%,足见其发展潜力。

但在“骇客松”这种以赛代练文化盛行的科技领域,阿里云百炼杯之前,却未见真正定位“企业级”、强调“落地可用”的AI应用开发挑战赛。

其中挑战亦不难理解:

要拉来这么多具有代表性的企业过过手见见技术真章,主办方本身需要具备行业号召力,并且能够提供客观、可靠的基础平台。

阿里云作为国内云厂商中的头把交椅,本身过硬的云计算基础能力和行业影响力自不必说。

现在,依托百炼平台,阿里云进一步提供了大模型企业级应用开发的一站式服务能力:以模型为中心,依据大模型真实业务落地需要,提供模型、应用、数据、运营四大核心工具链,帮助企业实现“小步快跑的业务验证”和“规模业务的迭代优化”。

从本次挑战赛中也可以看出,大量难以处理的情绪化、复杂上下文、逻辑推导、业务引导、体系计算等问题,企业都能通过结合模型和百炼平台的能力解决。

对于参赛企业而言,参与这样的比赛,能积累大模型应用的落地经验,验证自身对于业务场景与大模型结合的理解。

而对于阿里云来说,在为参赛企业提供支持的同时,也进一步加深了对实际业务场景的了解,为通过技术发展驱动大模型应用落地积攒实践经历。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

事实上,从“智能客服”一隅,亦可再次窥见大模型时代各行各业面临的一个新机遇和新挑战:

随着技术变革程度的不断加深,在未来,没有AI的应用就没有竞争力。

而这一课题所涉及的,不仅是应用层面的创意和技术创新,更是基础设施的迭代升级。

云时代里走在前列的阿里云,这一次又踏在了潮头。

— 完 —

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-23 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云百炼MCP服务上线:高德、无影等首批接入
...步拓宽智能体的应用边界,推动大模型技术在千行百业的落地应用。这一创新服务标志着大模型技术正从实验室走向产业化应用的新阶段。【本文结束】如需转载请务必注明出处:快科技责任编辑:
2025-04-09 17:46:00
当七大姑八大姨都开始聊AI ……|36氪2025 AI Partner大会来了!
...常。今年春节,播放着春晚的电视被搁在一边,七大姑八大姨们一边在“相亲相爱一家人”群里转发着DeepSeek爆火的新闻,一边劝家里的小辈多学点实实在在的手艺,以免未来被AI取代
2025-03-11 05:58:00
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...挖掘新的科学发现。据介绍,目前月球专业大模型的最佳落地场景是月球撞击坑识别。人类对月球地质演化的研究除了探测返回的样品,主要依靠撞击坑识别等月球地质对象的研究。撞击坑的大小、
2024-08-29 15:42:00
盈米基金与阿里云达成AI全栈战略合作
...看,AI必将改变财富管理的业态和生态。从初期的AI工具落地应用,到逐步实现AI与人类专家、系统服务的协同运作,实现数据、策略与投顾方法的自动化调度与客户长期的个性化陪伴。阿里
2025-07-22 21:12:00
李彦宏直言开源模型是智商税!阿里云CTO:开源大大加速应用落地
...发者也能使用顶尖的AI模型,这将显著加速大模型的应用落地进程。他举例说明,通义千问开源模型的下载量在两个月内增长了两倍
2024-07-07 09:37:00
...距。王小川表示,国内大模型的现状是“理想上慢一步,落地上快三步”。虽然在技术创新和技术理想上美国有所领先,但是中国的应用落地能力更强,团队、经验等优势促进大模型“小步快跑”。
2023-11-01 09:48:00
保持克制、充满激情 哈啰2024云栖大会展示AI整体布局及大模型案例
...案例,吸引了众多参观者的目光。据悉,通过创新研发并落地海螺机器人、交易机器人、光子引擎、贾维斯幻视大模型平台等大模型实践应用,哈啰集团已构建AI整体布局。同时,哈啰集团联合阿
2024-09-20 14:13:00
“百炼智电”重磅发布,赋能电力现货市场交易及决策
...各个环节。为了帮助发售电企业加速电力交易转型,百炼智能基于先进的AI及数据分析技术、系统开发能力,自主研发“百炼智电”产品,为发售电企业建设一站式电力现货市场交易及决策平台,
2023-12-27 14:30:00
李开复辟谣阿里收购:谣言散播的快 撤的也快
...将优异的大模型能力带入真实行业场景,加速产业大模型落地及应用生态扩大,助力各行各业大模型落地。公开资料显示,零一万物是李开复带队孵化的AI2.0公司,创办于2023年7月,专
2025-01-07 11:17:00
更多关于科技的资讯:
理想汽车回应理想i8与乘龙卡车安全性碰撞测试
8月3日晚间,理想汽车官方微博发布《关于理想i8安全性碰撞测试的说明》,全文如下:理想i8碰撞安全性测试视频发布后,引起了社会各界的关注与讨论
2025-08-04 10:36:00
年轻人的保险指南:用奶茶钱在度小满撬动百万保障
当“每天一杯奶茶,一年喝掉一台iPhone”成为社交平台热议话题时,其背后揭示的日常小额消费积累现象,正被敏锐地应用于保险保障领域
2025-08-04 10:59:00
书亦烧仙草荣登2024年商业特许经营TOP300榜单,位列第36位
近日,中国连锁经营协会发布2024年商业特许经营TOP300企业榜单,书亦烧仙草凭借高度标准化的连锁经营模式、成熟的加盟支持体系以及持续优化的加盟生态荣耀登榜
2025-08-04 10:59:00
当AI的浪潮席卷全球,许多人认为这只是科技巨头们的游戏。然而,在中国经济的毛细血管里——覆盖千行百业的数千万小微企业,一场由AI驱动的静默转型正悄然发生
2025-08-04 10:59:00
玉湖冷链赋能冻二代:黄少炳的蜕变与创新创业记
2024年4月,揣着父亲那句“去试试”的提议,98年“冻二代”黄少炳只身来到玉湖冷链广州园区。谁曾想,短短一年半时间,这个年轻人便在广州冻品圈拥有了一席之地
2025-08-04 10:59:00
近日,浙江省首单数据资产融资租赁业务项目在杭州落地,浙江浔象数字产业发展有限公司依托“设备设施+数据资产”的创新组合成功获得融资
2025-08-04 08:20:00
新华社杭州8月3日电 大模型、人形机器人、智能计算等领域科技频频突破,以杭州“六小龙”为代表的人工智能科创企业拔地而起……今年以来
2025-08-04 07:19:00
7年前的iPhone,凭什么被炒成千元神机
跳票N年的苹果首款折叠屏iPhone,终于又有了点眉目。近日,继折叠屏iPhone“将于2025年三季度末或四季度初投产”的传言后
2025-08-03 17:09:00
生产未动、订单先行!仰华汽车科技四大产业基地即将落地贵州
8月1日,仰华汽车科技在贵阳经开区举行发布会,会上与香港投资机构完成投资交接、与海外企业签下首批国际订单,意味着总投资超三十亿的汽车项目离落地贵阳更近了一步
2025-08-03 18:02:00
闪铸科技AD5M连续12月蝉联亚马逊销冠,中国3D打印品牌闪耀全球
在竞争激烈的全球3D打印市场中,中国品牌闪铸科技(Flashforge)凭借强劲的研发实力与持续创新力,再次刷新国际成绩单
2025-08-03 18:33:00
准大学生成为十堰数码市场消费主力军
十堰广电讯(全媒体记者 魏俊 何旭)高考结束后,相关消费持续升温,准大学生拉动“后高考经济”,带动手机、电脑等入学装备销量激增
2025-08-03 19:01:00
网易云音乐独家打造BLACKPINK快闪空间 出道九周年庆典同步开启
2025年8月2日,全球顶级艺人BLACKPINK官宣入驻网易云音乐,并通过独家中文笔记向平台乐迷分享了最新动态。YG娱乐联合CASTER STAR
2025-08-03 15:23:00
物业公司打起来了,一边撤场一边“抢地盘”
现在围绕物业问题产生的冲突越来越多。物业公司一边主动从一些小区“撤场”,引发行业对规模化增长和利润的担心,一边又发力在存量小区“拓盘”
2025-08-03 08:47:00
中国品牌出海,如何在不确定中锚定“确定”?2025出海大会嘉宾超级金句来了!
2025年7月25日, 2025出海大会在浙江钱塘成功举办。本届大会以「以“匠心”至“世界”」为主题,特设主会场及分会场“投资金砖”-国别合作对接会
2025-08-03 08:49:00
录取比例超过20比1,全球学霸为何千里迢迢来西湖“追星”?
这个暑假,西湖大学的校园里掀起一股特殊的“追星潮”——数百名来自全球多个国家和地区的青年学子,跨越山海奔赴杭州,只为近距离接触生命科学
2025-08-03 08:47:00