• 我的订阅
  • 科技

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

类别:科技 发布时间:2024-09-23 09:53:00 来源:量子位

两个AI现场攻防,翻车了人类就在旁边“蛐蛐”。

现在的AI比赛真是越来越因吹斯汀了。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

这不,一个拿着“花开富贵”大姨人设的Agent直接甩了个链接,对面的AI客服就开始大段大段冗长回复,几个回合都是如此。

围观人类一点儿都不留情面,马上锐评:

我都看不下去这么长的回复,不擅长网购的“阿姨”能有这样的耐心?可能看不到一半就走了。

遇到妙语连珠的,人类也纷纷爆灯。

还是这个“阿姨”人设的Agent,她打了个错别字,问AI“九空”是什么意思。

对方AI客服立马发现它想说的其实是“九腔”,还给出了正确的解释。

在云栖大会现场,我们围观了这样一场精彩有趣的AI比赛。

比赛规则是让8家企业在一周内构建智能客服,不仅要现场展示效果和技术方案,还要接受各种人设Agent的情景考验。都是难以应对的那种,要么是不会网购且爱打错别字的阿姨,要么是正在气头上的都市丽人。

结果就上演了刚刚那精彩一幕。

更有意思的是,还有选手找公司财务搞定了这一项目。

要知道,他的对手都是业内颇有来头的企业,不乏已经上市的那种。

所以,这到底是个啥比赛啊?

1周搞定“说人话”AI客服

如上提到的比赛,是业界首个企业级AI应用开发挑战赛:百炼杯“智能好客服”PK赛。

为啥能称得上企业级?

不仅参赛选手都是企业,而且比赛重要的参考维度是能否实际落地。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

比赛为选手提供百炼开发平台,可使用通义千问系列模型作为底层模型,平台提供Prompt优化工具、RAG、Agent构建等能力,支持低代码、高代码等不同需求开发。

对参赛作品的要求很简洁,就是打造一个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法,并且有情商、说人话、能面对各种复杂情景。

而且上手门槛很低。

比如参赛选手云蝠智能,他们的主打业务是电话客服,在文本客服方面的积累不多。这次参赛,他们压根没让工程师参与,而是找公司财务完成了整个业务流程的交付。

从Qwen Max的学习引擎到数据规范、再到提示词调优,我就手把手教了他20分钟。

之所以这样做,是因为云蝠智能认为智能客服产品的最终用户很多都是小型或中小型企业,他们对于无代码、低代码开发的需求很高。他们这么做也是进一步验证,如今的大模型平台已经可以提供零门槛的智能客服构建流程。

另一位参赛选手合力亿捷也提到,职场新人通过1-2天的学习,就能在百炼平台上自己开发Agent。

比如打造一个电商客服,具体技术方案如下:

用户输入问题后,通义千问会先进行意图理解和分类,然后系统将提取关键数据并调用API,再利用RAG技术进行知识检索,最后把经过封装的Prompt提交给通义千问大模型,最后生成答案给客户。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

根据比赛数据的多场景特性,拆解了应答服务流程。按照场景特征将意图与知识细分为8大类和若干小类。

合力亿捷介绍,开发过程中也遇到了一些问题。一开始完全依赖百炼平台的输出能力进行意图分类,但是在上下文意图不连贯的时候,就会出现分类和输出不稳定的情况。为此选手对提示词进行优化,强调关键特征和要求。

经过三次迭代后,回复准确率从最初的80%提升到了96%。

要知道,这解决了目前智能客服行业面临的很多挑战。

智能客服作为一个普及度非常高的AI应用,大众满意度却不尽如人意。大家都调侃,AI客服的作用就是为了“转人工”。

这一方面是因为传统AI客服的底层技术不够先进,导致回复比较机械化,不能满足人类真正的服务需求,也缺乏情感价值。

参赛选手亚信科技解释,用户对于智能客服的期待是“像真人交谈一样自然”。这背后需要智能客服可以理解用户意图、懂得结合上下文语境、提供个性化的建议。

随着大模型趋势到来,底层技术瓶颈得到进一步改善。

但是企业用上大模型开发智能客服,还存在诸多门槛。

合力亿捷提到,通用模型需要进一步微调才能满足个性化需求。但实际情况中,往往是懂开发的人不懂业务,懂业务的人不懂开发。

而且本身智能客服给大模型提出的要求也很高。需要精准理解用户意图、强大的上下文能力、可以调用工具等。模型生成的内容也要与时俱进,数据库更新不及时也会导致理解和识别准确率降低。

这意味着企业自己做模型开发的门槛和成本都很高。加之智能客服领域本身竞争激烈、收益比较低,企业面临的智能化升级压力很大。

不过随着大模型开发平台不断升级完善,云厂商们为企业们提供了更便捷的工具。

这次PK赛中,选手们就是完全利用百炼平台进行开发。

其中一些功能都给选手留下了深刻印象。比如亚信科技和合力亿捷都提到了工作流应用。它无需通过构建智能体实现工作流,能让应用调试、修改Prompt等都变得更方便,而且执行效率稳定,性能可靠。

本次比赛的主题智能客服,只是百炼平台典型应用场景之一。

阿里云披露,今年5-7月,百炼服务客户数量快速从9万增长至23万,涨幅超150%。

AI应用开发,拖拉拽即可

去年10月,阿里云发布了百炼大模型平台,主要功能就是让开发者通过简单的拖拉拽,在5分钟开发一款大模型应用,几小时炼出一个专属模型。

今年5月,百炼升级为2.0版本,成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。

它可分为计算层、模型层和应用层。

底层计算依托于强大阿里云基础设施。

刚刚结束的云栖大会上,阿里云CTO周靖人宣布,阿里云全面投入升级AI大基建,AI驱动的全系产品家族完成升级。包括磐久AI服务器、HPN7.0高性能网络架构等,都为AI训练、推理、部署和应用更高效而来。

模型层提供通义系列、行业大模型以及丰富第三方模型(如Llama、百川等)。

支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。

最新进展中,通义方面发布了最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型。

应用层方面,百炼提供开放的Agent构建框架,支持灵活的应用编排能力。构建了丰富的模型应用生态,比如智能座舱、智能客服、智能零售、AI数字人等。

主要支持的开发范式有三种:

提示词优化:提示词扩写、案例优化、反馈优化。 检索增强生成(RAG):企业级知识管理、灵活优化各组件效果。 模型微调:多模态模型微调、多类型微调方式。

并且提供多款开箱即用的AI原生应用。

比如智能客服大模型应用晓蜜、多模态内容创作工具全妙、AI原生智能数据分析产品析言GBI等。

而且基于阿里云深厚的云计算基础,百炼可以提供更加高效、稳定、极具性价比的大模型服务。

没有AI的应用没有竞争力

最后,回到这场PK赛本身,为啥阿里云想要办一场智能客服挑战赛?

其实,早在大模型掀起技术风暴之前,AI客服就是NLP相关研究的应用重点:

一方面,客服是信息时代每个企业、每个人都会接触到、有需求的场景。另一方面,这种大量、高重复度场景,恰恰是AI技术能最快见效的应用领域。

而当大模型完全改变了人机交互的模式和对话生成的质量,AI客服也自然而然迎来质变时刻,成为大模型应用落地最好的试验田之一。

IDC报告《中国智能客服市场份额, 2023 :新旧交替,增长可期》中显示,2023年智能客服解决方案整体市场规模达到了30.8亿人民币,较2022年增长了近36.9%,足见其发展潜力。

但在“骇客松”这种以赛代练文化盛行的科技领域,阿里云百炼杯之前,却未见真正定位“企业级”、强调“落地可用”的AI应用开发挑战赛。

其中挑战亦不难理解:

要拉来这么多具有代表性的企业过过手见见技术真章,主办方本身需要具备行业号召力,并且能够提供客观、可靠的基础平台。

阿里云作为国内云厂商中的头把交椅,本身过硬的云计算基础能力和行业影响力自不必说。

现在,依托百炼平台,阿里云进一步提供了大模型企业级应用开发的一站式服务能力:以模型为中心,依据大模型真实业务落地需要,提供模型、应用、数据、运营四大核心工具链,帮助企业实现“小步快跑的业务验证”和“规模业务的迭代优化”。

从本次挑战赛中也可以看出,大量难以处理的情绪化、复杂上下文、逻辑推导、业务引导、体系计算等问题,企业都能通过结合模型和百炼平台的能力解决。

对于参赛企业而言,参与这样的比赛,能积累大模型应用的落地经验,验证自身对于业务场景与大模型结合的理解。

而对于阿里云来说,在为参赛企业提供支持的同时,也进一步加深了对实际业务场景的了解,为通过技术发展驱动大模型应用落地积攒实践经历。

AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种

事实上,从“智能客服”一隅,亦可再次窥见大模型时代各行各业面临的一个新机遇和新挑战:

随着技术变革程度的不断加深,在未来,没有AI的应用就没有竞争力。

而这一课题所涉及的,不仅是应用层面的创意和技术创新,更是基础设施的迭代升级。

云时代里走在前列的阿里云,这一次又踏在了潮头。

— 完 —

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-23 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阿里云百炼MCP服务上线:高德、无影等首批接入
...步拓宽智能体的应用边界,推动大模型技术在千行百业的落地应用。这一创新服务标志着大模型技术正从实验室走向产业化应用的新阶段。【本文结束】如需转载请务必注明出处:快科技责任编辑:
2025-04-09 17:46:00
当七大姑八大姨都开始聊AI ……|36氪2025 AI Partner大会来了!
...常。今年春节,播放着春晚的电视被搁在一边,七大姑八大姨们一边在“相亲相爱一家人”群里转发着DeepSeek爆火的新闻,一边劝家里的小辈多学点实实在在的手艺,以免未来被AI取代
2025-03-11 05:58:00
中国科学院地化所发布国际首个月球专业大模型,基于通义大模型及阿里云百炼专属版打造
...挖掘新的科学发现。据介绍,目前月球专业大模型的最佳落地场景是月球撞击坑识别。人类对月球地质演化的研究除了探测返回的样品,主要依靠撞击坑识别等月球地质对象的研究。撞击坑的大小、
2024-08-29 15:42:00
盈米基金与阿里云达成AI全栈战略合作
...看,AI必将改变财富管理的业态和生态。从初期的AI工具落地应用,到逐步实现AI与人类专家、系统服务的协同运作,实现数据、策略与投顾方法的自动化调度与客户长期的个性化陪伴。阿里
2025-07-22 21:12:00
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...模式,帮助企业和开发者快速实现复杂场景Agent的开发和落地。在模型层面,阿里云百炼持续上线全新通义千问家族旗舰模型,基于Qwen3系列模型强大的推理能力,可驱动Agent实
2025-09-24 13:30:00
李彦宏直言开源模型是智商税!阿里云CTO:开源大大加速应用落地
...发者也能使用顶尖的AI模型,这将显著加速大模型的应用落地进程。他举例说明,通义千问开源模型的下载量在两个月内增长了两倍
2024-07-07 09:37:00
...距。王小川表示,国内大模型的现状是“理想上慢一步,落地上快三步”。虽然在技术创新和技术理想上美国有所领先,但是中国的应用落地能力更强,团队、经验等优势促进大模型“小步快跑”。
2023-11-01 09:48:00
保持克制、充满激情 哈啰2024云栖大会展示AI整体布局及大模型案例
...案例,吸引了众多参观者的目光。据悉,通过创新研发并落地海螺机器人、交易机器人、光子引擎、贾维斯幻视大模型平台等大模型实践应用,哈啰集团已构建AI整体布局。同时,哈啰集团联合阿
2024-09-20 14:13:00
“百炼智电”重磅发布,赋能电力现货市场交易及决策
...各个环节。为了帮助发售电企业加速电力交易转型,百炼智能基于先进的AI及数据分析技术、系统开发能力,自主研发“百炼智电”产品,为发售电企业建设一站式电力现货市场交易及决策平台,
2023-12-27 14:30:00
更多关于科技的资讯:
用AI技术为青少年心理“把脉”!这一项目成功入围2026年度河南省科技攻关项目
大河网讯 近日,河南省科学技术厅公示 2026年度河南省科技攻关拟立项项目,由科创联达(河南)科技有限公司与中原工学院联合申报的“多模态融合与大语言模型驱动的青少年心理健康智能监测研究”项目入选
2026-01-20 22:45:00
张宣科技:科技驱动打造绿色低碳新能源标杆
图为张宣科技技术骨干正在对水系统设备进行全面巡视检查。于飞摄河北新闻网讯(王杨、马薇)打造全球领先的绿氢绿能耦合冶金示范
2026-01-20 17:17:00
聚焦临沂两会」临沂市政协委员许金龙:以科技创新引领标志性产业链高质量发展
鲁网1月20日讯“抢抓人工智能战略风口,以科技创新为核心引擎赋能产业升级,推动我市标志性产业链向高端化、智能化、绿色化方向提质进阶
2026-01-20 17:23:00
中国消费者报北京讯(记者裴莹)1月19日,荣耀与泡泡玛特合作推出的“荣耀500 Pro MOLLY 20周年限定版”手机正式发布
2026-01-20 17:30:00
中国消费者报北京讯(记者孙蔚)近日,转转集团发布《2025二手消费年度洞察》(以下简称报告)。报告显示,05后成为二手消费新生力量
2026-01-20 17:30:00
中国消费者报北京讯(记者桑雪骐)1月19日,海信召开2026 RGB-Mini LED影游旗舰E8S新品发布会,正式推出影游旗舰E8S系列电视
2026-01-20 17:30:00
春节将至 在中国空间站怎么吃年夜饭?
中国消费者报报道(记者桑雪骐)航天员的手指轻轻按下一个特制设备的启动键,28分钟后,伴随着设备上的按键灯闪烁,取出的不是常见的复热食品袋
2026-01-20 18:00:00
大皖新闻讯 1月20日,记者从阜阳市商业局获悉,为全力推动“超级皖”美食争霸赛半决赛活动氛围,该市将发放60万元消费券
2026-01-20 18:14:00
宜兴市徐舍镇:厚植沃土育“小巨人”
近年来,徐舍镇持续优化营商环境,强化政策引导与服务保障,积极构建富有活力的产业生态,通过搭建产学研对接桥梁,推动技术、人才
2026-01-20 18:52:00
空降社渚!KFC&必胜客“双子星”来了,常州首家
社渚喜讯!常州首对餐饮“双子星”——肯德基与必胜客,即将同步落户社渚!二月初,开业倒计时正式启动,快乐进入双倍时代。从此小镇生活添了新滋味
2026-01-20 18:54:00
中新经纬1月20日电 19日,小红书正式上线《社区公约2.0》,在延续“真诚分享,友好互动”社区价值观的基础上,明确提出“反对制造对立”的倡导
2026-01-20 19:14:00
打造复合生活空间,应对多元业态挑战!石家庄本土超市加速向体验化、社区化转型
1月16日上午9时,刚刚开业的石家庄北国超市青园店客流如织。经历了永辉闭店、北国接手后,经过30天左右的装修筹备,该店如今以全新面貌亮相
2026-01-20 19:39:00
从技术突破到产业落地:见证国器传感的量子征程
在工业4.0浪潮席卷全球的今天,传感器作为智能制造的核心元件,其技术突破与产业升级已成为衡量国家工业竞争力的重要标尺。这场没有硝烟的科技博弈中
2026-01-20 19:53:00
第17期监制:杨春红制作:王金顺记者:牛思家
2026-01-20 16:59:00