• 我的订阅
  • 科技

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

类别:科技 发布时间:2024-03-14 17:06:00 来源:中国网

近年来,国内AI大模型行业蓬勃发展,市场上AIGC产品如雨后春笋般涌现,产品功能、体验和玩法日趋丰富,同时用户对于AIGC产品的使用兴趣度不断提升,生成式AI普及范围持续扩大,截止2023年12月,生成式AI移动应用全网安装渗透率达6.7%,MAU已超2000万。为跟上技术迭代的步伐,月狐数据发布《2023 AIGC应用app智能化评测报告》,该报告为中国市场首份围绕AIGC应用app的智能化水平以及智能体能力的专业测评报告,旨在通过多维度量化指标帮助用户更直观地评估现有主流AIGC应用产品的能力。

在报告中,AIGC应用app智能化评估体系的主要评估对象为当前国内主流的拥有自主大模型的对话式AIGC移动应用产品,包括文心一言app、通义千问app、讯飞星火app、豆包app、天工app、360智脑app和智谱清言app。该评估体系由基础能力、使用体验、生成质量、智能体能力、安全合规5个一级指标以及23个二级指标构成,采用了500道封闭题和开放题,结合自动化测试和专家评分的形式对各大AIGC应用产品进行打分。

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

评估结果显示,文心一言app智能化综合指数位居第一,其次是讯飞星火app、豆包app。拆分二级指标来看,文心一言app在基础能力、安全合规、使用体验、生成质量、智能体能力各方面表现突出,除此之外,通义千问、智谱清言app在基础能力方面也相对领先,讯飞星火、天工app在安全合规方面也展现出较明显的优势。

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

“生成质量”和“智能体能力”这两个维度能够较明显地体现出各大AIGC产品的能力区隔。具体看生成质量方面,各家app在不同类型的内容生成上各有优势,其中文心一言app在逻辑推理、多轮行程规划、情感对话、角色扮演等多个场景下生成的内容质量更好,而通义千问app更擅长创意写作,在多轮行程规划场景上也有较好的表现,讯飞星火和360智脑app则在数学计算上表现突出,智谱清言app在专业知识问答、情商问答场景上获得最高分,豆包、360智脑app在专业知识问答上的表现也相对较强。

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

智能体能力则是月狐数据基于当下大模型技术的最新发展趋势所增设的评测维度。智能体是指以AI为核心构建的一个集合立体感知、全域协同、精准判断、持续进化等特征的智能系统,是各家大模型厂商目前着重布局的应用场景,基于智能体功能用户可以按照自己的需求打造出更具个性化的AIGC方案。2023年,随着各大厂商积极开发和迭代智能体功能,各应用智能体的能力在内容契合和个性化方面取得了质的提升;2024年初,AI智能体能力在“交互沉浸”和“角色还原”方面实现进一步创新,产生较多具有沉浸态和数字生命形态的智能体。因此,加入智能体能力评测指标,一方面能够更加全方位地测量AIGC应用产品的能力,除了大模型的底层能力之外,也能测量到大模型技术的应用场景落地能力,另一方面能够直观体现国产大模型的最新发展进程。

评测结果显示,文心一言app在智能体能力方面表现突出。在用户创建智能体功能方面,文心一言app支持用户通过上传图片或拍照的方式制作智能体形象,同时支持用户通过录制自己的音频的方式来创建智能体声音,还有丰富多元的性格标签供用户选择,支持用户创建出个性化程度更高的智能体。在智能体交互体验方面,文心一言app官方构建的智能体在形象、声音、语气等方面可以较高程度地复刻本体,有较完整的数字人形象,躯体动作和表情均可动态化,同时支持语音交互、电话聊天等,强大的内容生成能力也让智能体能够较大程度地输出契合设定(个性、功能、专业等)的内容。

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

例如2024春节期间,文心一言app推出了AI费翔智能体,智能体不仅以较完整、立体的形象展示,同时有动态的躯体动作和表情,支持语音和电话的形式进行聊天,智能体逼真的形象和声音、同步的表情,给用户带来高度沉浸的交互体验。

月狐数据发布中国市场首份《AIGC应用app智能化评测报告》

可以预见,在各大科技厂商的技术加持下,未来国内AIGC应用产品的落地能力和成熟度将会持续提升,不断适应更加复杂多样化的交互场景,加速向各行业、各应用场景中渗透,成为广大用户生活、工作、学习的全能助手。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-14 21:45:24

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)
2024-04-10 20:16:00
新华社联合北大发布AI大模型评测:安全可靠成重点,360智脑表现优异
近日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》(以下简称“报告”)显示,当前中国大模型产品进步显著,360智脑、智谱ChatGLM等表现抢眼。其中3
2023-08-14 11:35:00
“整活”保险业务,AI大模型哪家强?
...险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理
2023-10-10 17:56:00
2023移动网络质量“百城”专项评测:打造高质量的5G服务
...动网络质量“百城”专项评测活动11月7日正式开启,来自中国信息通信研究院泰尔系统实验室5支专业的网络质量评测团队奔赴全国百余个城市,对重点和热点区域开展移动网络测试。其实“移
2023-11-20 17:10:00
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
智东西7月24日报道,今日,中国人工智能产业发展联盟(AIIA)安全治理委员会举办了成果发布会。会上,中国信息通信研究院人工智能研究所安全与元宇宙部主任石霖,解读了成立半年来委员
2024-07-25 09:26:00
百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%
...。该模型金融专业能力和场景应用能力大幅领先GPT-4o,在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首
2024-12-24 09:16:00
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究院发起,从大模型的通用性、智能性、安全性等多个维度开展,涵盖语言、语音、视觉等多模态领域,旨在建立大模
2023-12-26 14:16:00
微短剧传播与应用评测体系“繁星指数”首期成果发布
...大学新闻与新媒体学院院长汪文斌发布“繁星指数”首期评测报告。汪文斌院长从“辨识度促动深印象”“融合度推高关注度”“消费转化需深化”三方面,介绍了繁星指数“微短剧+文旅”专项评
2024-09-25 14:24:00
IDC权威评测:文心快码位居国内代码生成产品评估第一
6月3日,国际数据公司(IDC)正式发布《IDC 中国市场代码生成产品评估,1H25》报告,报告针对市面上主流的 AI 编码工具进行评测,谷歌、微软、百度、阿里、字节、腾讯等数十
2025-06-04 15:12:00
更多关于科技的资讯:
“生物制药工艺与设备发展新趋势研讨会”于10月16日下午举行,麦济生物、艾捷博雅科技、碧博生物等企业的代表,就生物制药工艺优化与设备选型提供了新思路与新方法。责编:卢思宇、姚凯红
2025-10-27 10:19:00
河北日报讯(记者刘英、刘杰)近日,经省科技厅批准,由廊坊润泽科技发展有限公司牵头组建的省级创新联合体——河北省人工智能创新联合体成立
2025-10-27 08:07:00
厦门网讯 (厦门日报记者 薛尧) “品牌金饰每克突破1100元,自己买工具打首饰能省近一半!”近日,受国际金价持续震荡
2025-10-25 08:13:00
南报网讯(记者何洁)10月22日至24日,由《自然》系列期刊编辑部和南京大学及中国生物物理学会联合主办的首届“人工智能生物学”国际学术会议在南京举行
2025-10-25 08:53:00
近日,胜利石油工程公司管具技术服务中心井控装置试压泵保压阀成功实现部件自主化维修,彻底改变以往依赖外部采购的被动局面。这次突破
2025-10-25 09:27:00
春雪食品斩获IDC未来企业大奖
近日,第十届IDC中国CIO峰会在上海落幕。莱阳春雪食品集团以数字化重塑全产业链的硬核实践,荣获“IDC未来企业大奖-卓越奖”
2025-10-25 12:55:00
AI搜索流量占比突破45%的2025年,头部GEO服务商正以技术代差重塑市场格局,这份基于1200+企业实战数据的白皮书
2025-10-25 14:27:00
抗衰冻龄选对成分是关键!2025全球五大麦角硫因品牌深度测评&选购指南
衰老的本质是细胞层面的多维损伤叠加 —— 自由基氧化、线粒体功能衰退、DNA 修复能力下降等机制相互交织,单一成分干预早已无法满足科学抗衰需求
2025-10-25 14:29:00
深耕眼科近30载,菏泽摘镜“标杆”王丽霞院长解说全飞秒4.0
通讯员 任兆潘在菏泽近视矫正领域,王丽霞院长的名字早已成为 “专业” 与 “放心” 的代名词。作为菏泽华厦眼科医院业务副院长
2025-10-25 14:39:00
“赞上合、聚天马,展风采,新体验”,2025天津马拉松将于10月26日鸣枪起跑。10月26日6:55至10:25,天津海河传媒中心《奔跑吧
2025-10-25 15:26:00
星光不负,码向未来 ———选择鸿蒙的800万种可能
摘要:每一位开发者都在用自己的方式点亮属于自己那颗星在这个追求效率的时代,技术的温度,正藏身于那些被巧妙化解的日常困境里
2025-10-25 15:44:00
同程旅行完成收购万达酒管,专业商旅平台成就“更高端”的出行体验
近日,同程旅行宣布完成对万达酒店管理公司的战略收购。这次收购远不止于简单的资源叠加,而是OTA乃至商旅服务生态的一次战略性升级
2025-10-25 15:45:00
可信数据空间新产品新服务新生态发布会在杭州中国数谷举行
2025年10月22日,“可信数据空间新产品·新服务·新生态发布会”在杭州中国数谷会议中心隆重举行。大会由北京燕元数联网络科技有限公司
2025-10-25 15:47:00
10月24日,我省首个脑机接口临床研究中心在山医大一院成立。山西医科大学将与清华海峡研究院协同创新中心在脑机接口这一前沿项目方面展开深入合作
2025-10-25 19:08:00
据第三方权威数据显示,2025年头部与尾部GEO服务商的效果差距已达430%,而企业更换服务商的平均成本高达首年投入的150%
2025-10-25 21:10:00