• 我的订阅
  • 财经

体验感受哪家强?《人工智能大模型体验报告2.0》发布

类别:财经 发布时间:2023-08-12 18:18:00 来源:经济参考报

近来,人工智能大模型风云起涌,不少科技企业加快拓宽应用生态。主流大模型的实际使用感受如何?各大科技企业有何优劣势?8月12日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》(以下简称报告)显示,讯飞星火、百度文心一言、商汤商量和智谱AI-ChatGLM均表现抢眼,AI大模型的发展为人类工作和生活的提质增效均带来了正向积极的影响。

今年以来,国内科技企业纷纷布局人工智能大模型。据不完全统计,在新一轮生成式AI热潮中,国内已经出现了上百个大模型。天眼查数据显示,截至2023年上半年,与“大模型”直接相关的融资事件超20起。

为进一步直观感受我国当前主流科技企业所推出的大模型产品的现状、优势和特点,新华社研究院中国企业发展研究中心于今年7月启动了本次报告研究。与2023年6月首次发布的《人工智能大模型体验报告》相比,本次测评在题目设计、对标Benchmark(人类)、打分权重、专家测评团队四大维度进行了全面升级。

其中,在题目设计方面,测评题目由300道扩展至500道,并进一步完善了题目分类;在对标Benchmark方面,本次测评将接受过高等教育的人类作为对照,来考评大模型真实能力;在打分标准上,本次测评根据对产业、生活的实际价值,对基础能力、智商能力、情商能力和工具提效四大测评维度进行了权重设计;在测评团队方面,本次测评特邀北京大学文化与传播研究所及其他产界、学界专家全程参与。

本次研究设置了用户体验项目,抓取了7月31日—8月4日数据,通过人机互动提问等形式,对国内主流大模型进行使用体验评测,旨在为科技企业调整努力方向提供参考。

报告显示,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。具体来看,讯飞星火在工作提效方面优势明显,百度文心一言基础能力仍处领军水准,商汤商量则在情商方面表现优秀,智谱AI-ChatGLM整体表现优秀。

针对各维度能力测评,该报告还给出了相应的案例展示和分析。

在基础能力方面,人类与AI之间的差距并不显著。课题组分别从语言能力(35%)、AI向善(10%)、跨模态(20%)和多轮对话(35%)四大指标进行测评。测评显示,科技企业大模型中,百度文心一言表现最为抢眼,商汤商量、智谱AI-ChatGLM、360智脑表现优良。

在智商评估方面,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对科技企业大模型进行考量。结果显示,讯飞星火、智谱AI-ChatGLM表现突出,百度文心一言、昆仑万维天工表现优良。

在情商方面,AI与人类之间的差距最为明显。人类在情绪理解和处理方面通常具有更强的优势,和更灵活的处理能力。通过对处理日常事项(35%)、一语双关(30%)、人际关系(35%)问题进行分析发现,科技企业大模型中,商汤商量表现亮眼,百度文心一言、澜舟科技Mchat、智谱AI-ChatGLM及360智脑均表现优良。

在工作效率提升方面,课题组重点在工具提效(50%)和生成创新(50%)方面进行考量。结果显示,讯飞星火表现最为抢眼,百度文心一言、商汤商量、智谱AI-ChatGLM表现优良。不过,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。

报告认为,虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。在本次体验测评基础上,研究团队将继续深耕,加强在大模型安全可解释性、工作提效能力、实际落地情况、产业优秀案例等维度上的探索与研究。

扫描二维码查看《人工智能大模型体验报告2.0》全文

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-12 21:45:21

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“Sora”王炸,20篇研报带你走进人工智能(下载)
...于青萍之末,浪成于微澜之间。由ChatGPT所带来的新一轮人工智能热潮还在席卷全球,OpenAI又在近日发布了首款文生视频模型“Sora”。人工智能的广泛应用将给人类未来的生
2024-02-18 09:22:00
赋能千行百业  便利千家万户(大数据观察)
本文转自:人民日报生成式人工智能产品快速普及应用赋能千行百业  便利千家万户(大数据观察)本报记者  金  歆《人民日报》(2025年02月06日第 07 版)数据来源:中国互联
2025-02-06 06:11:00
《2023人工智能赋能网络视听产业观察报告》在青发布
...新技术浪潮下的智能视听步入深度变革新阶段——2023年人工智能赋能网络视听产业观察报告》。《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能
2023-10-21 19:06:00
风口上的生成式AI:深度求索产业变革
...知识管理、对话应用,还是生成代码、设计研发,生成式人工智能(AI)正在深度求索产业变革。“在模型能力和性价比同步提升的背景下,国内人工智能应用依托丰富生态和成熟流量,正加速在
2025-02-15 09:28:00
...《报告》的主要内容。《报告》指出,2023年,以通用型人工智能为引领的内容科技迎来跨越式发展,内容科技持续推进以数字化为宣传思想工作赋能,推进习近平文化思想的深入学习贯彻,也
2024-04-08 16:41:00
本文转自:人民网研究院2023年,以通用型人工智能为引领的内容科技迎来跨越式发展,内容科技持续推进以数字化为宣传思想工作赋能,推进习近平文化思想的深入学习贯彻,也不断催生行业的新
2024-04-08 16:49:00
...词被提及10次,“大模型”则首次被写入。作为大模型和人工智能领域的领军企业,我们感到非常振奋,同时深感责任重大。报告在介绍今年政府工作任务时提出,“因地制宜发展新质生产力,加
2025-03-09 14:03:00
“人工智能”首次写入政府工作报告,平治信息等公司纷纷加大布局
“人工智能+”再度引发热议。2024年政府工作报告提出,积极培育新兴产业和未来产业。同时,作为未来产业重要内容的“人工智能+”也被首次写入政府工作报告。政策利好之下,A股人工智能
2024-03-11 17:52:00
报告:生成式人工智能对金融业具有深远影响
...报告》)正式发布。《报告》称,以ChatGPT为代表的生成式人工智能(AIGC)对金融业具有深远影响。《明珠湾智能金融发展报告(2022)》发布现场
2023-12-18 16:49:00
更多关于财经的资讯:
峨眉山旅游股份选聘全资子公司总经理 截止时间
来自峨眉山旅游股份有限公司的消息显示,峨眉山旅游股份有限公司近日发布《关于延长2026年市场化选聘全资子公司总经理报名时间的公告》(以下简称《公告》)
2026-01-15 17:20:00
合肥国显注册资本增至114亿
近日,合肥国显科技有限公司发生工商变更,合肥建翔投资有限公司、合肥鑫城控股集团有限公司持股比例均由40%下降至31.13%
2026-01-15 17:36:00
襄阳国资航空新材料产业园8.7亿公开招标
近日,襄阳市航空新型材料产业园及配套设施建设项目招标计划公告发布,招采单位为襄阳襄江国有资本投资运营集团有限公司,预算金额8.7亿元,计划招标时间为2026年2月。
2026-01-15 17:36:00
天兵科技公示IPO上市辅导进展报告
近日,江苏天兵航天科技股份有限公司公示IPO上市辅导进展报告(第一期),中信建投(601066)作为辅导机构,参与本期辅导工作的其他证券服务机构包括容诚会计师事务所(特殊普通合伙)和北京市中伦律师事务所
2026-01-15 17:36:00
拓日新能成立新能源科技公司,含光伏相关业务
近日,封开宏日盛新能源科技有限公司成立,法定代表人为陈五奎,经营范围包含:太阳能发电技术服务;光伏发电设备租赁;光伏设备及元器件销售;太阳能热利用产品销售等。企查查股权穿透显示,
2026-01-15 17:36:00
为庆祝南京银行成立三十周年,1月10日上午,南京银行常州分行在湖塘新天地公园举办“骏马奔腾开新局,卅载同心续华章”主题健步走活动
2026-01-15 18:48:00
广州银行湛江分行因未对集团客户统一授信被罚款30万元
1月14日,国家金融监督管理总局湛江监管分局行政处罚信息公示表显示,广州银行股份有限公司湛江分行因未对集团客户统一授信被罚款30万元。责任人牛某奇被警告并处罚款5万元,谭某、彭某
2026-01-15 14:08:00
汪强获批担任嘉善联合村镇银行行长
1月15日,国家金融监督管理总局嘉兴监管分局发布关于汪强嘉善联合村镇银行行长任职资格的批复,核准汪强嘉善联合村镇银行行长的任职资格。
2026-01-15 14:09:00
汪强获批担任嘉善联合村镇银行董事
1月15日,国家金融监督管理总局嘉兴监管分局发布关于汪强嘉善联合村镇银行董事任职资格的批复,核准汪强嘉善联合村镇银行董事的任职资格。
2026-01-15 14:09:00
杜春燕获批担任海宁农商银行董事
1月15日,国家金融监督管理总局嘉兴监管分局发布关于杜春燕海宁农商银行董事任职资格的批复,核准杜春燕海宁农商银行董事的任职资格。
2026-01-15 14:10:00
黄孙锋获批担任金华银行温州分行行长助理
1月15日,国家金融监督管理总局温州监管分局发布关于黄孙锋金华银行温州分行行长助理任职资格的批复,核准黄孙锋金华银行股份有限公司温州分行行长助理的任职资格。
2026-01-15 14:11:00
Visa成首家支持中国持卡人Apple Pay绑卡的国际卡组织
1月15日,Visa宣布支持中国持卡人将Visa卡绑定至ApplePay,成为首家支持该功能的国际卡组织,此前ApplePay在中国仅支持绑定银联标识卡片
2026-01-15 14:12:00
从垃圾分类综合处置助力零碳岛建设,到金融活水支持“蓝色粮仓”丰收,再到金融科技赋能长岛旅游兴旺……近年来,在中国特色金融文化引领下
2026-01-15 14:59:00
太平人寿首批“消保驿站”正式授牌 打造有温度的一站式消保服务阵地
在金融消费需求日常多元化、差异化的今天,强化一线消保工作、维护好每位消费者的切身权益,正在成为保险行业发展的重中之重。太平人寿坚持“金融为民”底色
2026-01-15 15:16:00
雅达股份等成立数字能源技术公司,含半导体相关业务
近日,广东雅达数字能源技术有限公司成立,经营范围包含:储能技术服务;电池销售;半导体器件专用设备销售;半导体器件专用设备制造等。企查查股权穿透显示,该公司由雅达股份(920556
2026-01-15 15:24:00