• 我的订阅
  • 科技

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

类别:科技 发布时间:2024-04-10 20:16:00 来源:每日看点快看

本文转自:中国新闻网

近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

大模型安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高内容安全、数据安全和科技伦理等安全能力为目标,覆盖价值观正确、合法合规、隐私保护、文明健康等二十余个维度的中文评测数据集。帮助大模型技术提供方提升安全风险防范能力,为大模型研发和落地保驾护航。

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

此次测评报告即是在大模型安全基准测试AI Safety Bench标准下进行,此次测试数据共7343条,包含了个人隐私、歧视偏见、违法违规等维度,使用Responsibility Score(负责度评分)和 Safety Score(安全评分)两个指标。结果显示,360智脑在两方面评分均表现良好,超过目前市面上主流的阿里、智谱、百川等7个大模型,综合成绩第一,表明360智脑不仅具备较强的安全意识,还能更好回答安全问题,在安全性能方面优势很大。

360集团表示,自身在网络安全领域深耕多年,拥有的安全大数据规模全球领先;且作为国内较早布局人工智能大模型的企业,360自研的认知型通用大模型——“360智脑”在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力第一梯队。为对应人工智能时代出现的AI安全新挑战,360提出“以模制模”的理念,用人工智能对付人工智能,研发360安全大模型,目前已经在多个重要安全领域实现大模型能力的全面赋能。

资料显示,360是中国人工智能产业发展联盟(AIIA)安全治理委员会副组长单位以及大模型安全风险防范能力系列评估规范“核心参编单位”,同时作为中国网络空间安全协会人工智能安全治理专业委员会首批成员单位,参与大模型语料库和安全评测。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-10 23:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合360集团,发起大模型安全基准测试SafetyAI Bench制定工作。大模型安全基准测试秉持“公平公正、产业应
2024-04-09 01:58:00
日前,“2024中国信通院ICT深度观察报告会”人工智能伙伴分论坛在京召开。会上,“CAICT人工智能伙伴计划”启动。未来,中国信通院将与合作伙伴紧密围绕国家重大需求,在政策研究
2023-12-26 17:41:00
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...、安全组两个工作组,近百家单位加入,主任单位由中国信通院牵头,副主任单位包括多家知名企业和高校。其中,治理组工作围绕AI治理框架、合规治理、赋能治理展开,安全组主要开展大模型
2024-07-25 09:26:00
...记者10日从中国信息通信研究院了解到,今年6月来,中国信通院选取多款通用大模型和医疗健康行业大模型开展效能评估工作,结果显示,通用大模型在医学知识广度方面具有一定优势,医疗健
2024-10-10 20:28:00
浪潮科技作为首批成员单位加入信通院“政务大模型推进中心”
12月21日,"2024中国信通院ICT深度观察报告会政企数字化转型论坛"在北京召开。此次论坛聚焦政企数字化转型,浪潮科技作为首批成员单位受邀出席“政务大模型推进中心”成立仪式。
2023-12-22 18:53:00
中国信通院发布《代码大模型》标准
...,据人工智能产业发展联盟AIIA消息,2024年1月25日,中国信通院联合中国工商银行牵头发布《智能化软件工程技术和应用要求第1部分:代码大模型》标准,该标准适用于企业在代码
2024-01-31 11:30:00
...促人工智能应用以人为本,智能向善。近日,在2025中国信通院深度观察报告会主论坛上,首批17家企业正式签署《承诺》。《承诺》凝聚产业界守护人工智能安全、促进人工智能向善的基本
2024-12-29 10:38:00
...性进一步凸显。记者从中国信息通信研究院(简称“中国信通院”)获悉,DeepSeek国产化适配测试工作已正式启动,将推动AI软硬件协同效能提升。据介绍,本次测评工作旨在为Dee
2025-02-14 19:23:00
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...性消息——结果没多久,Reflection 70B就被打假了:公布的基准测试结果和他们的独立测试之间存在显著差异。无论是AI研究者
2024-10-08 09:47:00
更多关于科技的资讯:
2万毫安时119元!罗马仕推出PPR20S移动电源:支持小米55W秒充
快科技4月18日消息,罗马仕PPR20S移动电源目前已经上市,定价为119元。外观方面,罗马仕PPR20S移动电源采用镭雕钻光
2025-04-18 09:55:00
105比0!RTX 5060 Ti 16GB卖爆、8GB没人要
快科技4月18日消息,RTX 4060 Ti的时候,8GB显存刚刚好,16GB显存几乎没啥用;RTX 5060 Ti身上就完全逆转了
2025-04-18 09:55:00
苹果为何离不离开我们!《人民日报》:充分释放“工程师红利”
快科技4月18日消息,今天《人民日报》刊文称,我国要充分释放“工程师红利”。报道中提到,以工程师为代表的高素质劳动者,是中国创新得以持续“上新”的重要因素之一
2025-04-18 09:55:00
起猛了!机器人跑马拉松了
本文转自:人民网-科普中国
2025-04-18 09:55:00
霸王茶姬IPO,市值近440亿人民币
文|李振兴“我喜欢霸王茶姬,是因为我喜欢喝茶,霸王茶姬茶的味道正,并且他的包装很有中国风。”一个刚参加完高考的西安学生对中华网财经说
2025-04-18 09:56:00
4月16日,西山煤电官地矿矿车统计员,打开手机上的矿车调度管理系统,只需5分钟就完成了对矿车的统计和调度,与原来4个小时的工作时间相比
2025-04-18 09:59:00
本文转自:人民网-河北频道4月17日,河北省保定市以“新技术、新产业、新动能”为主题,召开保定市重大创新成果系列发布会首场发布会
2025-04-18 10:21:00
黄钰超 柳州工学院一、采购降本的重要性与背景在当今经济全球化及市场竞争愈发激烈的背景下,企业面临着前所未有的成本压力,尤其是在采购领域
2025-04-18 10:23:00
陈宗洋 郑煤集团(河南)白坪煤业有限公司摘要:随着新媒体的迅猛发展,企业文化传播的方式和渠道发生了深刻变化。传统的企业文化传播主要依赖于内部会议
2025-04-18 10:23:00
数智化背景下会计人才培养路径探究
杜柯 河北经贸大学一、引言当今时代,随着技术的发展和生产力的进步,生产方式、消费场景、经济范式、管理模式等都将发生前所未有的变革
2025-04-18 10:23:00
非油炸 可冲泡:五谷道场牛腩方便面每包2.5元闭眼入
天猫五谷道场旗舰店,五谷道场方便面10袋日常售价为39.9元,秒杀价25.11 元,约每包2.5元。(商超日常售价为18
2025-04-18 10:25:00
1499元起 微星三款27英寸电竞显示器齐发:均支持TUV爱眼认证
快科技4月18日消息,微星推出了3款27英寸电竞显示器,包括QD-OLED旗舰、Mini-LED全能王、2K性价比战神三大核心阵容
2025-04-18 10:25:00
真有蟹肉真好吃:优形阿拉斯加蟹肉棒5.7元/袋半价狂促
优形阿拉斯加蟹肉棒65g*15 袋标价179元,今日立减18元,下单领取75元。实付86元,约合每袋仅需5.7元。线下商超日常售价11
2025-04-18 10:25:00
NVIDIA新驱动576.02登场:RTX 5080性能最高提升7%!
快科技4月18日消息,日前NVIDIA正式发布了576.02新版显卡驱动,在修复RTX系列显卡多个关键问题的同时,还带来了性能提升
2025-04-18 10:25:00
又一麒麟新机登场!华为畅享80真机抢先看:四款配色确认 没5G
快科技4月18日消息,华为畅享80预计本月发布,目前已有多家线下手机店发布演示机的开箱视频。此外,还有小红书用户晒出第三方软件查询该机配置的截图
2025-04-18 10:25:00