• 我的订阅
  • 科技

全球AI安全评估测试有了新基准

类别:科技 发布时间:2024-04-25 04:00:00 来源:每日看点快看

本文转自:科技日报

大模型安全领域两项国际标准发布

全球AI安全评估测试有了新基准

全球AI安全评估测试有了新基准

随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。

◎本报记者 崔 爽

第27届联合国科技大会期间,在以“塑造AI的未来”为主题的AI边会上,国际组织世界数字技术院(WDTA)发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试有了新基准。

“随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。”WDTA人工智能安全可信负责任工作组组长黄连金介绍,此次发布的标准汇集了全球人工智能安全领域的专家智慧,填补了大语言模型和生成式人工智能应用方面安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高人工智能系统安全性,促进技术负责任发展,增强公众信任。

记者了解到,此次发布的两项国际标准是大模型及生成式人工智能应用方面的安全测试标准。

《生成式人工智能应用安全测试标准》以WDTA为牵头单位,为测试和验证生成式人工智能应用的安全性提供了框架。它定义了人工智能应用程序架构每一层的测试和验证范围,包括基础模型选择、嵌入和矢量数据库等,确保人工智能应用各方面都经过严格的安全性和合规性评估,有利于保障其在整个生命周期内免受威胁和漏洞侵害。

《大语言模型安全测试方法》以蚂蚁集团为牵头单位,为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。它提出了大语言模型安全风险分类、攻击分类分级方法以及测试方法,并给出四种不同攻击强度的攻击手法分类标准,提供了严格的评估指标和测试程序。它全面测试大语言模型抵御敌对攻击的能力,使开发人员和组织能够识别和缓解潜在漏洞,有利于提高使用大语言模型构建的人工智能系统的安全性和可靠性。

“一方面,生成式人工智能将释放巨大生产力。另一方面,我们也要对它带来的新风险高度警惕。大型科技公司应在促进生成式人工智能安全和负责任的发展中发挥关键作用,利用其资源、专业知识和影响力,构建一个优先考虑安全、隐私和道德的生态系统。”作为标准参与单位代表,蚂蚁集团机器智能部总经理、蚂蚁安全实验室首席科学家王维强在会议发言中说。他进一步解释,可通过制定行业标准与指南,为开发和部署生成式人工智能系统的开发者和机构提供清晰指导;投入研发并开放保障生成式人工智能安全的工具,形成产业共治格局等。

记者了解到,蚂蚁集团从2015年起积极投入可信人工智能技术研究,目前已建立了大模型综合安全治理体系。集团还自研了业界首个大模型安全一体化解决方案“蚁天鉴”,用于人工智能生成内容的安全性和真实性评测、大模型智能化风控、可解释性检测等。此次发布的《大语言模型安全测评方法》,便是基于“蚁天鉴”人工智能安全检测体系的应用实践,与全球生态伙伴交流编制而成。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-25 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会
2024-04-10 20:16:00
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
·随着尖端人工智能系统变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次
2023-10-12 15:21:00
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队,共同第一作者为上海交通大学博士生邱芃铖和吴超逸,共同通讯作者为上海交通大学人工智能学院王延峰
2024-09-30 09:51:00
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...授、慕尼黑工业大学 Florian Walter 和 Alois Knoll 教授。随着人工智能(AI)的飞速发展
2024-10-09 09:51:00
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...技术院(WDTA)发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全
2024-04-17 13:40:00
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以
2024-04-09 01:58:00
自动化、可复现,基于大语言模型群体智能的多维评估基准
...)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基准测试是 Chatbot Arena
2024-10-23 12:03:00
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...通讯作者为从鑫与林衍凯,指导教师为刘知远副教授。在人工智能迅猛发展的今天,我们不断探索着机器的智能化,但却往往忽视了这些智能体如何深层地理解我们 —— 它们的创造者。我们人类
2024-08-14 09:39:00
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI 将计数器重置为 1,并将该系列模型命名为 OpenAI o1
2024-09-13 16:42:00
更多关于科技的资讯:
视频摄制:冯阳 霍艳恩 赵新宇 王思宁
2026-03-07 10:02:00
中国青年医师IP孵化计划在杭州启动
2026年3月5日,以“AI链全球 生态共生”为主题的中国青年医师IP孵化计划在杭州启动。本次活动来自全国多所医院的专家
2026-03-07 10:40:00
租金两块钱一分钟 “共享机器人”即将入驻杭州商场、电影院
星枢智能的“机器人家族” 记者 杨亦淇 摄一台售价20多万元的春晚同款人形机器人,现在花5000元就能租一天;如果是基础款
2026-03-07 08:05:00
摘要:随着信息技术的快速发展,人工智能技术逐渐渗透金融机构的各类业务与管理环节,对传统金融运作模式产生了深刻影响。金融机构在激烈竞争和成本约束的背景下
2026-03-07 05:46:00
近日,省应急管理厅举行“AI+工业企业火情预警(火眼哨兵)”“AI+烟花爆竹监管(烟花卫士)”应用上线发布仪式。浙江拥有30余万家工业企业
2026-03-07 07:34:00
视频摄制:张晶、赵新宇、朱泊宇
2026-03-07 07:47:00
今年的全国两会上,“一人公司”(One Person Company,简称OPC)成为代表委员们热议的话题。全国人大代表
2026-03-07 07:04:00
2026年全国两会正式开幕,全国政协委员、京东集团技术委员会主席、京东云总裁曹鹏围绕人工智能产业发展建言献策。他建议,推动我国AI产业实现从规模扩张到效能提升
2026-03-06 22:56:00
编者按:从生力军天创机器人开始,《大众证券报》明镜财经工作室记者将陆续探访在各种应用场景解决着实际问题的南京机器人企业
2026-03-06 22:56:00
从平台赋能到标杆涌现:青岛崂山区打造OPC创业首选地
鲁网3月6日讯2026年,是“一人公司”(OPC)从概念走向规模化实践的关键之年。当这一新型创业范式成为科创发展新风口
2026-03-06 20:12:00
【宅男财经|专家面对面】据央视新闻报道,十四届全国人大四次会议今天(6日)举行经济主题记者会。商务部部长王文涛在会上表示
2026-03-06 21:54:00
从手工“制茶”到数据“智茶”:竹叶青展现AI时代品质新解法
在中国古老的传统产业版图中,茶产业无疑是最具代表性,却又最难被现代化改造的堡垒之一。长期以来,非标化、依赖人工经验、产业链条冗长等痛点
2026-03-06 17:21:00
全球AI迈向“办事时代”,千问持续推进AI生活服务落地
3月6日,千问宣布持续投入“AI办事”,用户可以让AI一句话下单各类生活服务,享受AI办事带来的便捷和立减实惠。进入2026年
2026-03-06 18:54:00
三联家电洪楼店店庆盛典3.07火热开启!
鲁网3月6日讯春暖花开,焕新正当时!一年一度,三联家电洪楼店将于3月7日至3月15日隆重举办店庆盛典,为广大消费者带来一场诚意十足
2026-03-06 17:08:00
2025ITEC颁奖典礼在京举行 半导体AI创新成果引关注
2月4日,第十三届朝阳国际人才创业大会(ITEC2025)创新峰会在北京举办,大会全球创业赛获奖名单同期正式揭晓——“人工智能在半导体制造的应用与研究”项目凭借核心技术突破与产业化落地实效
2026-03-06 14:10:00