• 我的订阅
  • 头条热搜
什么影响大模型安全?NeurIPS\\\'24新研究提出大模型越狱攻击新基准
全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学(Guangzhou)USAIL研究团队,从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
全球AI安全评估测试有了新基准
本文转自:科技日报大模型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记...……更多
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。然而,推理能力的提升真的能解决...……更多
该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击,对此,字节跳动10月19日回应表示,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为且已被辞退,但相关报道也存在部分夸大及失实信息...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多
一个弹窗整懵Claude,瞬间玩不转电脑了
...AI Agent点击弹窗,甚至直接导致任务失败。VLM(视觉语言模型)智能体很容易受到弹窗干扰,而这些弹窗属于人类可一眼识别并忽略的;将弹窗集成到Agent测试环境(如OSWorld和VisualWebArena中),平均攻击成功率为86%,并将任务成功...……更多
3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA
让AI绘画模型变“乖”,现在仅需3秒调整模型参数。效果be like:生成的风险图片比以往最佳方法减少30%!像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。在移除裸露内容上,效果达到“只穿衣服,...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...达到最泡沫”之际做出的,各家公司都在竞相推出自己的模型,并使其比竞争对手的模型更大、更好。与此同时,我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...题、增加候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各国政府采取的做法相互矛盾。挑战性在...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...种方法来处理安全强化学习的问题,可以大致分类为基于模型的方法和无模型的方法。1. 基于模型的安全强化学习方法:基于模型的安全强化学习方法通常依赖于对环境的建模,通过利用物理模型或近似模型进行推理和决策。这...……更多
打乱/跳过Transformer层会怎样?最新研究揭开其信息流动机制
...得出了结论。团队表示深入理解这些原理不仅能提高现有模型利用效率,还能帮助改进架构开发新的变体。谷歌DeepMind研究员、ViT作者Lucas Beyer看过后直接点了个赞:很棒的总结!尽管一些实验在之前的研究中已经被展示过了,...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
...消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2016...……更多
谷歌 AI 推出 CardBench 评估框架
...用的基数估计技术,依赖于启发式(Heuristic)方法和简化模型,例如假设数据统一和列独立。这些方法虽然计算效率高,但往往需要准确预测基数,在涉及多个表和过滤器的复杂查询中表现尤为明显。最新的数据驱动方法试图在...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
谁是在线购物领域最强大模型?也有评测基准了。基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由Ope...……更多
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%
【新智元导读】最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。将一句话从「现在时」变为「过去时」,就能让LLM成功越...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
...助开发者检测自家AI安全性,并“负责任地部署生成式AI模型与应用程序”。获悉,PurpleLlama套件目前提供“CyberSecEval”评估工具、LlamaGuard“输入输出安全分类器”,Meta声称,之后会有更多的工具加入这一套件。Meta介绍称,Purple...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。例如,Devin 的成功,激发了人们对基于大语言模型的自动数据分...……更多
更多关于科技的资讯:
宝马5系新车刚下高速就趴窝:底盘冒烟 全车断电
快科技2月14日消息,据报道,陈先生1月份花费36万元,在台州玉环力宝行汽车4s店买了一辆宝马5系新车。但在过年回安徽老家时
2025-02-14 19:22:00
RTX 50麻烦了!从桌面到笔记本 各种跳票跳票跳票
快科技2月14日消息,NVIDIA日前官方宣布,RTX 50系列笔记本将从2月25日起开启预售,但具体上市时间没说,取决于笔记本厂商的进度
2025-02-14 19:22:00
官方确认:领克900将全球首搭英伟达Thor自动驾驶芯片
快科技2月14日消息,极氪科技集团今日正式成立,并开始实行“极氪汽车+领克汽车”双品牌驱动战略,官方还透露了不少劲爆的产品信息
2025-02-14 19:22:00
复兴号动车组“亲”上了!历时16分钟
快科技2月14日消息,经常坐高铁的朋友,肯定会看过动车组“亲亲”的场景,非常有爱,但你了解具体细节吗?这种将两列动车组连成一列的运行方式
2025-02-14 19:22:00
《美国队长4》欲与《哪吒2》硬碰硬 不料同日票房完败
快科技2月24日消息,据媒体报道,今日,《哪吒2》正陆续登陆海外多地,“魔童”哪吒正以惊艳之姿进入全球视野。这部影片不仅在海外社交媒体上受到广泛关注
2025-02-14 19:52:00
首家!联想moto手机正式接入DeepSeek-R1满血版
快科技2月14日消息,联想moto宣布旗下手机正式接入DeepSeek-R1满血版大模型(671B参数),首批支持联想moto razr 50系列
2025-02-14 19:52:00
法拉利CEO现身零跑汽车总部 朱江明亲自接待
快科技2月14日消息,有博主爆料称,法拉利CEO贝内代托·维格纳到访了零跑汽车总部。现场照片显示,零跑汽车创始人朱江明亲自接待维格纳
2025-02-14 19:52:00
男子饭后肚子剧痛抽出牛奶血:平时经常点外卖
快科技2月14日消息,据报道,上海市44岁的马先生近日吃完晚饭后突然肚子痛,就医后确诊为高脂血症型胰腺炎。据悉,马先生已有十多年未曾进行体检
2025-02-14 19:52:00
强劲性能+4K Mini-LED震撼大屏!微星泰坦18 Pro游戏本图赏
快科技2月14日消息,微星泰坦18 Pro笔记本新配置现已来到快科技评测室,它采用i9-14900HX + RTX4070+ 4K/120Hz Mini-LED广色域大屏的
2025-02-14 19:52:00
《哪吒2》现象:京东站内相关搜索量同比增长超200倍 图书成交额环比增长超4000%
电影《哪吒之魔童闹海》(以下简称“哪吒2”)掀起的热度还在延续。截至发稿,《哪吒2》票房突破95亿,进入全球动画电影票房榜前5名
2025-02-14 19:57:00
博主称自动领航换电撞上充电站 蔚来:不实 系人驾操作失误撞车
快科技2月14日消息,日前,汽车博主“老七”爆料称,自己驾驶蔚来ES7,在高速服务区领航换电过程中撞上换电站,此事引起网友关注热议
2025-02-14 21:52:00
海南铁路的“数字匠人”:从海量数据的“蛛丝马迹”中揪出隐患
南海网2月14日消息(记者 王小畅 通讯员 孙磊 蒋程炜 张戈祥)14日8时,海南铁路海口综合维修段检测分析队办公室内已是一片忙碌
2025-02-14 21:57:00
求职路上你我皆“哪吒” 智联招聘“智蓝优选”化身太乙真人
国内登顶票房冠军,《哪吒2》的热度还在持续,#哪吒2破100亿#霸榜热搜。银幕上的小哪吒以对抗命运的决心,让每个奋斗中的普通人为之振奋
2025-02-14 16:53:00
人民能源自研第三代智能充电中控亮相  开启出行与城市智慧变革
随着城市化进程加速和环保意识提升,电动自行车交通工具已成为短途出行的首选。然而,充电难、充电安全隐患等问题困扰着用户,尤其在人口密集的城市区域
2025-02-14 17:00:00
【东湖微评68】《哪吒2》口碑踩上“风火轮”
统筹:伍佳佳策划:詹蔷、王舒娴编辑:郭蕾、廖逢倩设计:夏潇然【责任编辑:王舒娴】
2025-02-14 17:10:00