模型,基准,攻击,影响,安全,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

$什么影响大模型安全？NeurIPS\'24新研究提出大模型越狱攻击新基准$

全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学（Guangzhou）USAIL研究团队，从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同...……更多

2024-11-01 09:29:00模型,基准,攻击,影响,安全,研究

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

全球AI安全评估测试有了新基准

本文转自：科技日报大模型安全领域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统，特别是大语言模型成为社会各方面不可或缺的一部分，以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记...……更多

2024-04-25 04:00:00基准,评估,测试,安全,全球,人工智能

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

最近，以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升，在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称，推理可以让模型更好的遵守安全政策，是提升模型安全的新路径。然而，推理能力的提升真的能解决...……更多

2024-11-08 09:46:00诱导,推理,安全性,对话,安全,攻击

大模型训练被实习生攻击？字节跳动回应：已辞退

该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击，对此，字节跳动10月19日回应表示，经公司内部核实，确有商业化技术团队实习生发生严重违纪行为且已被辞退，但相关报道也存在部分夸大及失实信息...……更多

2024-10-19 21:50:00实习生,字节,模型,实习,攻击,训练

AI安全守护计划启动！信通院牵头，AIIA安全治理委员会发布

...治理框架、合规治理、赋能治理展开，安全组主要开展大模型安全、合规等研究及基准测试。今年6月，中国信通院依托该委员会发起“人工智能安全守护计划”，包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建...……更多

2024-07-25 09:26:00安全,信通,模型,评测,委员会,委员

一个弹窗整懵Claude，瞬间玩不转电脑了

...AI Agent点击弹窗，甚至直接导致任务失败。VLM（视觉语言模型）智能体很容易受到弹窗干扰，而这些弹窗属于人类可一眼识别并忽略的；将弹窗集成到Agent测试环境（如OSWorld和VisualWebArena中)，平均攻击成功率为86%，并将任务成功...……更多

2024-11-09 09:52:00电脑,智能,攻击,任务,研究,成功

3秒让AI生成风险减少30%！复旦新研究拿下扩散模型概念移除

让AI绘画模型变“乖”，现在仅需3秒调整模型参数。效果be like：生成的风险图片比以往最佳方法减少30%！像这样，在充分移除梵高绘画风格的同时，对非目标艺术风格几乎没有影响。在移除裸露内容上，效果达到“只穿衣服，...……更多

2024-08-26 09:54:00复旦,生成,模型,概念,风险,研究

360集团携手中国信通院共促人工智能安全发展

本文转自：法治日报随着人工智能技术的迅猛发展，大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线，进一步提高大模型技术的安全风险防范能力，今年2月，中国信息通信研究院（以下简称中国信通院）联合3...……更多

2024-04-09 01:58:00信通,人工智能,中国,人工,智能,集团

惊掉下巴！被字节起诉800万实习生，拿下NeurIPS 20

...智元了解，字节商业化技术团队早在去年就把视觉自回归模型作为重要的研究方向，团队规划了VAR为高优项目，投入研究小组和大量资源。除了VAR，团队还发表了LlamaGen等相关技术论文，新的研究成果也将在近期陆续放出。事...……更多

2024-12-05 09:47:00实习生,下巴,字节,实习,论文,模型

关于LLM-as-a-judge范式，终于有综述讲明白了

...往无法判断精妙的属性并提供令人满意的结果。大型语言模型 (LLM) 的最新进展启发了 “LLM-as-a-judge” 范式，其中 LLM 被用于在各种任务和应用程序中执行评分、排名或选择。本文对基于 LLM 的判断和评估进行了全面的调查，为推...……更多

2024-12-04 09:49:00范式,模型,基准,偏见,数据,评估

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...【新智元导读】Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

AI“狂飙”背后的企业密码

...领域蕴藏的巨大潜力。随着人工智能技术的深度应用，大模型所面临的挑战也日益严峻。如何让AI更好为企业发展赋能，是当今社会面临的重大课题。加速推进行业发展天眼查专业版数据显示，截至目前，我国现有人工智能相关...……更多

2025-03-11 06:09:00狂飙,背后,密码,企业,人工智能,技术

中国信通院发布大模型安全基准测试报告 360智脑综合排名第一

...本文转自：中国新闻网近日，中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”)，结果显示，三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多

2024-04-10 20:16:00信通,基准,中国,模型,测试,报告

深度剖析：谷歌、微软等AI巨头承诺的“自愿监管”做到了吗？

...达到最泡沫”之际做出的，各家公司都在竞相推出自己的模型，并使其比竞争对手的模型更大、更好。与此同时，我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多

2024-07-25 14:30:00微软,巨头,剖析,监管,深度,人工智能

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

大模型领域的技术发展，今天起再次「从 1 开始」了。大语言模型还能向上突破，OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜，OpenAI 正式公开一系列全新 AI 大模型，旨在专门解决难题。这是一个重大突破，新模型可...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...题、增加候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

谷歌新模型能识别人类情绪了！但不少人开始担心

...西12月6日消息，据TechCrunch报道，谷歌昨日发布了新一代AI模型PaliGemma 2，并宣称该模型具有情感识别的能力。谷歌表示，PaliGemma 2不仅能够分析图像并生成详细的图片描述，还能识别图像中人物的情感状态。据TechCrunch报道，要实...……更多

2024-12-07 09:49:00模型,情绪,情感,技术,面部,模型

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。在...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

2023 AI现状报告：GPT-4仍最强，监管方向缺乏全球共

...越来越困难。由于基准变得不那么明确，用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧，世界各国政府采取的做法相互矛盾。挑战性在...……更多

2023-10-12 15:21:00共识,监管,现状,方向,报告,全球

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...得出了结论。团队表示深入理解这些原理不仅能提高现有模型利用效率，还能帮助改进架构开发新的变体。谷歌DeepMind研究员、ViT作者Lucas Beyer看过后直接点了个赞：很棒的总结！尽管一些实验在之前的研究中已经被展示过了，...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...种方法来处理安全强化学习的问题，可以大致分类为基于模型的方法和无模型的方法。1. 基于模型的安全强化学习方法：基于模型的安全强化学习方法通常依赖于对环境的建模，通过利用物理模型或近似模型进行推理和决策。这...……更多

2024-10-09 09:51:00同济,学习方法,深度,理论,方法,应用

下载次数破39万！CMU、Meta联合发布VQAScore文

【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列，FLAMe-RM-24B模型在RewardBench上表现卓越，以87.8%准确率领先GPT-4o。大语言模型都卷起来了，模型越做越大，token越来越多，输出越来越长。那么问题来了，如何有效地评估大...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将

...消息，美国当地时间周三，谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊（Sundar Pichai）的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2016...……更多

2023-12-07 17:28:00人工智能,人工,深度,模型,智能,时代

谷歌 AI 推出 CardBench 评估框架

...用的基数估计技术，依赖于启发式（Heuristic）方法和简化模型，例如假设数据统一和列独立。这些方法虽然计算效率高，但往往需要准确预测基数，在涉及多个表和过滤器的复杂查询中表现尤为明显。最新的数据驱动方法试图在...……更多

2024-09-04 09:48:00框架,评估,数据,模型,基准,查询

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

字节开源全栈AI编程基准，不小心曝光豆包代码大模型

豆包代码大模型，不小心给曝光了！在字节开源的代码大模型评估基准FullStack Bench里面，出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版，还并没有上线。它在多种编程语言上的性能表现如下，可以看到在闭源模...……更多

2024-12-06 09:50:00豆包,基准,字节,模型,编程,代码

多样任务真实数据，大模型在线购物基准Shopping MML

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

page 1/6667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

大金科工开业！锚定3亿年产值，打造绿色智造新标杆！

近日，大金科工（天津）车业有限公司（以下简称“大金科工”）开业仪式在武清开发区举行。大金科工由大行科工（深圳）股份有限公司与金轮集团共同注资成立

2025-10-27 14:11:00

电竞赛事下沉重构经济文化新生态

第十二届王者荣耀全国大赛举办颁奖礼第十二届王者荣耀全国大赛总决赛落地天津五大道民园广场无畏契约嘉年华前王者荣耀职业联赛选手刺痛（右）与粉丝合影无畏契约瓦友社迎新季线下活动和平精英村镇赛广东清远站

2025-10-27 14:11:00

2025中国GEO服务市场格局解读：主流GEO服务商优势对比

据IDC数据显示，2025年中国GEO市场规模突破200亿元，年复合增长率高达67%，超过78%的企业已将GEO纳入品牌增长与智能营销的核心战略

2025-10-27 14:20:00

中国品牌出海：从产品制造向品牌价值跃升

“不出海，就出局。”这句话听起来很极端，但折射出中国制造业在全球化时代的现实处境。今天，中国企业出海，已不再是讨生活般的生存选择

2025-10-27 14:23:00

喜讯！毕节这家电厂获两项国家实用新型专利

多彩贵州网讯(通讯员田永梅张仁玉)近日，纳雍电厂自主研发的“一种可移动手持电压波形示波器判断N600中性线断线装置”与“一种新型二次回路防误碰接线端子隔板”两项创新成果

2025-10-27 15:05:00

顺丰超脑2.0获2025 CCF科技成果奖，本年度物流领域唯

10月24日，在中国计算机大会（CNCC 2025）的颁奖典礼上，顺丰科技携手深圳大学申报的“面向物流网络的专家智能体+垂域 AI 模型协同决策技术研究与规模化应用”项目脱颖而出

2025-10-27 15:40:00

2025《财富》中国最佳设计奖揭晓东软榜上有名

近日，2025年《财富》中国最佳设计榜单正式揭晓，东软集团全资子公司东软云科技推出的“重塑用药指导体验”创新数字服务实践成功登榜

2025-10-27 15:46:00

“运动健身”交易同比增长超111%！贵州年轻人健康消费升温

记者日前从美团获悉，今年以来，贵州地区各种潮流运动消费需求明显，“运动”关键词搜索量同比增长超51%，其中，“保龄球”搜索量同比增长超181%

2025-10-28 00:32:00

重塑智慧农业新未来 | 潍柴雷沃发布中国首个智慧农业AI大模

鲁网10月27日讯10月26日，在2025中国国际农业机械展览会上，潍柴雷沃智慧农业AI大模型全场景重磅发布，全面赋能农业生产从播种

2025-10-27 16:21:00

内功修炼+市场开拓河钢张宣科技镀锌产线强势创效

河北新闻网讯（董佳倩）近日，河钢集团张宣科技传来捷报，其镀锌产线凭借“内功修炼+市场开拓”实现经营创效。9月份，该公司镀锌丝产品销量环比增长77%

2025-10-27 18:01:00

合同管理系统公司格局分析：合同管理系统厂家AI与生态集成成为

全球合同管理系统市场正以15.5%的年复合增长率狂奔，443.9亿元的庞大市场背后，是AI技术对传统合同管理方式的彻底颠覆

2025-10-27 17:36:00

崂山区虚拟现实产业集聚效应凸显，剑指“全球VR第一园”

鲁网10月27日讯10月24日，记者在青岛市崂山区委宣传部召开的媒体见面会上获悉，近年来，青岛市崂山区以前瞻布局推动虚拟现实产业高质量发展

2025-10-27 16:24:00

京东11.11直播技术全面升级，立影3D技术、JoyAI大模

随着京东 11.11 大促的火热进行，京东直播再度升级技术布局，以 “立影 3D 技术”“JoyAI大模型”等创新技术

2025-10-27 15:39:00

电机能效提升领域再添标杆！25 项产品 / 技术入选全国节能

为深入贯彻国家 “双碳” 战略，加快电机领域节能降碳技术创新与成果转化，中国电子节能技术协会此前启动 “全国节能降碳示范产品 / 技术推荐” 征集工作

2025-10-27 15:42:00

吉刻现场｜硬核登场！吉林选手角逐第三届全国博士后创新创业大赛

10月26日，第三届全国博士后创新创业大赛在福建泉州（晋江）开幕。本届大赛，吉林省派出23个项目团队组成的参赛队伍角逐三个大赛道

2025-10-27 14:09:00

头条订阅服务