模型,基准,攻击,影响,安全,研究头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...裁Greg Brockman倾向于加速商业化，以获得更多资金来支持AI模型的算力需求，力求快速增强AI的力量；而伊利亚等人则希望AI更安全。去年11月，双方矛盾激化，OpenAI上演“宫斗”大戏，结果奥尔特曼和Greg Brockman在短暂离职后重归Op...……更多

2024-06-24 09:18:00热战,安全,全球,安全,伊利亚,模型

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...熟虑的对齐”（Deliberative Alignment）的新方法，以提升 AI 模型安全性，并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型（LLMs）遵守明确的道德和安全准则，目前存在诸多挑战。监督微调（SFT）和来自人类反馈的...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

Claude 3大模型引起学界关注，业内人士：或将开启科研新

...公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来，全世界网友正在对其进行广泛测试，并得出科研领域正在被该模型颠覆的观点。那么，这到底是一个怎样的模型？具有哪些出色的能力？又将会给哪些领域带来...……更多

2024-03-12 10:59:00范式,学界,业内人士,模型,业内,科研

隆重开幕丨第十届中国软件估算大会暨2025软件行业基准数据发

...探索实践——通过引入自然语言处理（NLP）与AI智能分析模型，构建智能稽核工具，对主流功能点评估模型在实际项目中的应用效果进行评估，实现了对国有资产的全链条穿透式监管。中国移动通信集团有限公司数智化部内审...……更多

2025-11-01 16:16:00软件,第十届,基准,中国,发布会,大会

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI放出了一个大招，预热了许久的“草莓”（Strawberry）模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼（Sam Altman）说。这就是名为 o1的新模型，这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：

...面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减，表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%；在非拉丁文字语言上，所有模型的表现显著弱于英语。在大语言模型（LLMs...……更多

2024-11-26 09:51:00多语,大比,基准,指令,任务,语言

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

AI落地千行百业，存储痛点凸显，浪潮信息如何助力AI向实？

AI时代，存储不仅是数据的栖息之地，更是AI模型训练、落地过程中的坚实底座。在AI开启的存储行业新周期中，众多厂商已将带宽等性能指标卷至新的高度。然而，这种追求似乎将AI这一复杂应用场景简单地“存储化”了。实际...……更多

2024-11-08 09:46:00浪潮信息,痛点,浪潮,百业,落地,存储

开闭源模型「大乱斗」：看看哪个智能体最能窥见人类真实意图

...两人均为 THUNLP 成员。钱成主要研究兴趣为工具学习，大模型驱动智能体，即将就读 UIUC 博士。何秉翔主要研究兴趣为大模型对齐与安全，即将就读清华大学博士。本文通讯作者为从鑫与林衍凯，指导教师为刘知远副教授。在人...……更多

2024-08-14 09:39:00意图,模型,人类,智能,智能,任务

奇安信发布《2024人工智能安全报告》：AI深度伪造欺诈激增

...的应用机会或进行相关资金投入。IDC预测，2026年中国AI大模型市场规模将达到211亿美元，人工智能将进入大规模落地应用关键期。《报告》认为，“AI是一种通用技术，通用就意味着既可以用来做好事，也可以被用来干坏事”。...……更多

2024-02-29 15:46:00安信,人工智能,人工,深度,智能,报告

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。LLM集成到搜索引擎中，可以说是当下AI产品的一个热门落地方向。前有Perplexity横空出世，后有谷歌Gemini和OpenAI的SearchGPT纷纷加入。就在11月23日，...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

位列第一梯队，腾讯混元再度领跑国内大模型

5月6日记者获悉，国内权威的大模型评测机构SuperCLUE最新发布了《中文大模型基准测评2024年度4月报告》。其中，腾讯混元大模型位列国内大模型第一梯队，在基础和场景应用上均处于领先位置，位于卓越领导者象限。SuperCLUE是...……更多

2024-05-06 16:52:00腾讯,梯队,模型,腾讯,模型,能力

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

连发两款模型“补课”，百度AI成色如何？

...杨锦没有发布会、没有李彦宏，百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1，免费。两年前的3月，百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品，也让外界看到百度相对迅速的先手布局...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

LLM训练通信量减少10000倍！全新分布式优化器，整合世间

...了1000到10000倍！如果可以使用世界上所有的算力来训练AI模型，会怎么样？近日，凭借发布了开源的Hermes 3（基于Llama 3.1）而引起广泛关注的Nous Research，再次宣布了一项重大突破——DisTrO（分布式互联网训练）。通过使用与架构...……更多

2024-09-10 13:39:00训练,分布式,世间,整合,全新,通信

150万条多语种音频数据！浙大清华发布语音伪造检测框架Saf

...造检测方法，其核心是设计基于神经音频编解码器的解耦模型，分离语音声学与语义信息，仅利用声学信息检测，包括前端解耦模型、瓶颈层和混淆层、伪造检测器、真实环境增强四部分。近年来，语音合成和语音转换等技术取...……更多

2024-09-27 13:40:00多语,多语种,万条,清华,隐私保护,框架

从“智能涌现”到“超人类”，通往AGI巅峰的终极设想

...战我们对创造力的传统认识。这还只是冰山一角。AI气象模型[1]已为我们预测天气，它比代表人类千万年经验的传统数值预报方法还要准确，速度也要快上一万倍；AI教学平台正在根据学生的学习习惯和进度提供个性化指导[2]，...……更多

2023-12-01 09:21:00巅峰,终极,人类,智能,人类,系统

OpenAI o1 模型 PlanBench 规划能力实测：

...州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 ...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

注意！大模型工具Ollama存安全风险

...安全信息通报中心在官方微信公众号发布情况通报称，大模型工具Ollama存在安全风险。通报称，据清华大学网络空间测绘联合研究中心分析，开源跨平台大模型工具Ollama默认配置存在未授权访问与模型窃取等安全隐患。鉴于目前...……更多

2025-03-03 21:59:00模型,风险,工具,安全,模型,安全

赋予“公共品”属性安全科技迎来质变时刻

...团队看来，安全科技将成为社会公共品。这个推论在AI大模型横空出世、大大推进深度智能时代到来的背景下正在不断被验证。这种社会公共品属性体现在两个方面。一方面，安全科技不只是对攻击者的安全防御体系，也包括了...……更多

2024-01-22 05:20:00公共品,质变,属性,时刻,安全,科技

潮声丨用AI之“道”降伏AI之“魔”！浙江的“一等奖”为何花

...协同风险防御体系为国际首创，基于对抗学习的人工智能模型抗噪防御技术、可扩展的在线动态图表征对比学习技术、知识驱动的自适应多维主动询问风险分析技术达到国际领先水平。 “院士们的鉴定有两层含义。”徐恪向记...……更多

2023-11-14 12:43:00潮声,浙江,一等奖,成果,安全,技术

大模型越狱，价值百亿的猫鼠游戏｜Future

...里，看见【Future】。文｜林炜鑫编辑｜苏建勋想要诱骗大模型听从一些不怀好意的指令吗？一个最简单的方式是，不停夸奖它，把它捧上天。比如，想让大模型教你如何制造炸弹，你得先夸它是世界上最聪明的AI，然后就会得到...……更多

2023-12-06 16:08:00模型,价值,模型,安全,刘杨,提示

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本