深思,全新,方法,安全,模型,安全头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...之家 12 月 25 日消息，OpenAI 的研究人员提出了一种名为“深思熟虑的对齐”（Deliberative Alignment）的新方法，以提升 AI 模型安全性，并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型（LLMs）遵守明确的道德和安全...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

360安全大模型3.0亮相

...在短板，无法很好地解决这些痛点。安全大模型急需一套全新的“作战方法”。为此，360从数据、场景、大模型和智能体4个方面进行研究，总结出新一代安全大模型的“核心战法”：数据制胜、小切口大纵深、类脑分区协同和...……更多

2024-04-01 02:22:00模型,安全,安全,模型,能力,中枢

为实验监测装上“智慧之眼” 室内物理模型实验全场景变形智能追

...势，果断引入无人机技术，以“空中视角+智能分析”的全新模式，首次将无人机高空视角与智能技术成功应用于传统大尺度物理相似模拟实验，提出了复杂煤岩结构全场景多维度立体探测与辨识方法，突破了室内物理模型实验...……更多

2025-07-10 10:39:00实验,监测,模型,场景,物理,智慧

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...，“OpenAI极有可能在2024年推出下一代模型GPT-5，也许会有全新的代号，无论如何比较肯定的是其认知能力将带来通用人工智能的再一次变革。其下一代模型在技术上可能解决目前ChatGPT中存在的事实性以及推理能力的缺陷，实现...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

周鸿祎：人工智能安全与发展可“同步走”

...端的安全以及基座模型的安全，构成一个人工智能安全的全新领域，解决方法的关键是“以模制模”。“我们花了很多功夫专门做安全大模型，就是用聪明的大模型智力、能力去管理知识库的使用，去管理智能体的调用，去管理...……更多

2025-03-02 19:28:00周鸿,人工智能,人工,同步,智能,安全

国内成立首个超级智能安全实验室

...务；极大拓展了人类探索科学的范围、尺度和视角，构建全新的人机协同科研范式，将重塑世界科研格局。我国人工智能研究和应用已处于世界先进水平，近期DeepSeek等高水平应用更引发了新一轮的人工智能热情，但目前大语言...……更多

2025-03-31 11:35:00实验室,实验,智能,安全,智能,研究

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月，全新升级后的Llama 3.2来了！这次，最大的亮点在于，Llama 3.2成为羊驼家族中，首个支持多模态能力的模型。Connect大会上，新出炉的Llama 3.2包含了小型（11B）和中型（90B）...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

百度发布Apollo开放平台的全新升级版本

12月4日消息，百度今日发布Apollo开放平台的全新升级版本—— Apollo开放平台10.0。据介绍，该平台不仅在软件核心层、应用软件层、工具服务层进行了升级，还通过自动驾驶大模型ADFM重构算法，提升了核心算法模块效果。在软...……更多

2024-12-05 03:09:00版本,全新,升级,开放,平台,驾驶

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...动、直观、易出错）进化到了可使用系统 2 思维（缓慢、深思熟虑、有意识、可靠）。这让它能够解决以前无法解决的问题。从今天 ChatGPT 的用户体验来看，这是向前迈进一小步。在简单的 Prompt 下，用户可能不会注意到太大...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

李飞飞最新对话：我愿意被称作“AI教母”，AI不会造成“人类

...项技术的本质，了解它是什么，以及如何在最负责任、最深思熟虑的方式下使用它。我们应该接受它，因为它是一种正在改变我们文明的横向技术，带来了诸多益处，如加速科学发现、帮助我们找到癌症的治疗方法、绘制生物多...……更多

2024-05-11 14:10:00教母,对话,人类,人工智能,数据,人工

三箭齐发西湖论剑重磅成果助力打造安全新质生产力

...大核心能力支撑交相辉映，为加速形成AI引领下的数字安全新质生产力保驾护航。成果一：AI之于安全的八大应用趋势当前安全产业，从技术角度存在安全天平和能力鸿沟等问题，AI时代下的数据安全、内容安全、业务安全、供应...……更多

2024-05-24 14:16:00三箭,西湖,重磅,生产力,成果,全新

$什么影响大模型安全？NeurIPS\'24新研究提出大模型越狱攻击新基准$

什么影响大模型安全？NeurIPS'24新研究提出大模型越狱

全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学（Guangzhou）USAIL研究团队，从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同...……更多

2024-11-01 09:29:00模型,基准,攻击,影响,安全,研究

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安

...他们也在 RLHF 和 RLAIF 的基础上做出了改进。他们提出的全新的 AI 反馈方法可让人类来指定所需模型响应的规范，这些规范就类似于在 RLHF 中给人类标注者提供的指示。具体来说，该团队的方法是将期望行为分解成一些具体规...……更多

2024-11-07 09:54:00定律,机器人,模型,规则,机器,安全

百度智能云重磅发布开元智慧金融解决方案

...台中”。徐旭说。为了解决金融行业在智能化时代应对的全新挑战,百度智能云重磅发布开元智慧金融解决方案2.0。据了解,开元2.0一是在通用大模型基础上增强了行业专业性,通过打造全栈自研的端到端解决方案,打通底层算力管...……更多

2024-09-27 05:19:00开元,重磅,解决方案,智慧,智能,方案

模型树笔记：理念指引学习革新，重塑深度认知与高效学习能力

...们深入交流和紧密合作，模型树的创始人洞察到一个引人深思的现象：尽管这些优秀学员在认知程度和学习能力上表现出色，但他们的成功似乎并非仅仅源于此。事实上，他们的成功更多地归功于那颗敢于拼搏、敢于挑战的心，...……更多

2024-07-01 21:20:00革新,学习,学习能力,认知,深度,模型

全国政协委员周鸿祎：AI“幻觉”具有两面性

...的安全，还有基座模型的安全，构成一个新的人工智能安全新领域。解决方法就是‘以模制模’。”(完)【编辑:刘阳禾】 ……更多

2025-03-03 22:32:00周鸿,两面性,政协委员,两面,幻觉,委员

AI诊断抑郁症，准确率高达97.53%的秘诀何在？

...发明的KTU博士生Musyyab Yousufi说，他们选择语音数据是经过深思熟虑的：“虽然大家可能觉得面部表情更能反映心理状态，但这些数据很容易被误导。而语音能够巧妙地揭示情绪状态，比如说话的速度、语调和整体能量，这些都会...……更多

2024-11-23 14:12:00准确率,抑郁症,秘诀,高达,数据,抑郁症

奇安信集团：把握五个关键筑牢人工智能安全底线

...信将深挖优势，“以AI驱动安全”，助力构建数字经济安全新生态。 ……更多

2025-04-29 19:54:00安信,人工智能,底线,人工,关键,智能

海信重磅发布“云信·通途交通大模型”：以AI之力，解锁智

...型”，标志着其在智慧交通领域的AI技术创新应用迈入了全新阶段。该交通大模型是海信深度融合二十余年交通行业经验与前沿AI技术的产物。基于海量交通专业数据与多模态感知能力，构建“问答-分析-决策”一体化系统，通过...……更多

2025-04-24 16:17:00海信,交通,通途,智能交通,重磅,模型

开发出帕金森病全新治疗策略

...日报昆明理工大学科研团队取得重要突破开发出帕金森病全新治疗策略本报讯（记者陈怡希） 1月31日，记者从昆明理工大学获悉，经过8年艰苦努力，该校李天晴、季维智院士团队在帕金森疾病治疗方法上取得重要突破。团队开...……更多

2023-02-01 07:05:00帕金,帕金森,策略,全新,治疗,开发

苹果的人工智能为何与众不同？高管这样说

...息，在今年的全球开发者大会上，苹果高管详细阐述了其全新人工智能软件套件“苹果智能”（Apple Intelligence）的功能及其背后设计理念，这标志着该公司全面拥抱了人工智能技术。与其他科技巨头不同，苹果采取了一种更为务...……更多

2024-06-13 09:27:00人工智能,人工,苹果,智能,人工智能,智能

NeurIPS 2024 | 数学推理场景下，首个分布外检测

...，研究团队跳出了静态 Embedding 的方法框架，提出了一种全新的基于动态 Embedding 轨迹的 OOD 检测算法，称作 “TV Score”，以应对数学推理场景下的 OOD 检测问题。动机与方法1. 定义：什么是 Embedding 轨迹？ 2. 动机：为什么用 Embe...……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

华为harmonyosnext重塑全新“星盾”安全架构

...”整机性能提升30％、连接速度提升3倍、功耗降低20％、全新星盾安全架构、HarmonyOSIntelligence鸿蒙智能、Top5000应用已有1500+完成鸿蒙化上架。今天面向开发者和先锋用户启动Beta，首批机型包括华为Mate60系列、MateX5系列、MatePadPro13...……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

走进民企看发展 | 周鸿祎：先上舞台，才有故事

...户端的安全、基座模型的安全，构成一个新的人工智能安全新领域。解决方法就是‘以模制模’。”他告诉三里河。为此，周鸿祎建议各界共同努力，构建更加完善的大模型应用安全治理体系，在保障安全前提下，最大化地释放...……更多

2025-03-14 21:53:00周鸿,民企,舞台,故事,发展,周鸿

RLHF不够用了，OpenAI设计出了新的奖励机制

...RLHF）中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致，我们需要定义期望行为并收集人类反馈来训练「奖励模型」。这种模型通过发出期望的动作来指导 AI。但是，收...……更多

2024-07-26 09:35:00不够,奖励,机制,设计,模型,安全

国际组织WDTA首次就大模型安全发布国际标准，蚂蚁集团、Op

...式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准，代表全球人工智能安全评估和测试进入新的基准。据了解，这两项国际标准是由OpenAI、蚂蚁集团...……更多

2024-04-17 13:40:00讯飞,国际,国际组织,国际标准,蚂蚁,模型

360周鸿祎：“以模制模”，寻解人工智能安全新挑战

...为新一轮工业革命的驱动引擎。同时，面对随之产生的安全新挑战，需要采取利用人工智能技术治理人工智能的新思路，寻找解题之法。360集团创始人周鸿祎2023年以来，生成式大语言模型演进带动一系列智能技术飞速发展，在...……更多

2024-11-21 18:21:00周鸿,制模,人工智能,人工,全新,智能

清华提出CharacterGLM；DeepMind联创发全新

...信公众号）《性能直追GPT-4，5000个H100训成！DeepMind联创发全新一代大模型》InflectionAI推出了一款新的AI模型，性能超过了谷歌和Meta的两款模型，仅次于OpenAI的GPT-4。InflectionAI计划将新模型集成到其聊天机器人Pi中，提升其与用户...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售