• 我的订阅
  • 头条热搜
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...之家 12 月 25 日消息,OpenAI 的研究人员提出了一种名为“深思熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型(LLMs)遵守明确的道德和安全...……更多
...在短板,无法很好地解决这些痛点。安全大模型急需一套全新的“作战方法”。为此,360从数据、场景、大模型和智能体4个方面进行研究,总结出新一代安全大模型的“核心战法”:数据制胜、小切口大纵深、类脑分区协同和...……更多
为实验监测装上“智慧之眼” 室内物理模型实验全场景变形智能追踪
...势,果断引入无人机技术,以“空中视角+智能分析”的全新模式,首次将无人机高空视角与智能技术成功应用于传统大尺度物理相似模拟实验,提出了复杂煤岩结构全场景多维度立体探测与辨识方法,突破了室内物理模型实验...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...,“OpenAI极有可能在2024年推出下一代模型GPT-5,也许会有全新的代号,无论如何比较肯定的是其认知能力将带来通用人工智能的再一次变革。其下一代模型在技术上可能解决目前ChatGPT中存在的事实性以及推理能力的缺陷,实现...……更多
...端的安全以及基座模型的安全,构成一个人工智能安全的全新领域,解决方法的关键是“以模制模”。“我们花了很多功夫专门做安全大模型,就是用聪明的大模型智力、能力去管理知识库的使用,去管理智能体的调用,去管理...……更多
国内成立首个超级智能安全实验室
...务;极大拓展了人类探索科学的范围、尺度和视角,构建全新的人机协同科研范式,将重塑世界科研格局。我国人工智能研究和应用已处于世界先进水平,近期DeepSeek等高水平应用更引发了新一轮的人工智能热情,但目前大语言...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3.2来了!这次,最大的亮点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)...……更多
百度发布Apollo开放平台的全新升级版本
12月4日消息,百度今日发布Apollo开放平台的全新升级版本—— Apollo开放平台10.0。据介绍,该平台不仅在软件核心层、应用软件层、工具服务层进行了升级,还通过自动驾驶大模型ADFM重构算法,提升了核心算法模块效果。在软...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...动、直观、易出错)进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠)。这让它能够解决以前无法解决的问题。 从今天 ChatGPT 的用户体验来看,这是向前迈进一小步。在简单的 Prompt 下,用户可能不会注意到太大...……更多
李飞飞最新对话:我愿意被称作“AI教母”,AI不会造成“人类灭绝”
...项技术的本质,了解它是什么,以及如何在最负责任、最深思熟虑的方式下使用它。我们应该接受它,因为它是一种正在改变我们文明的横向技术,带来了诸多益处,如加速科学发现、帮助我们找到癌症的治疗方法、绘制生物多...……更多
三箭齐发 西湖论剑重磅成果助力打造安全新质生产力
...大核心能力支撑交相辉映,为加速形成AI引领下的数字安全新质生产力保驾护航。成果一:AI之于安全的八大应用趋势当前安全产业,从技术角度存在安全天平和能力鸿沟等问题,AI时代下的数据安全、内容安全、业务安全、供应...……更多
什么影响大模型安全?NeurIPS\'24新研究提出大模型越狱攻击新基准
全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学(Guangzhou)USAIL研究团队,从攻击者和防御者的角度探讨了什么因素会影响大模型的安全。提出攻击分析系统性框架JailTrackBench。JailTrackBench研究重点分析了不同...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
...他们也在 RLHF 和 RLAIF 的基础上做出了改进。 他们提出的全新的 AI 反馈方法可让人类来指定所需模型响应的规范,这些规范就类似于在 RLHF 中给人类标注者提供的指示。具体来说,该团队的方法是将期望行为分解成一些具体规...……更多
百度智能云重磅发布开元智慧金融解决方案
...台中”。徐旭说。为了解决金融行业在智能化时代应对的全新挑战,百度智能云重磅发布开元智慧金融解决方案2.0。据了解,开元2.0一是在通用大模型基础上增强了行业专业性,通过打造全栈自研的端到端解决方案,打通底层算力管...……更多
模型树笔记:理念指引学习革新,重塑深度认知与高效学习能力
...们深入交流和紧密合作,模型树的创始人洞察到一个引人深思的现象:尽管这些优秀学员在认知程度和学习能力上表现出色,但他们的成功似乎并非仅仅源于此。事实上,他们的成功更多地归功于那颗敢于拼搏、敢于挑战的心,...……更多
全国政协委员周鸿祎:AI“幻觉”具有两面性
...的安全,还有基座模型的安全,构成一个新的人工智能安全新领域。解决方法就是‘以模制模’。”(完)【编辑:刘阳禾】 ……更多
AI诊断抑郁症,准确率高达97.53%的秘诀何在?
...发明的KTU博士生Musyyab Yousufi说,他们选择语音数据是经过深思熟虑的:“虽然大家可能觉得面部表情更能反映心理状态,但这些数据很容易被误导。而语音能够巧妙地揭示情绪状态,比如说话的速度、语调和整体能量,这些都会...……更多
奇安信集团:把握五个关键 筑牢人工智能安全底线
...信将深挖优势,“以AI驱动安全”,助力构建数字经济安全新生态。 ……更多
​海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能
...型”,标志着其在智慧交通领域的AI技术创新应用迈入了全新阶段。该交通大模型是海信深度融合二十余年交通行业经验与前沿AI技术的产物。基于海量交通专业数据与多模态感知能力,构建“问答-分析-决策”一体化系统,通过...……更多
...日报昆明理工大学科研团队取得重要突破开发出帕金森病全新治疗策略本报讯(记者 陈怡希) 1月31日,记者从昆明理工大学获悉,经过8年艰苦努力,该校李天晴、季维智院士团队在帕金森疾病治疗方法上取得重要突破。团队开...……更多
苹果的人工智能为何与众不同?高管这样说
...息,在今年的全球开发者大会上,苹果高管详细阐述了其全新人工智能软件套件“苹果智能”(Apple Intelligence)的功能及其背后设计理念,这标志着该公司全面拥抱了人工智能技术。与其他科技巨头不同,苹果采取了一种更为务...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...,研究团队跳出了静态 Embedding 的方法框架,提出了一种全新的基于动态 Embedding 轨迹 的 OOD 检测算法,称作 “TV Score”,以应对数学推理场景下的 OOD 检测问题。动机与方法1. 定义:什么是 Embedding 轨迹? 2. 动机:为什么用 Embe...……更多
华为harmonyosnext重塑全新“星盾”安全架构
...”整机性能提升30%、连接速度提升3倍、功耗降低20%、全新星盾安全架构、HarmonyOSIntelligence鸿蒙智能、Top5000应用已有1500+完成鸿蒙化上架。今天面向开发者和先锋用户启动Beta,首批机型包括华为Mate60系列、MateX5系列、MatePadPro13...……更多
走进民企看发展 | 周鸿祎:先上舞台,才有故事
...户端的安全、基座模型的安全,构成一个新的人工智能安全新领域。解决方法就是‘以模制模’。”他告诉三里河。为此,周鸿祎建议各界共同努力,构建更加完善的大模型应用安全治理体系,在保障安全前提下,最大化地释放...……更多
RLHF不够用了,OpenAI设计出了新的奖励机制
...RLHF)中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致,我们需要定义期望行为并收集人类反馈来训练「奖励模型」。这种模型通过发出期望的动作来指导 AI。但是,收...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由OpenAI、蚂蚁集团...……更多
360周鸿祎:“以模制模”,寻解人工智能安全新挑战
...为新一轮工业革命的驱动引擎。同时,面对随之产生的安全新挑战,需要采取利用人工智能技术治理人工智能的新思路,寻找解题之法。360集团创始人周鸿祎2023年以来,生成式大语言模型演进带动一系列智能技术飞速发展,在...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...信公众号)《性能直追GPT-4,5000个H100训成!DeepMind联创发全新一代大模型》InflectionAI推出了一款新的AI模型,性能超过了谷歌和Meta的两款模型,仅次于OpenAI的GPT-4。InflectionAI计划将新模型集成到其聊天机器人Pi中,提升其与用户...……更多
全球AI安全评估测试有了新基准
...式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试有了新基准。“随着人工智能系统,特别是大语言模型成为社...……更多
装备数字工程概念与实践思考
...模的区别。即便是今天,要想论证清楚体系工程是不是个全新领域,它与传统系统工程有没有本质区别,仍然是费力不讨好的事儿。因此,美国国防部从实践角度出发,选择了“从心”,把基于使命的作战概念设计、基于体系的...……更多
更多关于科技的资讯:
深耕三国文化,灵犀互娱《三国志·战略版》实践中式美学的全球表达
2025年初,国务院办公厅印发《关于推动文化高质量发展的若干经济政策》,明确提出“加快培育具有国际竞争力的文化出口重点企业
2025-11-24 11:25:00
“肽”领全球!菏泽中食都庆通过白俄罗斯验厂审核,东欧市场再添新动能
鲁网11月24日讯日前,Richtek Ltd(大连睿骐生物科技)携白俄罗斯客户代表团莅临菏泽鲁西新区陈集镇中食都庆(山东)生物技术有限公司
2025-11-24 11:43:00
河北新闻网讯(翟磊)“四季度以来,企业订单稳定,月产能最大可达150万片。目前开通了5条智能化生产线,不仅产能得到了提升
2025-11-24 11:58:00
让真实被听见:猛玛助力百校学生记录当代中国
2025年,是《南风窗》“调研中国”项目的二十周年,一百支大学生团队深入全国各地开展田野调查。猛玛作为项目在全国高校的无线麦克风合作伙伴
2025-11-24 11:47:00
从福掌柜包装焕新,看“中国守味人”的文化赋能与商业远见
近年来,中国餐饮行业从规模扩张迈向高质量发展的新阶段,餐饮供应链的品牌化成为大势所趋。在此背景之下,中粮餐饮旗下产品品牌福掌柜率先启动全线产品包装焕新
2025-11-24 11:57:00
“好房子科技展”亮相首钢园 华为全屋智能担当“隐形力量”
“好房子科技展”在首钢园正式开放海外网11月21日电 由住房和城乡建设部科技与产业化发展中心联合20余家单位共建的“好房子科技展”近日在北京首钢园8号馆正式开放
2025-11-24 09:53:00
2025年北京市职工数据安全管理员职业技能决赛成功举办
2025年11月23日上午,由北京市总工会、北京市人力资源和社会保障局主办,北京网络空间安全协会、北京市总工会职工服务中心
2025-11-24 10:17:00
灵光突破200万下载:首破百万用4天,再破百万仅2天
11月24日消息,通用AI助手灵光在上线6天总下载量突破200万:在首次破百万下载用时4天刷新纪录后,再破百万的时间压缩到了2天
2025-11-24 10:24:00
国内寿险行业头部企业——中国人寿保险股份有限公司(以下简称“中国人寿”,股票代码:601628.SH,2628.HK)始终坚持以人民为中心的价值取向
2025-11-24 11:00:00
摘要:本文系统探究了人工智能技术在影视美术创作及戏剧影视美术设计专业教学中的应用模式、核心价值与发展前景。通过对Midjourney
2025-11-24 07:00:00
医保制度的完善与发展不仅直接影响人民的健康福祉,还关乎国家医疗资源的合理配置与利用效率。然而,随着医保覆盖范围不断扩大
2025-11-24 07:00:00
厦门三展联动 显现整合资源拉动消费的集聚效应
境外客商参观2025厦门国际咖啡产业博览会。●ISPO亚洲运动用品与时尚展涵盖多领域户外装备展示,并设有行业分享论坛、新潮运动体验区
2025-11-24 07:53:00
厦门网讯(厦门日报记者 林露虹)独居老人在家中不慎跌倒,所幸家中安装的毫米波雷达设备迅速识别异常并触发警报,避免一场悲剧的发生……这一幕出现在今年热播剧《蛮好的人生》中
2025-11-24 07:54:00
厦门网讯(厦门日报记者 房舒)“你是温峥嵘,那我是谁?”近日,演员温峥嵘怒斥AI(人工智能)仿冒者的言论冲上热搜,揭开了AI技术被滥用的冰山一角
2025-11-23 08:11:00
网聚泉城丨政企协同“双轮驱动” 济南以数字技术重构电梯产业生态
鲁网11月23日讯(记者 张佳伟 实习生 寇晓菊)1天内完成立项、2天完成图纸审查、1个月实现场地平整、1年建成开园投产——广日电梯济南数字化产业园以“广日速度”刷新行业纪录
2025-11-23 15:19:00