• 我的订阅
  • 头条热搜
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由Ope...……更多
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%
【新智元导读】最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。将一句话从「现在时」变为「过去时」,就能让LLM成功越...……更多
...助开发者检测自家AI安全性,并“负责任地部署生成式AI模型与应用程序”。获悉,PurpleLlama套件目前提供“CyberSecEval”评估工具、LlamaGuard“输入输出安全分类器”,Meta声称,之后会有更多的工具加入这一套件。Meta介绍称,Purple...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altm...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。例如,Devin 的成功,激发了人们对基于大语言模型的自动数据分...……更多
大模型集体失控!南洋理工新型攻击,主流AI无一幸免
... 萧箫 发自 凹非寺量子位 | 公众号 QbitAI业界最领先的大模型们,竟然集体“越狱”了!不止是GPT-4,就连平时不咋出错的Bard、Bing Chat也全线失控,有的要黑掉网站,有的甚至扬言要设计恶意软件入侵银行系统:这并非危言耸听...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
...为25.8%。从研究内容主题的整体分布来看,主要集中在大模型、文生图/文生视频、强化学习、优化这四大块。再细分来看,机器视觉、自然语言处理、强化学习、学习理论、基于扩散的模型是最热的5个话题。共计165000名参会者...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前,基于规则的系统长期以来是语言模型的主导范式。顾名思义,基于规则的系统就是依赖人类编码的规则来执行决策。这种方式构建的 AI 虽然简单,但在某些特定...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五...……更多
全球首个!西电“玄知”密码大模型问世!
...科技大学计算机科学与技术学院沈玉龙教授团队在密码大模型方面取得突破性进展,研究成果以“玄知大模型”命名在西部网络安全大会上正式发布。2025年8月15日,第四届西部网络安全大会在陕西周至隆重召开。西电计算机科...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...4-bit量化,能让现有反学习/机器遗忘技术失灵!也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...享直播活动的最后一天!周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简版模型,针对...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...步发展;2. 文本图数据格式和实验设置不统一,难以进行模型之间的比较;3. 由于缺乏全面的基准测试和分析,对图模型处理边文本信息能力仍然了解的很欠缺。论文地址:https://arxiv.org/abs/2406.10310代码地址:https://github.com/Zhuofe...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0 同样...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
【新智元导读】知识密集型工作也败了!大型语言模型在预测神经科学结果方面超越了人类专家,平均准确率达到81%,而人类专家仅为63%;模型通过整合大量文献数据,展现出了惊人的前瞻性预测能力,预示着未来科研工作中...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
世界首次!智源研究院实现数字孪生心脏电功能超实时仿真
...关重要。传统的心脏电生理研究多依赖于实验室内的动物模型和临床数据,但这类方法往往受限于伦理问题、实验条件和数据获取的复杂性。随着计算技术的发展,计算机仿真成为了一种新兴且强大的研究工具。通过建立数学模...……更多
2025 VDC安全与隐私分会:技术持续创新,夯实安全地基
...障碍类、后台弹广告类,风险应用识别等五类场景。检测模型自上线以来,已覆盖用户设备超1亿,日均检出超4万,累计识别恶意应用变种超470万次,识别能力提升到90%以上的同时,未发生过一例误报。vivo应用安全总监 钱钰 针...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...的突破使得 GenAI 在多个领域广泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...系四年级博士生,研究方向为自主智能体,推理,以及大模型的可解释性和知识编辑。该工作由上海交通大学与 Meta 共同完成。论文题目:Caution for the Environment: Multimodal Agents are Susceptible to Environmental Di……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...后,开发者们甚至还发现,Reflection可能就是个「套壳」模型,而且还是连套三家的那种(Claude/GPT/Llama)。这下子,Reddit和X等平台上,立刻掀起了质疑的声浪。 左右滑动查看为此,Shumer承诺将和Glaive创始人Sahil Chaudhary一起调查...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
前实习生篡改代码攻击大模型训练 字节跳动起诉要求赔偿800万元
...洋)字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院,判令田柯宇赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。11月5日,字节跳动曾...……更多
更多关于财经的资讯:
践行企业社会责任 共谋乡村振兴发展 中国太保寿险贵州分公司赴赫章县铁匠乡联盟村考察座谈
多彩贵州网讯(记者 王静怡)近日,中国太平洋人寿保险股份有限公司贵州分公司(以下简称中国太保寿险贵州分公司)党委书记、总经理王秋生带领公司领导班子赴赫章县铁匠乡联盟村考察座谈
2025-11-18 16:13:00
截至今年10月 秦皇岛市发放科技贷款超500亿元
河北日报讯(牛冉)近日,笔者从国家金融监督管理总局秦皇岛监管分局获悉,今年,秦皇岛监管分局以体系搭建为根基、以产品创新为抓手
2025-11-18 15:59:00
42家公司今年来实施增发后股价涨幅逾60%
根据Wind数据统计,以发行日计算,今年来已有129家公司实施了定向增发。从二级市场来看,42家公司在实施增发后股价涨幅超过60%。其中,中航成飞、*ST松发、东山精密、罗博特科
2025-11-18 09:38:00
国科天成等成立无人机科技公司,含AI业务
近日,陕西国科星达无人机科技有限公司成立,注册资本1亿元,经营范围包含:智能无人飞行器销售;工业机器人销售;人工智能行业应用系统集成服务;人工智能通用应用系统等。企查查股权穿透显
2025-11-18 09:48:00
浙江富玉具身智能创投合伙企业成立,出资额10亿
近日,浙江富玉具身智能创业投资合伙企业(有限合伙)成立,出资额10亿元,经营范围包含:创业投资(限投资未上市企业);股权投资。企查查股权穿透显示,该企业由浙江省创业投资集团有限公
2025-11-18 09:48:00
润建股份在海南成立能源公司,含多项AI业务
近日,海南佳捷能源有限公司成立,法定代表人为卢伟强,经营范围包含:储能技术服务;发电技术服务;人工智能基础软件开发;人工智能应用软件开发;人工智能行业应用系统集成服务等。企查查股
2025-11-18 09:48:00
富满微等成立子午线芯片服务公司
近日,深圳子午线芯片服务有限公司成立,经营范围包含:集成电路设计;电子产品销售;半导体分立器件销售;电子元器件制造等。企查查股权穿透显示,该公司由富满微(300671)等共同持股
2025-11-18 09:48:00
新华人寿乌鲁木齐中心支公司因培训管理不到位被罚款4千元
11月17日,新疆金融监管局行政处罚信息公示列表显示,新华人寿保险股份有限公司乌鲁木齐中心支公司及相关责任人因培训管理不到位被警告并罚款4千元。肖某东被警告并罚款4千元。
2025-11-18 10:13:00
浙商银行:决定提名陈海强任浙商银行董事长
11月17日,浙商银行股份有限公司发布关于提名董事长的提示性公告,根据中共浙江省委决定,陈海强同志任浙商银行股份有限公司党委书记,提名陈海强同志任浙商银行股份有限公司董事长。
2025-11-18 10:14:00
宁波银行调整“宁行优01” 优先股股息率第三计息周期票面利率3.25%
11月18日,宁波银行(证券代码:002142)发布公告,对其非公开发行的优先股“宁行优01”(代码:140001)第三计息周期票面股息率进行调整
2025-11-18 10:15:00
河南辉县:为建筑“上户口”,给城市“治未病”
安全可靠的韧性城市如何实现?建筑质量如何让老百姓看得见摸得着?在河南省辉县市,一条以“城市生命线全生命周期管理”为核心的新路径正在实践
2025-11-18 10:33:00
中建八局华中公司湖南分公司开展 “党建领航智慧机场 BIM赋能数字未来“活动
为推动智慧建造与工程档案管理深度融合,11月14日,中建八局华中公司湖南分公司与长沙市城建档案馆在长沙机场T3航站楼项目开展“党建领航智慧机场 BIM赋能数字未来”党建联建暨BIM档案”数智化“观摩活动
2025-11-18 10:33:00
大虹桥的“硬通货”!华发虹桥四季全维配套一应俱全!
重磅消息!徐泾动迁房票安置计划正式拉开序幕,该片区域购房活力全面引爆。握有房票的购房者不仅期待着购房带来的安居乐业,更怀揣着提升生活品质的美好愿景
2025-11-18 10:33:00
国瓷材料投资成立房地产公司
近日,山东国瓷盛源房地产有限公司成立,法定代表人为许少梅,注册资本为1000万元,经营范围包含:房地产开发经营;物业管理;住房租赁。企查查股权穿透显示,该公司由国瓷材料(3002
2025-11-18 12:00:00
中国农业银行邯郸分行因保理融资业务“三查”不尽职被罚款50万元 四人被终身禁业
11月18日,国家金融监督管理总局邯郸监管分局行政处罚信息公开表显示,中国农业银行股份有限公司邯郸分行因保理融资业务“三查”不尽职被罚款50万元;张某祥、贾某、刘某山、李某玺被禁
2025-11-18 10:45:00