• 我的订阅
  • 头条热搜
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。据了解,这两项国际标准是由Ope...……更多
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%
【新智元导读】最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。将一句话从「现在时」变为「过去时」,就能让LLM成功越...……更多
...助开发者检测自家AI安全性,并“负责任地部署生成式AI模型与应用程序”。获悉,PurpleLlama套件目前提供“CyberSecEval”评估工具、LlamaGuard“输入输出安全分类器”,Meta声称,之后会有更多的工具加入这一套件。Meta介绍称,Purple...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
o3 压台登场:OpenAI 卷动推理 AI 模型风云,迈向 AGI 新巅峰
...,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。名称最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altm...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。例如,Devin 的成功,激发了人们对基于大语言模型的自动数据分...……更多
大模型集体失控!南洋理工新型攻击,主流AI无一幸免
... 萧箫 发自 凹非寺量子位 | 公众号 QbitAI业界最领先的大模型们,竟然集体“越狱”了!不止是GPT-4,就连平时不咋出错的Bard、Bing Chat也全线失控,有的要黑掉网站,有的甚至扬言要设计恶意软件入侵银行系统:这并非危言耸听...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
...为25.8%。从研究内容主题的整体分布来看,主要集中在大模型、文生图/文生视频、强化学习、优化这四大块。再细分来看,机器视觉、自然语言处理、强化学习、学习理论、基于扩散的模型是最热的5个话题。共计165000名参会者...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前,基于规则的系统长期以来是语言模型的主导范式。顾名思义,基于规则的系统就是依赖人类编码的规则来执行决策。这种方式构建的 AI 虽然简单,但在某些特定...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
新的大语言模型(LLM)评估基准对于跟上大语言模型的快速发展至关重要。近日,淘宝天猫集团的研究者们提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五...……更多
全球首个!西电“玄知”密码大模型问世!
...科技大学计算机科学与技术学院沈玉龙教授团队在密码大模型方面取得突破性进展,研究成果以“玄知大模型”命名在西部网络安全大会上正式发布。2025年8月15日,第四届西部网络安全大会在陕西周至隆重召开。西电计算机科...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...4-bit量化,能让现有反学习/机器遗忘技术失灵!也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...享直播活动的最后一天!周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简版模型,针对...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...步发展;2. 文本图数据格式和实验设置不统一,难以进行模型之间的比较;3. 由于缺乏全面的基准测试和分析,对图模型处理边文本信息能力仍然了解的很欠缺。论文地址:https://arxiv.org/abs/2406.10310代码地址:https://github.com/Zhuofe...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...和子榜两项第一,AI智能体方向受瞩目 近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0 同样...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
【新智元导读】知识密集型工作也败了!大型语言模型在预测神经科学结果方面超越了人类专家,平均准确率达到81%,而人类专家仅为63%;模型通过整合大量文献数据,展现出了惊人的前瞻性预测能力,预示着未来科研工作中...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
世界首次!智源研究院实现数字孪生心脏电功能超实时仿真
...关重要。传统的心脏电生理研究多依赖于实验室内的动物模型和临床数据,但这类方法往往受限于伦理问题、实验条件和数据获取的复杂性。随着计算技术的发展,计算机仿真成为了一种新兴且强大的研究工具。通过建立数学模...……更多
2025 VDC安全与隐私分会:技术持续创新,夯实安全地基
...障碍类、后台弹广告类,风险应用识别等五类场景。检测模型自上线以来,已覆盖用户设备超1亿,日均检出超4万,累计识别恶意应用变种超470万次,识别能力提升到90%以上的同时,未发生过一例误报。vivo应用安全总监 钱钰 针...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...系四年级博士生,研究方向为自主智能体,推理,以及大模型的可解释性和知识编辑。该工作由上海交通大学与 Meta 共同完成。论文题目:Caution for the Environment: Multimodal Agents are Susceptible to Environmental Di……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...的突破使得 GenAI 在多个领域广泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...后,开发者们甚至还发现,Reflection可能就是个「套壳」模型,而且还是连套三家的那种(Claude/GPT/Llama)。这下子,Reddit和X等平台上,立刻掀起了质疑的声浪。 左右滑动查看为此,Shumer承诺将和Glaive创始人Sahil Chaudhary一起调查...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
前实习生篡改代码攻击大模型训练 字节跳动起诉要求赔偿800万元
...洋)字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院,判令田柯宇赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。11月5日,字节跳动曾...……更多
更多关于财经的资讯:
各地多措并举促进新消费
央视网消息(新闻联播):眼下,各地多措并举培育消费新场景、推进首发经济等,为经济发展注入新动能。培育消费新场景,打造新的消费增长点
2025-12-07 11:57:00
新闻调查丨从追标准到定标准 “中国蔬菜出口第一县”做对了什么?
山东省安丘市,一个不通江达海的小县城。立冬过后,这个农业用地占比超过八成的典型北方小城,本应进入通常意义上的农闲时间。而在这里
2025-12-07 11:57:00
国内首家食品级胆碱生产企业!亚西亚药业核心产品国内市场占有率超90%
鲁网12月7日讯(记者 李晓晨)济南亚西亚扩建营养与健康产品生产项目由食品级胆碱全球销量冠军企业济南亚西亚药业有限公司投资建设
2025-12-07 12:31:00
3成市占率+14.7投入产出比!济阳“山楂智造”挺起食品产业新脊梁
鲁网12月7日讯(记者 李晓晨)山东金晔扩建山楂特色休闲食品、饮料项目由全国山楂零食领军企业山东金晔农法食品有限公司投资建设
2025-12-07 12:32:00
一单领航,点亮“灯塔”——华夏银行贵阳分行首笔股票回购贷款落地“破零”
多彩贵州网讯(本网记者 李晓芳)在资本市场改革深化、金融支持实体经济力度持续加码的背景下,近期,华夏银行贵阳分行成功向贵州永吉印务股份有限公司发放股票回购贷款4500万元
2025-12-07 14:54:00
工行贵阳瑞金南路支行联合社区开展老年金融知识普及活动
多彩贵州网讯(通讯员 彭晓晓、杨硕)为切实提升老年群体金融风险防范能力,织密金融安全防护网,近日,工行贵阳瑞金南路支行积极响应“金融为民
2025-12-07 14:55:00
学术赋能民族发展!贵州省苗学会召开2025年学术年会
12月6日,贵州省苗学会2025年学术年会在安顺市召开。会议以“弘扬伟大抗战精神:南方各民族在抗日战争中的贡献”为主题
2025-12-07 19:59:00
张家港农商银行无锡分行组织员工进社区开展主题手作暨反诈宣传
江南时报讯 在张家港农商银行成立24周年、无锡分行成立9周年之际,为深化银社联动、回馈社区厚爱,近日,张家港农商银行无锡分行组织员工走进望溪社区
2025-12-07 21:37:00
贵州磷化集团在ESG领域斩获两项重磅荣誉
日前,在国务院国资委社会责任局指导、责任云研究院承办的中央企业和地方国资国企社会责任蓝皮书发布会上,《贵州磷化集团2024年度社会责任报告》获评“地方国有企业社会责任报告案例”
2025-12-07 19:58:00
从“仙境”到“胜境”:烟台打造绿色低碳高质量发展新范式
“既能享受25微克/立方米以下的清新空气,又能见证火箭海上发射、新药加速问世,这样的烟台太让人期待!”在2025山东省绿色低碳高质量发展大会招商推介会上
2025-12-08 02:04:00
合肥多家投资机构荣获“金牛奖”
大皖新闻讯 日前,2025科创投资大会暨“第九届股权投资金牛奖”颁奖典礼在合肥举办。合肥多家投资机构获得被称为资本市场的 “奥斯卡” 奖的“金牛奖”
2025-12-07 16:00:00
建行临沂义堂支行:深耕普惠金融助力千企万户
鲁网12月6日讯在普惠金融的奔涌浪潮中,建行义堂支行有这样一支队伍,他们迈开“铁脚板”,将坚实的脚步深深扎进郎溪大地,将金融“活水”精准滴灌至厂房车间
2025-12-07 16:06:00
周末重磅!证监会主席发声
12月6日,在中国证券业协会第八次会员大会上,证监会主席吴清表示,证券行业将深化市场改革,聚焦高质量发展主线,全面提升核心竞争力和市场引领力
2025-12-07 07:52:00
蝉联全球第一!出海模式发生转变 中国汽车重塑全球价值链
近年来,中国汽车出口成为外贸增长中的一大亮点。2024年,我国以585.9万辆的出口规模蝉联全球第一,今年有望突破680万辆
2025-12-06 08:18:00