• 我的订阅
  • 科技

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

类别:科技 发布时间:2024-08-09 09:39:00 来源:量子位

深度学习三巨头之一Yoshua Bengio的下一步动向公开了,关于AI安全——

加入了一个名为Safeguarded AI(受保护的人工智能)的项目,担任科学总监。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

据介绍,Safeguarded AI旨在:

通过结合科学的世界模型和数学证明,构建一个负责理解和降低其它AI Agent风险的AI系统。

主打的就是一个量化安全保障。

该项目由英国高级研究与发明局(ARIA)提供支持,据说未来ARIA将投入共5900万英镑(约合RMB5.37亿)。

Bengio表示:

如果你计划部署某种技术,鉴于AI行为异常或误用可能带来非常严重的后果,你需要提出充分的理由,最好能提供强有力的数学保证,确保你的AI系统将正常运作。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

“受保护的AI”

Safeguarded AI项目被划分为三个技术领域,每个领域都有特定的目标和预算:

支架(Scaffolding),构建一个可扩展、可互操作的语言和平台,用于维护现实世界模型/规范并检查证明文件。 机器学习(Machine Learning),使用前沿AI帮助领域专家构建一流的复杂现实世界动力学的数学模型,并利用前沿AI训练自主系统 应用(Applications),在关键的网络-物理操作环境中部署一个由“把关AI”保护的自主AI系统,通过量化的安全保障释放重要的经济价值

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

官方表示,Bengio加入后将特别关注TA3和TA2,在整个计划中提供科学战略建议。

ARIA还计划投入1800万英镑(约合RMB1.64亿)成立一个非营利组织,领导TA2的研发工作。

Safeguarded AI项目总监是前Twitter高级软件工程师David “davidad” Dalrymple,去年9月份加入ARIA。

对于Bengio的到来,Dalrymple还在X(原推特)上传了俩人的合照:

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

关于“构建一个负责理解和降低其它AI Agent风险的AI系统”的具体方法,David “davidad” Dalrymple、Yoshua Bengio等人写了份文件。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

其中提出了一套称为“Guaranteed Safe AI(保证安全的AI)”的模式,主要是通过三个核心相互作用量化AI系统的安全保障:

世界模型,提供数学描述,阐述AI系统如何影响外部世界,并妥善处理贝叶斯和奈特不确定性 安全规范,定义哪些效果是可接受的数学描述 验证器,提供证明AI符合安全规范的可审计证书

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

他们还为创建世界模型的策略,划分了L0-L5安全等级:

Level 0:没有明确的世界模型。关于世界的假设隐含在AI系统的训练数据和实现细节中。 Level 1:使用经过训练的黑盒世界模拟器作为世界模型。 Level 2:使用机器学习生成的概率因果模型的生成模型,可以通过检查它是否为特定的人类制作的模型(例如科学文献中提出的模型)分配足够的可信度来进行测试。 Level 3:使用(一个或多个)概率因果模型(或它们的分布),可能在机器学习的帮助下生成,这些模型经过人类领域专家的全面审核。 Level 4:使用关于真实世界现象的世界模型,这些模型被正式验证为基本物理定律的合理抽象。 Level 5:不依赖具体的世界模型,而是使用覆盖所有可能世界的全局性安全规范。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

“AI风险”备受学术圈关注

“AI风险”一直是行业大佬们关注的焦点话题之一。

Hinton离职谷歌,就是为了自由地讨论AI风险问题。

之前,更是有吴恩达、Hinton、LeCun、哈萨比斯等AI巨佬们线上“对喷”的大型场面。

吴恩达曾表示:

对AI的最大担忧其实是,AI风险被过度鼓吹,导致开源和创新被严苛规定所压制。某些人传播(AI灭绝人类的)恐惧,只是为了搞钱。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

DeepMind CEO哈萨比斯则认为:

这不是恐吓。AGI的风险如果不从现在就开始讨论,后果可能会很严重。我不认为我们会想在危险爆发之前才开始做防范。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

Bengio之前还和Hinton、姚期智、张亚勤等人工智能大拿,发表了一封公开信《在快速进步的时代管理人工智能风险(Managing AI RIsks in an Era of Rapid Progress)》。

曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作

其中就指出人类必须认真对待AGI在这10年或下一个10年内在许多关键领域超越人类能力的可能。建议监管机构应该对AI发展全面洞察,尤其警惕那些在价值数十亿美元的超级计算机上训练出来的大模型。

就在一个月前,Bengio还以“Reasoning through arguments against taking AI safety seriously(回应反对认真对待AI安全的观点)”为题写了一篇文章,其中分享了他的最新想法,感兴趣的家人可以康康~

https://yoshuabengio.org/2024/07/09/reasoning-through-arguments-against-taking-ai-safety-seriously/

Guaranteed Safe AI:

https://arxiv.org/abs/2405.06624

参考链接:[1]https://www.technologyreview.com/2024/08/07/1095879/ai-godfather-yoshua-bengio-joins-uk-project-to-prevent-ai-catastrophes/[2]https://www.reddit.com/r/singularity/comments/1emcwox/ai_godfather_yoshua_bengio_has_joined_a_uk/[3]https://x.com/davidad/status/1821155265456033803

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-09 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

学而思携九章大模型、学而思学习机亮相世界人工智能大会
...投资人都将亮相论坛,畅议人工智能领域前沿技术、产业动向、向善治理。好未来CTO田密也将出现在论坛环节,在7月6日举办的“AI产业创新与投资发展主题会”上以《教育大模型,构建未
2024-07-04 23:00:00
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
人工智能(AI)大模型,击败了人类数学家。今天,在 Nature 上发表的一篇论文中,Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch
2023-12-15 14:38:00
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...马克·扎克伯格最近也透露,计划于明年推出Llama 4。这些动向表明人工智能领域的竞争目前正日益激烈,各方都在努力创造能够解决复杂问题的更为智能的模型。而OpenAI周五o3
2024-12-21 17:02:00
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...引着创投生态的风向。本周,我们观察到以下AI领域的新动向和新趋势:1.Sam Altman或筹数十亿美元自造AI芯片
2024-01-29 09:20:00
...北京日报让抽象数学与现实世界相连雁栖湖数学院用数学模型解析疾病成因本报讯(记者 刘苏雅)复杂疾病的成因如何,怎样才能有效防治?北京雁栖湖应用数学研究院研究员邬荣领、吴杰团队创
2023-10-21 03:52:00
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午,谷歌CEO劈柴正式宣布,“大杀器”Gemini 1.0
2023-12-07 08:18:00
56年无人解开的数学难题 被谷歌的新AI突破了
...通用的黑盒优化问题:maximize h(f)。其中,f 是由大型语言模型生成的程序,h 是衡量该程序质量的评估函数
2025-05-15 23:16:00
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练,永远不会达到接近人类水平的智能。除此之外,他还谈到当前大模型的局限性、以目标驱动的AI架构,
2024-10-18 09:42:00
人工智能数学基础:解锁智能世界的十大密钥
...积分,我们可以计算函数的梯度、极值等性质,从而优化模型的参数。而优化理论则提供了求解最优化问题的方法和工具。掌握这些知识将有助于我们设计和训练高效的机器学习模型。第五步:学习
2024-04-24 12:02:00
更多关于科技的资讯:
全飞秒精准4.0与3.0该如何抉择?听听专家的专业解析
大众网记者 王文文 菏泽报道当近视手术的科技齿轮持续向前,全飞秒SMILE技术早已从最初的3.0版本,悄然迭代至更精准的4
2025-08-14 10:33:00
在胜利油田鲁胜公司鲁源采油管理区坨28注水站注聚生产现场,一个看似不起眼的泡沫问题,曾长期困扰着生产效率与驱油效果。如今
2025-08-14 10:51:00
黄河:从 “互联网原住民” 到 “AI 原住民”,教育的下一个十年
“2015年,我们说孩子是互联网原住民;2025年,他们将成为AI原住民。”伴鱼CEO黄河的这个判断,勾勒出教育代际变迁的轮廓
2025-08-14 11:02:00
中科慧远将发布首款工业具身质检机器人CASIVIBOT 开启智能质检新飞跃
在工业制造向智能化转型的关键时刻,质检环节正面临前所未有的技术挑战与升级机遇。8月19日,国内领先的AOI(自动光学检测)专有设备制造商中科慧远将举行新品发布会
2025-08-14 11:02:00
北京大学光华管理学院近日聘任国际投资人与Web3.0企业家刘晓俊先生为创业导师,任期自2025年5月至2028年6月。刘晓俊先生长期深耕全球创新投资
2025-08-14 11:02:00
国网济宁供电公司:首创“模块化、快接式、智慧型”配电预制舱
鲁网8月14日讯日前,国网济宁供电公司创新研发的全国首套“模块化、快接式、智慧型”配电预制舱完成送电,有效破解了老旧小区改造空间受限
2025-08-14 11:18:00
机器人重构消费体验
当机器人从“工业重器”变身为餐厅服务员、脱口秀演员、智能管家,伴随机器人产业发展的消费新趋势正悄然到来。走进位于北京市通州区的机器人大世界
2025-08-14 11:20:00
10余项课程赋能工作一线 海南农商银行标准化内训课程开发工作坊结课
消费日报网讯(记者郑红梅)近日,“海南农商银行内训师队伍建设点灯人计划 — 标准化内训课程开发工作坊” 在中国(海南)改革发展研究院圆满收官
2025-08-14 11:21:00
产业链上的山东好品牌丨中国首款“零碳”工装,烟台造!
大众网记者 王亮 烟台报道这是一件普通的、黄色夹克外套?不,这是一件高科技的、碳中和的、“绿色的”夹克。中国首款“零碳”工装
2025-08-14 11:30:00
中国光大银行烟台分行交易银行部:以专业创新为笔 绘就银企共赢新画卷
编者按:在中国光大银行烟台分行,有这样一群人,从辛勤耕耘到运筹帷幄,他们在自己的岗位上默默奉献,用智慧和汗水浇灌着分行的发展之花
2025-08-14 11:33:00
2025浦东家具家居双展9月启幕,规模逆势扩张,看点多元升级
跨界破圈迎增长,30周年献礼开启家居产业新纪元在当下挑战与机遇并存的全球经贸环境下,中国国际家具展览会迎来了30周年的荣耀时刻
2025-08-14 11:35:00
当前,宠物经济已步入黄金发展期。宠物行业信息平台宠业家的数据显示,今年上半年,国内宠物消费达773.75亿元,同比增长8
2025-08-14 11:53:00
从实验室淬火到产业扎根:解码AI发展的“西安方案”
华商网讯(记者 郭佳欣)荣耀实验室以AI精研手机品质,讯飞星火大模型助力政务提效与学习变革,欧卡智舶无人船实现水面自主巡航治理……西安的AI创新
2025-08-14 13:26:00
新浪新闻“探索之心30”入围名单揭晓 20款AI原生应用挺进终审阶段
近日,由微博与新浪新闻共同发起的2025新浪新闻“探索之心30”评选活动正式公布AI原生应用入围名单,经过一个月的报名与频道推荐
2025-08-14 13:35:00
\
「诺守康社区营养控糖超市」2025年4月启动,截止8月全国已布局10家连锁超市。获悉,社区营养控糖连锁超市品牌「诺守康」已于今年8月份获得百万元种子轮融资
2025-08-14 13:37:00