• 我的订阅
  • 科技

给人工智能装上一双“人的眼睛”

类别:科技 发布时间:2024-06-12 06:16:00 来源:每日看点快看

本文转自:中国科学报

■本报记者 陈彬

近年来,随着人工智能的飞速发展,以无人驾驶、具身智能等为代表的智能无人系统得到不断推广和应用。人们希望这些系统可以在现实世界中更加自如地活动,更加准确地给人类提供帮助。但要达到这一目的有一个前提,那就是这些智能无人系统能更真切地“看”到这个世界,并能够更准确、迅速地对周围环境变化作出反应。

换句话说,它们需要一双更加敏锐的“眼睛”。

不久前,清华大学精密仪器系类脑计算研究团队聚焦类脑视觉感知芯片技术,提出了一种基于视觉原语的互补双通路类脑视觉感知新范式。在此基础上,该团队成功研制出世界上首款类脑互补视觉芯片“天眸芯”,大大提升了人工智能的信息采集效率。

近日,该研究成果以封面文章形式发表于《自然》。

“鱼”与“熊掌”不可兼得

清华大学类脑计算研究团队成立于2013年。自成立之初,该团队便将发展人工通用智能作为科研目标。

“这个目标我们从来没有改变过,但路还要一步一步走。”团队成员、清华大学精密仪器系教授赵蓉告诉《中国科学报》。最初,他们想到人工通用智能首先需要对数据进行高效计算。团队经过多年刻苦攻关,于2019年成功研制出世界首款异构融合类脑芯片“天机芯”,这是该团队的成果第一次登上《自然》封面。

“天机芯”的研发成功,给人工通用智能提供了一个足够强大的“大脑”,但仅有“脑子”,而没有准确且及时的数据传入是不行的,人类对外界的信息采集,90%都依赖于视觉。于是,研究团队将目光对准了人工智能的视觉感知领域,他们想知道,目前的视觉芯片是否存在一些尚待解决的问题。

问题很快就被他们找到了。

“人工智能在复杂环境下的信息采集主要靠传感器完成。具体到视觉感知领域,几乎所有的传感器在采集信息时,都希望将目标区域内的所有信息‘一网打尽’,似乎信息收集越全,人工智能对周围环境的感知力越强。”受访时,团队带头人、清华大学精密仪器系教授施路平表示。

虽然现有的传感器可以凭借越来越高的分辨率海量地采集数据,但从传感器到数据终端的传输网络带宽是有限的。于是,数据的激增和网络的局限之间形成了一种明显的矛盾。

“这就像我们可以购买很多辆汽车,但道路不拓宽,这些汽车就会在道路上拥堵,无法快速到达目的地。”施路平说。

此外,与信息大量采集和大量传输相伴的,还有软硬件能耗的激增以及信息采集动态范围(最大可测光强与最小可测光强的比值)的限制。

“分辨率、速度、精度/动态范围,这三者就像‘鱼’和‘熊掌’一样,在传统技术条件下几乎不可能兼得,一方性能的提升会导致其余两方性能的下降,进而导致视觉出现失真、失效或高延迟的问题,严重影响系统的稳定性和安全性。”赵蓉说。

这个问题,施路平团队是如何解决的?

做两套视觉系统

据施路平介绍,现阶段发展人工通用智能的方法主要有两种,一种基于电脑思维,另一种基于人脑思维。两种方法各有优缺点,但都代表人脑处理信息的部分模式。

“在研发‘天机芯’时,我们最大的收获便是创造了一种将两种思维方式相互融合的类脑计算思维架构。”施路平说。

研究团队研发视觉芯片的出发点,同样来自将计算思维与人脑思维相结合。

赵蓉解释说,与机器类似,人类的视觉系统同样存在“信息量”与“带宽”不可兼得的问题,但在漫长的演化过程中,人类找到了该问题的最佳解决方式——双通路互补的视觉系统。

“人体的视觉细胞分为两类——视锥细胞和视杆细胞,这两类细胞具有不同的特点。”赵蓉说,视杆细胞拥有很高的感光度,对弱光反应灵敏,但只能提供粗糙的视觉质量,不能感受颜色;视锥细胞拥有较低的感光度,但可以提供较高的视觉质量,使我们看到颜色。大脑通过功能互补的双通路进行视觉信息处理,其中一个通路主要负责处理颜色、细节等高精度信息,但处理速度相对较慢,另一个通路主要负责处理突发事件,能够作出快速反应,但精度不高。

“当一个足球快速向你飞来时,你会迅速发觉有物体运动,但完全不会注意到足球的任何细节;等足球停止运动,足球的所有细节都会呈现在你眼前。”赵蓉说,正是双通路视觉系统的相互配合,才使得人眼可以既准确又快速地观察到物体,并在极端场景下完成信息处理并进行应对。

施路平团队所提出的类脑视觉感知新范式便借鉴了人类视觉系统这一基本原理。

具体而言,他们将开放世界的视觉信息拆解为不同表达类型,并通过对这些信息的组合,模仿人类视觉系统的特征,形成两条优势互补、信息完备的视觉感知通路。

“这套系统首先会模仿人眼,将收集到的周围场景分解成很多元素,如物体运动、轮廓、色彩以及不同区域的对比度等,之后模仿人脑的处理机制,将这些信息分配到不同的‘处理通路’中,这就像工厂的多条流水线。”赵蓉说,系统再通过模仿人脑响应机制,对相关信息进行连接和协同,最终实现信息的高效、稳定传输。

“这相当于给机器人装上了一双人的眼睛。”赵蓉说。

未完成的工作

基于上述新范式,施路平团队几经攻关,成功研制出世界首款类脑互补视觉芯片——“天眸芯”。

据介绍,该芯片可在极低的带宽(降低90%)和功耗代价下,实现每秒10000帧的高速、10比特的高精度、130分贝的高动态范围的视觉信息采集,不仅突破了传统视觉感知范式的性能瓶颈,而且能够高效应对各种极端场景,确保系统的稳定性和安全性。

在“天眸芯”的研发基础上,团队还自主设计了高性能软件和算法,并在开放环境车载平台上进行了性能验证。在多种极端场景下,该系统均实现了低延迟、高性能的实时感知推理。

据介绍,研究人员还开发了一套集成“天眸芯”的汽车驾驶感知系统,以评估其在开放道路上行驶时面对极端情况——如强光干扰、光线强烈变化、突然出现异常物体时的反应。结果表明,“天眸芯”可以有效适应极端光环境并提供先进的多级感知能力。

“‘天眸芯’的成功研制,不仅为智能革命的发展提供了强大的技术支持,还为自动驾驶、具身智能等重要应用开辟了新道路。”施路平表示,将这一科研成果进一步推向应用,是目前该团队的一个重要工作。

赵蓉告诉《中国科学报》,一项技术与实际应用相结合,甚至产生商业价值,才称得上真正完成了研发的全流程。接下来,团队将推动“天眸芯”的落地应用。

同时,该团队也在开展相关工作,以将“天眸芯”与“天机芯”进行结合,并最终将其成功“植入”机器人的身体。“人工通用智能肯定是要在机器人身上展现的。”赵蓉说。

当然,在机器人视觉传输领域,现有的“天眸芯”虽然在“类人”的层面有了很大进步,但跟真正的人眼视觉系统相比仍有很大差距。弥补这些差距将是该团队的重要工作。

“总之,要实现团队成立之初立下的目标,我们还有太多工作要做。”施路平说。

相关论文信息:

https://doi.org/10.1038/s41586-024-07358-4

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-12 09:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

新加坡国立大学研发出人工智能驱动的“眼睛”AiSee!让视障人士能够“看到”物体
瞻观前沿随着人工智能技术的不断发展,越来越多的创新产品涌现出来,为有特殊需求的人群提供更多便利和帮助。新加坡国立大学计算机学院 (NUS Computer) 研究人员推出了一款名
2024-02-07 15:33:00
人工智能+工业!看机器人如何“花式”干活?
...新一轮科技革命和产业变革深入发展,新一代信息技术、人工智能、新能源、新材料、高端装备等领域前沿性颠覆性技术群体性突破,国内外都在抢先谋划布局。在全省工业和信息化工作会议上,省
2025-01-07 20:55:00
...发,不是一件容易的事。眼睛本质上是大脑的延伸,当前人工智能在模拟大脑前额叶功能上虽有成果,但底层智能的构建依旧困难重重。为解决这一问题,阿尔勃特从清华大学以及国外知名院校和研
2025-09-10 08:27:00
AI技术给机器装上“眼睛”
...钱天昊进行了现场演示。传感器通过与物联网、云计算、人工智能等技术深度融合,毫秒之间就能把检测结果传递到显示屏上——让工业制造的过程更加智能和精确。“目前,我们生产的工业传感器
2024-05-20 03:44:00
江苏南京:以“智”赋“能”,南京AI军团点亮智能制造
...模效率低的问题。我们的AI智能重建技术采用激光扫描和人工智能生成三维模型的技术,逐步替代传统工程师的人工投入进行作业。”杨一曦介绍,目前的技术水平已经可以帮助企业降低50%的
2025-11-10 08:00:00
给眼睛装上太阳能!复旦团队让盲人看到希望之光
...,同时推动与光电转换、成像技术、信息科学、微电子、人工智能算法等领域的交叉融合,探索智能化感光元件的临床应用。
2024-06-13 10:55:00
全球首台人工智能汽车机器人交付
...报“眼睛”可看清障碍物 还能“类人级”聊天全球首台人工智能汽车机器人交付长江日报讯(记者雷心蕊 涂静 通讯员杨蓓怡)10月30日,“2023集度|极越生态伙伴大会”在武汉正式
2023-10-31 04:46:00
焦点访谈丨AI虚拟调度员、AI兽医助手……人工智能赋能产业、智绘未来!
最近,人工智能再度成为人们热议的话题。今年两会就提出,持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用,大力发展智能网联新能源汽车、人工
2025-03-14 10:51:00
地表最强人形机器人来了!能聊天,能进厂干活,一天工作20小时
...伟达GTC上站着来自全球最先进的人形机器人,到今年世界人工智能大会上炫酷的机器人矩阵,再到如今Figure AI的新品炸场,黄仁勋今年年初的预言,逐渐成真——“机器人时代已经
2024-08-07 13:54:00
更多关于科技的资讯:
摘要:本文围绕企业绩效管理体系的构建与完善展开研究,首先明确该体系的核心构成,包含目标设定、过程监控、评估实施与结果应用四个相互衔接的环节
2025-11-15 05:22:00
厦门软件园健康马拉松赛开跑 引入AI陪跑员
厦门网讯(厦门日报记者 林露虹 摄影报道)“我的‘跑友’是机器人!”昨日,厦门软件园第十七届健康马拉松赛在软件园二期热力开跑
2025-11-15 08:20:00
吉林本土动画电影《疯狂电脑城》,凭啥在海外频频获奖?
在温哥华华语电影节上,吉林动画学院师生联合打造的《疯狂电脑城》摘得“最佳动画片奖”,这已经不是该片第一次出海,2024年
2025-11-15 19:01:00
摘要:本文聚焦数字化转型背景下企业行政管理效率提升问题,首先剖析数字化转型与企业行政管理的内在关联,指出二者通过流程优化
2025-11-15 05:22:00
2025网聚美好安徽|“双路由”直连上海 看宿州腾“云”而上
大皖新闻讯 11月14日,“皖美十四五 再启新征程”2025网聚美好安徽网络主题活动采访团走进位于宿州高新区的汴水之畔超级计算中心
2025-11-15 10:05:00
“世界舞台”上秀一圈,南京收获了什么?
进博会圆满落幕,南京交易分团意向成交9.98亿美元“世界舞台”上秀一圈,南京收获了什么?□南京日报/紫金山新闻记者 黄琳燕11月10日
2025-11-14 08:38:00
埃斯顿工业机器人出货量持续增长 宁企连续三季霸榜国内“一哥”
11月13日,在江宁开发区埃斯顿智能制造示范车间内,工业机器人正在做各种场景应用展示。宁企埃斯顿今年前三季度机器人总销量约25000台
2025-11-14 08:39:00
一批创新产品亮相“宁创新品”信创产业教育专场活动 只需3步,20分钟完成全班作业批改南报网讯(记者徐宁)上传空白试卷和答案
2025-11-14 08:39:00
以AI引擎打造数字化转型山西模式
图片由讲述人提供讲述人 山西数据流量谷副总经理邵同旭我是山西数据流量谷的邵同旭,长期专注于数据要素与人工智能领域。多年来
2025-11-14 08:52:00
岁末是金融服务的“大考期”,业务量激增、客户需求多元叠加。张家口农商银行宣泰支行聚焦柜面运营核心环节,以“压降投诉、提升质量
2025-11-14 10:07:00
秋实如今,快节奏的都市生活中,“情绪消费”成为一种新的消费方式。数据显示,超九成青年认可情绪价值,近六成青年愿意为情绪价值买单
2025-11-14 11:28:00
新华社记者王雨萧周蕊一杯咖啡,能勾勒出怎样的经济图景?从云南绵延百万余亩的咖啡种植园,到上海梧桐树下香气氤氲的创意特调
2025-11-14 11:28:00
惠依近日,深圳大学深圳城市传播创新研究中心发布《短视频用户的算法实践与“破茧”报告》。《报告》显示,与一些人担忧“信息茧房”形成对比
2025-11-14 11:28:00
如新荣获2025消费责任对话活动客户服务创新典型案例
2025年11月5日,以“大力提振消费 品质服务担当”为主题的消费责任对话活动在成都成功举办。本次活动由中国消费者协会
2025-11-14 11:29:00
Shopee 11.11大促热力爆棚,Shopee Live直播开场4分钟即售出1100万件商品
2025年11月13日,中国 —— 近日,东南亚及巴西领航电商平台Shopee 11.11大促再掀购物狂潮,Shopee Live直播开场4分钟即售出1100万件商品
2025-11-14 11:31:00