• 我的订阅
  • 科技

给人工智能装上一双“人的眼睛”

类别:科技 发布时间:2024-06-12 06:16:00 来源:每日看点快看

本文转自:中国科学报

■本报记者 陈彬

近年来,随着人工智能的飞速发展,以无人驾驶、具身智能等为代表的智能无人系统得到不断推广和应用。人们希望这些系统可以在现实世界中更加自如地活动,更加准确地给人类提供帮助。但要达到这一目的有一个前提,那就是这些智能无人系统能更真切地“看”到这个世界,并能够更准确、迅速地对周围环境变化作出反应。

换句话说,它们需要一双更加敏锐的“眼睛”。

不久前,清华大学精密仪器系类脑计算研究团队聚焦类脑视觉感知芯片技术,提出了一种基于视觉原语的互补双通路类脑视觉感知新范式。在此基础上,该团队成功研制出世界上首款类脑互补视觉芯片“天眸芯”,大大提升了人工智能的信息采集效率。

近日,该研究成果以封面文章形式发表于《自然》。

“鱼”与“熊掌”不可兼得

清华大学类脑计算研究团队成立于2013年。自成立之初,该团队便将发展人工通用智能作为科研目标。

“这个目标我们从来没有改变过,但路还要一步一步走。”团队成员、清华大学精密仪器系教授赵蓉告诉《中国科学报》。最初,他们想到人工通用智能首先需要对数据进行高效计算。团队经过多年刻苦攻关,于2019年成功研制出世界首款异构融合类脑芯片“天机芯”,这是该团队的成果第一次登上《自然》封面。

“天机芯”的研发成功,给人工通用智能提供了一个足够强大的“大脑”,但仅有“脑子”,而没有准确且及时的数据传入是不行的,人类对外界的信息采集,90%都依赖于视觉。于是,研究团队将目光对准了人工智能的视觉感知领域,他们想知道,目前的视觉芯片是否存在一些尚待解决的问题。

问题很快就被他们找到了。

“人工智能在复杂环境下的信息采集主要靠传感器完成。具体到视觉感知领域,几乎所有的传感器在采集信息时,都希望将目标区域内的所有信息‘一网打尽’,似乎信息收集越全,人工智能对周围环境的感知力越强。”受访时,团队带头人、清华大学精密仪器系教授施路平表示。

虽然现有的传感器可以凭借越来越高的分辨率海量地采集数据,但从传感器到数据终端的传输网络带宽是有限的。于是,数据的激增和网络的局限之间形成了一种明显的矛盾。

“这就像我们可以购买很多辆汽车,但道路不拓宽,这些汽车就会在道路上拥堵,无法快速到达目的地。”施路平说。

此外,与信息大量采集和大量传输相伴的,还有软硬件能耗的激增以及信息采集动态范围(最大可测光强与最小可测光强的比值)的限制。

“分辨率、速度、精度/动态范围,这三者就像‘鱼’和‘熊掌’一样,在传统技术条件下几乎不可能兼得,一方性能的提升会导致其余两方性能的下降,进而导致视觉出现失真、失效或高延迟的问题,严重影响系统的稳定性和安全性。”赵蓉说。

这个问题,施路平团队是如何解决的?

做两套视觉系统

据施路平介绍,现阶段发展人工通用智能的方法主要有两种,一种基于电脑思维,另一种基于人脑思维。两种方法各有优缺点,但都代表人脑处理信息的部分模式。

“在研发‘天机芯’时,我们最大的收获便是创造了一种将两种思维方式相互融合的类脑计算思维架构。”施路平说。

研究团队研发视觉芯片的出发点,同样来自将计算思维与人脑思维相结合。

赵蓉解释说,与机器类似,人类的视觉系统同样存在“信息量”与“带宽”不可兼得的问题,但在漫长的演化过程中,人类找到了该问题的最佳解决方式——双通路互补的视觉系统。

“人体的视觉细胞分为两类——视锥细胞和视杆细胞,这两类细胞具有不同的特点。”赵蓉说,视杆细胞拥有很高的感光度,对弱光反应灵敏,但只能提供粗糙的视觉质量,不能感受颜色;视锥细胞拥有较低的感光度,但可以提供较高的视觉质量,使我们看到颜色。大脑通过功能互补的双通路进行视觉信息处理,其中一个通路主要负责处理颜色、细节等高精度信息,但处理速度相对较慢,另一个通路主要负责处理突发事件,能够作出快速反应,但精度不高。

“当一个足球快速向你飞来时,你会迅速发觉有物体运动,但完全不会注意到足球的任何细节;等足球停止运动,足球的所有细节都会呈现在你眼前。”赵蓉说,正是双通路视觉系统的相互配合,才使得人眼可以既准确又快速地观察到物体,并在极端场景下完成信息处理并进行应对。

施路平团队所提出的类脑视觉感知新范式便借鉴了人类视觉系统这一基本原理。

具体而言,他们将开放世界的视觉信息拆解为不同表达类型,并通过对这些信息的组合,模仿人类视觉系统的特征,形成两条优势互补、信息完备的视觉感知通路。

“这套系统首先会模仿人眼,将收集到的周围场景分解成很多元素,如物体运动、轮廓、色彩以及不同区域的对比度等,之后模仿人脑的处理机制,将这些信息分配到不同的‘处理通路’中,这就像工厂的多条流水线。”赵蓉说,系统再通过模仿人脑响应机制,对相关信息进行连接和协同,最终实现信息的高效、稳定传输。

“这相当于给机器人装上了一双人的眼睛。”赵蓉说。

未完成的工作

基于上述新范式,施路平团队几经攻关,成功研制出世界首款类脑互补视觉芯片——“天眸芯”。

据介绍,该芯片可在极低的带宽(降低90%)和功耗代价下,实现每秒10000帧的高速、10比特的高精度、130分贝的高动态范围的视觉信息采集,不仅突破了传统视觉感知范式的性能瓶颈,而且能够高效应对各种极端场景,确保系统的稳定性和安全性。

在“天眸芯”的研发基础上,团队还自主设计了高性能软件和算法,并在开放环境车载平台上进行了性能验证。在多种极端场景下,该系统均实现了低延迟、高性能的实时感知推理。

据介绍,研究人员还开发了一套集成“天眸芯”的汽车驾驶感知系统,以评估其在开放道路上行驶时面对极端情况——如强光干扰、光线强烈变化、突然出现异常物体时的反应。结果表明,“天眸芯”可以有效适应极端光环境并提供先进的多级感知能力。

“‘天眸芯’的成功研制,不仅为智能革命的发展提供了强大的技术支持,还为自动驾驶、具身智能等重要应用开辟了新道路。”施路平表示,将这一科研成果进一步推向应用,是目前该团队的一个重要工作。

赵蓉告诉《中国科学报》,一项技术与实际应用相结合,甚至产生商业价值,才称得上真正完成了研发的全流程。接下来,团队将推动“天眸芯”的落地应用。

同时,该团队也在开展相关工作,以将“天眸芯”与“天机芯”进行结合,并最终将其成功“植入”机器人的身体。“人工通用智能肯定是要在机器人身上展现的。”赵蓉说。

当然,在机器人视觉传输领域,现有的“天眸芯”虽然在“类人”的层面有了很大进步,但跟真正的人眼视觉系统相比仍有很大差距。弥补这些差距将是该团队的重要工作。

“总之,要实现团队成立之初立下的目标,我们还有太多工作要做。”施路平说。

相关论文信息:

https://doi.org/10.1038/s41586-024-07358-4

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-12 09:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

新加坡国立大学研发出人工智能驱动的“眼睛”AiSee!让视障人士能够“看到”物体
瞻观前沿随着人工智能技术的不断发展,越来越多的创新产品涌现出来,为有特殊需求的人群提供更多便利和帮助。新加坡国立大学计算机学院 (NUS Computer) 研究人员推出了一款名
2024-02-07 15:33:00
人工智能+工业!看机器人如何“花式”干活?
...新一轮科技革命和产业变革深入发展,新一代信息技术、人工智能、新能源、新材料、高端装备等领域前沿性颠覆性技术群体性突破,国内外都在抢先谋划布局。在全省工业和信息化工作会议上,省
2025-01-07 20:55:00
...发,不是一件容易的事。眼睛本质上是大脑的延伸,当前人工智能在模拟大脑前额叶功能上虽有成果,但底层智能的构建依旧困难重重。为解决这一问题,阿尔勃特从清华大学以及国外知名院校和研
2025-09-10 08:27:00
AI技术给机器装上“眼睛”
...钱天昊进行了现场演示。传感器通过与物联网、云计算、人工智能等技术深度融合,毫秒之间就能把检测结果传递到显示屏上——让工业制造的过程更加智能和精确。“目前,我们生产的工业传感器
2024-05-20 03:44:00
江苏南京:以“智”赋“能”,南京AI军团点亮智能制造
...模效率低的问题。我们的AI智能重建技术采用激光扫描和人工智能生成三维模型的技术,逐步替代传统工程师的人工投入进行作业。”杨一曦介绍,目前的技术水平已经可以帮助企业降低50%的
2025-11-10 08:00:00
给眼睛装上太阳能!复旦团队让盲人看到希望之光
...,同时推动与光电转换、成像技术、信息科学、微电子、人工智能算法等领域的交叉融合,探索智能化感光元件的临床应用。
2024-06-13 10:55:00
全球首台人工智能汽车机器人交付
...报“眼睛”可看清障碍物 还能“类人级”聊天全球首台人工智能汽车机器人交付长江日报讯(记者雷心蕊 涂静 通讯员杨蓓怡)10月30日,“2023集度|极越生态伙伴大会”在武汉正式
2023-10-31 04:46:00
焦点访谈丨AI虚拟调度员、AI兽医助手……人工智能赋能产业、智绘未来!
最近,人工智能再度成为人们热议的话题。今年两会就提出,持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来,支持大模型广泛应用,大力发展智能网联新能源汽车、人工
2025-03-14 10:51:00
地表最强人形机器人来了!能聊天,能进厂干活,一天工作20小时
...伟达GTC上站着来自全球最先进的人形机器人,到今年世界人工智能大会上炫酷的机器人矩阵,再到如今Figure AI的新品炸场,黄仁勋今年年初的预言,逐渐成真——“机器人时代已经
2024-08-07 13:54:00
更多关于科技的资讯:
■陈诗诺摘要:随着健康中国战略的深入推进和数字技术的快速发展,健康险正从传统的风险补偿向健康管理服务延伸。然而,产品同质化严重
2026-01-06 04:17:00
重磅首发!有道AI答疑笔推出视频讲解,定义学习可视化新标准
近日,网易有道旗下AI原生学习硬件“有道AI答疑笔Space X”完成重要升级,正式推出国内首个高质量的AI“视频答疑”功能
2026-01-05 17:36:00
苏笑聪新书《情境的智慧》即将出版:探寻情境赋能之道
近日,情境教育理论研究及实践家、羽翼天成儿童情境教育创始人苏笑聪女士宣布,其“情境三部曲”的收官之作——《情境的智慧》即将正式出版
2026-01-05 17:36:00
"哪些中国企业创新做得不错?"——这个问题的答案,正在被一批勇于突破、持续创新的中国企业不断刷新。进入2025年,联想集团的创新势头不减
2026-01-05 17:37:00
2025年百城“盒区房”消费图景:轻悦己、品质消费、夜经济氛围拉满
中国消费者报报道(记者桑雪骐)1月5日,《2025年百城“盒区房”消费力报告》(以下简称《报告》)发布,结合2025年盒马在多地门店及入驻商圈动态
2026-01-05 18:10:00
菌安天下:百吨位自然发酵技术全球领先品牌的科技解码
在全球农业面临资源约束与环境压力的双重挑战下,以微生物技术为核心的生物农业正成为引领产业变革的关键力量。在这场绿色革命中
2026-01-05 19:23:00
中荷人寿荣获“杰出寿险公司”奖
近日,由金融界主办的“启航•2025金融年会”暨金智奖颁奖盛典在北京举行。中荷人寿保险有限公司凭借其卓越的经营管理能力
2026-01-05 19:24:00
菌安天下:铸就液体微生物菌剂全国销量第一的品质标杆品牌
在当前中国农业向绿色、可持续发展转型的宏大背景下,农资市场的竞争日益激烈,而真正的“好产品”——那些能让种植户主动复购
2026-01-05 19:27:00
中国消费者报北京讯(记者桑雪骐)空调业的“铜铝之争”由来已久,近段时间再次成为热点话题。1月4日,中国家用电器协会发出倡议
2026-01-05 18:10:00
书亦烧仙草连获双奖:交付给新茶饮行业的长期主义答卷
近日,新茶饮品牌书亦烧仙草接连将“2025食品饮料行业创新案例”与“质量金盾·服务样本”两项行业奖收入囊中。两项奖项分别指向“市场创新”与“品质体系”这两个关键维度
2026-01-05 17:06:00
惠依近日,“Slop”被《韦氏词典》列入2025年度热词,被定义为“通常由人工智能(AI)批量生成的低质量数字内容”。据专家溯源
2026-01-05 14:05:00
全面解读一嗨租车八大优势 站内取还创服务体验新高度
在租车行业,真正的竞争力,藏在看不见的后台体系里:是否统一管理?标准能否落地?出了问题谁来负责?这些问题的答案,决定了一家租车企业的服务成色
2026-01-05 14:05:00
新青年消费崛起,大窑饮品满足“理性+感性”双重决策
花钱主打“爱你老己”、倡导“隐形享受主义”……在当今消费市场中,新青年群体已成为不可忽视的力量。《2025新青年消费趋势报告》揭示
2026-01-05 14:05:00
数智赋能文旅 1314・爱购节情感IP启幕文旅融合新范式
1月4日,“2026 数字经济助力文旅融合新业态创新交流会”在京成功举办,以“提升新质消费 创新业态场景”为主题,共探“数智+文旅+情感消费”融合之道
2026-01-05 14:35:00
温医大眼视光胡亮/吕帆教授团队成功研发智能手机眨眼训练应用程序,开辟干眼症治疗新路径
近日,眼和视光疾病国家临床医学研究中心、国家眼视光工程技术研究中心、温州医科大学附属眼视光医院胡亮/吕帆教授团队的一项重要研究成果在国际高质量期刊《自然》杂志旗下《数字医学》(npj Digital Medicine)在线发表
2026-01-05 15:46:00