• 我的订阅
  • 科技

deepmind研究:未知物体也能轻松识别分割

类别:科技 发布时间:2023-01-31 13:58:00 来源:浅语科技

从来没有见过的新物体,它也能进行很好地分割。

这是DeepMind研究出的一种新的学习框架:目标发现和表示网络(Objectdiscoveryandrepresentationnetworks,简称Odin)

deepmind研究:未知物体也能轻松识别分割

以往的自我监督学习(SSL)方法能够很好地描述整个大的场景,但是很难区分出单个的物体。

现在,Odin方法做到了,并且是在没有任何监督的情况下做到的。

区分出图像中的单个物体可不是很容易的事,它是怎么做到的呢?方法原理

能够很好地区分出图像中的各个物体,主要归功于Odin学习框架的“自我循环”。

Odin学习了两组协同工作的网络,分别是目标发现网络和目标表示网络。

目标发现网络以图像的一个裁剪部分作为输入,裁剪的部分应该包含图像的大部分区域,且这部分图像并没有在其他方面进行增强处理。

然后对输入图像生成的特征图进行聚类分析,根据不同的特征对图像中各个物体的进行分割。

deepmind研究:未知物体也能轻松识别分割

目标表示网络的输入视图是目标发现网络中所生成的分割图像。

视图输入之后,对它们分别进行随机预处理,包括翻转、模糊和点级颜色转换等。

这样就能够获得两组掩模,它们除了剪裁之外的差异,其他信息都和底层图像内容相同。

而后两个掩模会通过对比损失,进而学习能够更好地表示图像中物体的特征。

具体来说,就是通过对比检测,训练一个网络来识别不同目标物体的特征,同时还有许多来自其他不相干物体的“负面”特征。

然后,最大化不同掩模中同一目标物体的相似性,最小化不同目标物体之间的相似性,进而更好地进行分割以区别不同目标物体。

deepmind研究:未知物体也能轻松识别分割

与此同时,目标发现网络会定期根据目标表示网络的参数进行相应的更新。

最终的目的是确保这些对象级的特性在不同的视图中大致不变,换句话说就是将图像中的物体分隔开来。

那么Odin学习框架的效果究竟如何呢?能够很好地区分未知物体

Odin方法在场景分割时,没有先验知识的情况下迁移学习的性能也很强大。

首先,使用Odin方法在ImageNet数据集上进行预训练,然后评估其在COCO数据集以及PASCAL和Cityscapes语义分割上的效果。

已经知道目标物体,即获得先验知识的方法在进行场景分割时,效果要明显好于其他未获得先验知识的方法。

而Odin方法即使未获得先验知识,其效果也要优于获得先验知识的DetCon和ReLICv2。

deepmind研究:未知物体也能轻松识别分割

deepmind研究:未知物体也能轻松识别分割

除此之外,Odin方法不仅可以应用在ResNet模型中,还可以应用到更复杂的模型中,如SwimTransformer。

deepmind研究:未知物体也能轻松识别分割

在数据上,Odin框架学习的优势很明显,那在可视化的图像中,Odin的优势在何处体现了呢?

将使用Odin生成的分割图像与随机初始化的网络(第3列),ImageNet监督的网络(第4列)中获得的分割图像进行比较。

第3、4列都未能清晰地描绘出物体的边界,或者缺乏现实世界物体的一致性和局部性,而Odin生成的图像效果很明显要更好一些。

deepmind研究:未知物体也能轻松识别分割

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-01-31 15:45:36

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...述整个任务,而不会具体指明每张图片中需要分割的具体物体。例如,在伪装动物分割任务中,该研究仅提供 “camouflaged animal” 这样的任务描述,而不会告知不同图片
2024-11-05 09:49:00
量子雷达:洞察千里的“火眼金睛”
...性,通过对电磁场的微观量子和量子态操作与控制,实现物体探测、测量和成像的远程传感器系统。简单地说,量子雷达就是一种利用量子现象,进行目标状态感知和信息获取的特殊传感设备。曾有
2024-03-01 05:25:00
...,使用支持向量机和人工神经网络进行训练。Guo W等人将物体分割物体问题变为分类问题,通过一系列假设将图像中的不同像素进行标注——将像素分为植物和背景,并基于该标注数据提取不
2023-12-02 09:02:00
ACM TOG|仅通过手机拍照就可以对透明物体进行三维重建
...对于具有折射或透明材质的,乃至出现嵌套现象(即透明物体内部还有其他物体,内部物体也可以是透明的)的场景的重建,无论是隐式场方法还是传统方法都难以解决。诚然,已经有一些工作对透
2024-09-26 13:42:00
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...其他元素包括多语言字幕、OCR 处理、跨语言 VQA 和 VQG、物体感知 VQA 以及物体检测。虽然没有包括来自视频的任务或数据
2023-10-17 16:31:00
通过量子启发的相位成像方法揭示隐藏在噪声中的图像
...其强度,还在于其相位。有趣的是,如果你能够测量透明物体引入的光的相位延迟,它们就会变得可见。1953年,弗里茨·泽尼克(Frits Zernike)获得了诺贝尔奖,由于有可能
2024-01-02 10:01:00
突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景
...界依然是前沿科技的「无人区」。面对真实场景中复杂的物体运动和视角变化,3D、4D生成一直面临数据和模型设计的双重瓶颈。然而,一项令人振奋的突破即将改变这一现状!近日,新加坡国
2024-11-14 09:45:00
人类真的可以用脑电波控制物体吗?
...而,鲜为人知的是,随着科技的进步,人类用意念去操纵物体已不再停留在幻想层面。本文将带大家探索科技将带给我们的超能力——意识控制物质。我曾经阅读过一本故事书,名字早已遗忘。内容
2024-11-14 10:36:00
国泰君安证券:具身智能,人工智能的下一个浪潮
...以上行为才能代表它真正理解了该场景。因为从本质上,物体和场景的类别大多是由功能和任务来定义的,“我能用来干什么,那它是什么”,比如锤子不能叫木棍,锤子有它独特的行为属性。具身
2023-06-30 10:01:00
更多关于科技的资讯: