• 我的订阅
  • 科技

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

类别:科技 发布时间:2024-11-22 14:05:00 来源:卓越科技

两天前,知名AR厂商Rokid发布了新一代AR眼镜——RokidGlasses,通过摄像头、多模态大模型以及(玻璃衍射)光波导等技术,在一定程度上让AR眼镜实现了对真实世界的感知与理解,以及对用户的协同与展现。

然而就当下来说,AI或者说视觉大模型对真实世界的理解还远远不够,更多还是对二维照片的物体识别,很难像人类一样具备空间理解能力,也根本无法准确描述物体与物体、物体与人之间的空间关系。

而这个问题的答案,或许还是要从大模型技术中寻找解法。

稍早前,《PokémonGo》开发商Niantic对外宣布正在开发「地理空间大模型」(LargeGeospatialModel,简称LGM),将利用大规模机器学习来理解真实世界的空间,借助LGM模型实现「空间智能」。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

LGM模型训练,图/Niantic用全球玩家数据打造的「地理空间大模型」

正如Niantic在新闻稿中提到的,即使是当今最先进的AI模型也难以可视化和推断场景中的缺失部分,或从新的角度想象一个地方。而在根本上,Niantic认为借助大语言模型训练的方式,我们已经能让AI实现比拟甚至超越人类空间理解能力的「空间智能」。

野心背后,Niantic的另一份底气在于,作为《PokémonGo》《Ingress》开发商,Niantic早就手握全球无数玩家贡献的海量真实影像和地图数据,并在过去五年中开发视觉定位系统(VPS),在手机上实现根据单个图像在3D地图中确定用户的方位。

事实上,2021年Niantic还发布过一项名为ManyDepth的技术,能够通过单个手机摄像头直接创建3D地图,利用机器学习将没有深度信息的二维图像转化为带有深度信息的三维图像,并且不依赖LiDAR或者其他深度传感器。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

图/Niantic

而作为Niantic视觉定位系统的一部分,LGM模型目前已经训练了超过5000万个神经网络,拥有超过150万亿个参数,能够在超过100万个位置运行。Niantic首席科学家VictorPrisacariu还表示:

「利用我们的用户在玩Ingress和PokémonGo等游戏时上传的数据,我们打造了世界的高保真3D地图,其中包括3D几何形状(或事物的形状)和语义理解。」

最终,LGM模型的目标是在全球范围内实现对地理空间的共同理解,即便是那些没有被玩家扫描过的地方。

但LGM模型意义不仅是让设备「看懂」真实环境,提供精准的空间定位。更重要的是,只有让计算机能够更准确、高效地感知和理解物理空间,才能更深刻地改变人与机器之间基于物理世界的交互方式,进而推动AR眼镜以及智能机器人真正走进我们的生活。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

左边是RokidGlasses,右边是特斯拉擎天柱,图/Rokid、特斯拉

不过具体到AR眼镜上,LGM模型的推出真的会如人们期待的那样,加速AR眼镜的普及吗?甚至成为AR行业的「一脚地板油」?这不是一个容易解答的问题。地理空间大模型,AR版的「高精地图」?

在AR眼镜中,准确的空间定位一直是重中之重,这一点相信早已不言而喻。问题在于,现行的SLAM(同步定位与建图)空间定位技术就像一位即兴作画的画家:通过摄像头等传感器,实时描绘周围环境的地图并确定自身的位置。

但要用这种「即看即建」的方式实现准确的空间定位,不仅依赖传感器支持,往往还需要较高的性能与续航开销,对于内部空间「寸土寸金」的AR眼镜来说,始终是不小的压力。AR厂商不是没想过新的解决方案,比如RokidARStudio上就实现了基于单目摄像头的空间定位和手势识别,也只是降低了硬件门槛和成本。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

RokidARStudio,图/Rokid

而与之相对,LGM模型和SLAM技术可以理解为AR眼镜的「地图」和「指南针」:LGM提供了一幅全局性的高精度地图,为设备提供宏观层面的环境理解;SLAM则像指南针,帮助设备在未知或动态环境中快速调整和适应。

通过构建了一套全球性的高精度3D地图,LGM模型能够提供详尽的地理空间信息。对于AR眼镜来说,这种预先构建的地图意味着在已知环境中无需从零开始建图,而是可以直接利用LGM提供的全局地图进行精准定位,理论上可以在不影响准确性的前提下,大幅削减性能开销,尤其在室外场景。

想象一下,当你在一个陌生的城市中寻找餐馆,AR眼镜让导航箭头更准确地贴合地面,更精确地指向餐馆的入口,而不是像过去那样悬浮在半空,只能提供粗略的方向。这种视觉上的准确性不仅提高了便利性,也增强了用户对AR眼镜的信任感。

另一方面,LGM模型对空间的「语义理解」,对于AR眼镜的意义不只是识别环境,还在于「理解」环境。与SLAM只是绘制几何地图不同,LGM模型还能通过语义理解为空间中的物体赋予了具体意义,让AR眼镜能够理解环境的上下文,将虚拟的3D物体合理地放置在真实空间的方位中。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

任天堂与Niantic合作的《皮克敏》AR手游,图/Niantic

这一点也与现有视觉模型依赖二维图像识别技术不同,视觉模型更多只能识别出眼前是「路」还是「树」,却无法理解这些物体在空间中的位置,自然也无从谈起虚拟内容在真实空间的合理放置。

不过众所周知,《PokémonGo》并未进入中国,中国市场也始终没有出现一款能够进入大众视野的AR+LBS游戏。类似LGM的地理空间大模型,在中国还没有出现成长的土壤。

但视觉大模型其实也有潜力从二维平面的物体识别进化到三维空间的理解,具备「空间智能」,甚至是视频生成模型也有可能。就像OpenAISora出现之初,以360创始人周鸿祎为代表的一部分人都认为Sora不仅是视频生成模型,还是能够最终理解物理世界的「世界模型」。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

Sora,图/OpenAI

再有,Niantic的LGM目前仍在开发中,理论上的潜力是一方面,实际上的表现则是另一方面,还很难断言它的未来。AI大模型改变AR眼镜,一切才刚开始

在之前的报道,雷科技多次提到一个观点:最近一年多智能眼镜的关键转变在于大模型带来的自然理解能力大升级,带来了人机语音交互的质变,这是交互方式有限的智能眼镜能够爆发的前提条件。

这一点对于AR眼镜其实亦然。虽然包括Rokid、雷鸟创新都在尝试各种交互方式,比如Rokid基于单目摄像头的手势交互,雷鸟创新基于智能戒指的交互,但实际上主流产品线受限于性能、体验和成本等因素,语音和触摸交互,才是核心的交互方式。

Pokémon Go开发地理空间大模型,AR眼镜的高精地图?

雷鸟X2,图/雷鸟创新

从这个角度看,AI语音交互带来的质变也就不言自明了,可以明显改善AR眼镜在人机交互方式上的短板。而与此同时,大模型也在带来计算机视觉能力上的「基因突变」,决定着AR眼镜的未来方向。

诚然,目前AI视觉的价值才刚刚崭露头脚,比如基于周围环境的实时问答、直接翻译外文进行播报或文本呈现等,都能做到比以往更低的成本、更好的体验。另外,地理空间大模型、能够理解世界的视频生成模型,对于AR眼镜来说也还未真正达到可用。

但不管从交互体验,还是AR眼镜的「减重」来看,基于摄像头的AI视觉(端云混合)在理论上都有更高的潜力,不仅能降低空间交互的复杂度和门槛,也能减少传感器和传统计算开销,从而做到重量和成本的降低、续航的提升。

一言以蔽之,大模型改变AR眼镜的旅程,还远没有走到终点。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-22 18:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

南京为自动驾驶绘制高精地图厘米精度数据日更,“车路云”智慧协同南报网讯(记者何钢)开车上路,打开地图导航已是驾驶人的习惯。而自动驾驶时代,无需人员操控的车辆如何识别道路、自由穿梭
2024-09-02 07:39:00
持续科技创新 高德亮相2024中国测绘地理信息科技年会
...会在郑州召开。作为国内领先的地图厂商,高德地图凭借高精度高动态导航地图技术应用受邀参会。本届年会由中国测绘学会主办,以“拥抱新质生产力、促进测绘地理信息高质量发展”为主题。会
2024-10-16 19:29:00
...数字底图系统”名列其中,该系统也是我省首个高速公路高精地图“数字底座”平台。陕西交控运营公路智慧数字底图是一种依托地理信息系统(GIS)与交通大数据,采用无人机航空摄影技术获
2024-04-16 01:40:00
地理信息完整产业链初步形成
...四周,时空数据服务早已深度融入生活的方方面面。北斗高精度定位早已成为车载导航、手机、穿戴设备等一系列智能产品的标配。截至2023年底,中国在轨运行的北斗导航卫星增至48颗,全
2024-10-10 05:36:00
赋能城市精细治理 精准服务
...动驾驶(高度自动驾驶)。记者了解到,这辆巴士配备了高精度地图、高精度定位模组、多传感器组合以及顶尖的自动驾驶系统,这些高科技装备的精妙协作,使得车辆能够实时感知周围环境,自动
2024-05-28 04:18:00
...伏,但图商们不打算坐以待毙。在智能驾驶的感知当中,高精度地图一度不可或缺,曾被称作为“拐杖”“遥感视距”等等,但似乎一夜之间,高精地图开始被“人人喊打”,轻地图甚至去地图的共
2023-06-26 14:15:00
实景三维 大有可为 飞燕遥感打造时空基础底座
...地理信息数据,特别是基于地理实体的全空间、全要素、高精度的二三维一体的地理信息需求越来越旺盛。近两年来,飞燕遥感先后承接了江苏、安徽、浙江、湖北、福建、贵州及香港等地超1万平
2023-05-11 23:00:00
为月球“画像”,难度有多高
...高肖雅文视觉中国供图 近日,我国正式发布了全球首套高精度月球地质图集。这套地图集基于嫦娥工程科学探测的数据进行绘制,是目前精度最高的全月地质“写真集”,可以说,月球从未如此清
2024-05-13 05:59:00
大模型下 自动驾驶企业开始取经特斯拉
...部分玩家则朝着激光雷达的方向一路前行。尤其是在发现高精地图可为自动驾驶提供超视距信息后,“激光雷达等多传感器融合+高精地图”的技术路线更是成为大部分企业的普遍选择,以寻求兼顾
2023-05-18 16:32:00
更多关于科技的资讯:
汇川第二届酱香咖啡生活文化周延续精彩
多彩贵州网讯11月1日,酱咖“遵”有味·“汇”爱这一杯——中国咖啡冲煮大赛西部决赛暨汇川第二届酱香咖啡生活文化周活动第二天
2025-11-03 18:11:00
中拉如何以创新谋合作?听企业这样说——
大河网讯 向新向智,共赢未来。11月3日,第十八届中国—拉美企业家高峰会在郑州开幕。以创新合作谋长远,中拉合作将如何开辟出广阔且极具吸引力的“新蓝海”
2025-11-03 18:16:00
香港金融科技周开幕 蚂蚁集团井贤栋:以香港为支点,加速全球化发展
11月3日,2025年香港金融科技周开幕。蚂蚁集团董事长井贤栋在主论坛上表示,香港已成为蚂蚁集团及旗下多家公司的全球化战略支点
2025-11-03 18:46:00
中新经纬11月3日电 (龚宸芫)中新经纬获悉,香港大学机械工程学院与广州沃特海默新材料科技有限公司(下称沃特海默)近日签署合作协议
2025-11-03 19:11:00
破局香港高价蟹难题 京东超级供应链打造“产地-门店”空运直达新模式
今秋,香港“蟹友”有了省心又省钱购蟹的新选择。近日,恰逢京东11.11全球好物节,这也是香港佳宝超市加入京东后首次参与这一年度消费盛事
2025-11-03 20:49:00
2025年培育钻定制品牌榜出炉!6大TOP品牌工艺与口碑深度全解析
在可持续发展理念深入人心的今天,培育钻石行业正迎来前所未有的发展机遇。据《2024-2025全球培育钻石珠宝消费报告》数据显示
2025-11-03 21:26:00
前瞻布局未来产业 新奥以智能助力高质量发展
河北新闻网讯(张新)日前,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布,将“构建以先进制造业为骨干的现代化产业体系”列为核心任务之一
2025-11-03 18:04:00
中央音乐学院发布音乐脑机接口“央音一号”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)音乐脑机接口“央音一号”,近日在中央音乐学院发布。中央音乐学院音乐人工智能与音乐信息科技系主任李小兵表示
2025-11-03 16:52:00
11.11提前抢!三联家电折扣让利,家电焕新正当时
鲁网11月3日讯随着11.11购物节的脚步日益临近,全国家电消费市场热度持续攀升,山东地区更是提前进入 “焕新倒计时”
2025-11-03 15:52:00
安徽牧羊人可持续时尚工业园项目开工 致力打造羊毛针织行业的佼佼者
大皖新闻讯 11月3日,安徽牧羊人可持续时尚工业园项目开工奠基仪式举行。项目建成后,将形成年产1000万件成衣,7200吨纺纱
2025-11-03 16:11:00
“景德镇鸡排哥”用一碗香辣鸡排撬动全网关注,这座千年瓷都再次被推上流量风口。草根摊主的日常片段在网络掀起打卡热潮,小众街巷因一条短视频迎来客流井喷
2025-11-03 12:25:00
乘AI之势,筑电子产业之基,CPCA Show Plus 2025 圆满闭幕,2026再相见!
2025年10月28日-30日,电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会(以下简称:CPCA Show Plus)在深圳国际会展中心(宝安)盛大举办
2025-11-03 12:43:00
培育钻值得购买吗?超全选购攻略一篇搞定,附头部品牌深度测评
当越来越多的年轻人开始琢磨“如何高性价比的结个婚”,培育钻石凭借着价格优势、环保理念,正成为暗潮涌动的钻戒市场的新宠。据统计
2025-11-03 12:45:00
未来,AI有望打造口感逼真的植物蛋白
大河网讯 “人工智能(AI)正以前所未有的速度加速食品创新,它不仅能打造口感逼真的植物蛋白、通过文本生成全新食品配方,还能辅助设计个性化营养食品
2025-11-03 13:10:00
2025 年,Facebook 依托 Meta 生态的 29.8 亿全球月活用户(Statista 数据),仍是企业海外拓客的关键阵地
2025-11-03 12:46:00