剑桥大学开源PRAM:位置识别任意地点模型,用于高效的视觉定位

科技视觉大放送 2024-09-27 04:26:54

以下内容来自小六的机器人AI学习圈(6年积累,全国最大的机器人SLAM交流社区,为SLAM行业从业者提供从入门、学习、交流、求职、线下链接、合作、咨询、答疑等一系列的服务)知识星球每日更新内容

【PRAM: Place Recognition Anywhere Model for Efficient Visual Localization】

文章链接:[2404.07785] PRAM: Place Recognition Anywhere Mode...

项目主页: SOCIAL MEDIA TITLE TAG

人类通过首先识别定义在特定物体上的地标及其空间关系,然后通过将识别物体的详细结构与记忆中的结构对齐来验证位置,从而在已知环境中有效地定位自己。受此启发,我们提出了位置识别任意地点模型( PRAM ),以像人类一样高效地执行视觉定位。PRAM由两个主要部分组成- -识别和配准。具体来说,首先,采用自监督的以地图为中心的地标定义策略,使室内或室外场景中的地方都可以作为独特的地标。

然后,将从图像中提取的稀疏关键点作为基于Transformer的深度神经网络的输入,用于地标识别;这些关键点使得PRAM能够以较高的时间和内存效率识别数百个地标。关键点和识别的地标标签进一步用于查询图像和3D地标地图之间的配准。与以往的分层方法不同,PRAM舍弃了全局和局部描述符,并减少了90 %以上的存储。 由于PRAM使用了识别和路标验证来分别代替全局参考搜索和穷举匹配,因此它的运行速度比之前最先进的方法快2.4倍。此外,PRAM为视觉定位开辟了新的方向,包括多模态定位、以地图为中心的特征学习和分层场景坐标回归。

推荐阅读

3D高斯泼溅 为什么能一直火?有哪些应用场景?香港大学开源的这个激光雷达惯性SLAM,太强了!一招掌握3DGS基础视觉三维重建!深度计算+点云处理+网格重建优化+纹理贴图!谷歌这个SLAM开源方案,造福了整个机器人行业!重大变革!NeRF和3D高斯喷溅如何重塑SLAM?发顶会顶刊不再难!多传感器融合SLAM、生成式AI、3DGS、NeRF、标定等方向这个开源框架,造福了无数卫星定位研究者和初创公司!BOSS:用了机器人仿真,立省几十万自动驾驶中的GNSS、RTK到底多重要?太强了!世界第一款开源的自动驾驶一体化框架Autoware!(附交流群)如何从零开始搭一套自己的SLAM系统?17讲全部上线!全网首个详解深度学习特征开源算法SuperPoint和SuperGlue(附交流群)最炸裂的机器人AI技术教程都在这了!
0 阅读:0

科技视觉大放送

简介:感谢大家的关注