当前位置: 首页 > news >正文

NGD-SLAM(一)

到最近几年,动态场景的处理才变成可能,这也是本文的一个亮点之一,当然你要说这篇论文有多创新那也算不上,估计这样的论文放到CVPR大概率不会被收纳,因为从学术研究的角度看,这篇论文还不够新颖,那这里为什么着重介绍这篇论文那?因为它在实际项目运用上很有价值。我们常常会看到很多新技术在研究领域获得了很高的评价,但在实际项目中却乏人问津。这实际上是科学研究和实际项目遵循两套完全不同的哲学。科学研究强调新颖性,创新性,而不强调实用价值,实际项目则常常只有有限的资源和条件,创新的技术需要做出很多取舍。在这个到处都在鼓吹“算力”的年代,新技术不使用GPU,多少有点另类,但这也突出了这个论文在非常有限的硬件条件下做出了不错的效果,这也是我非常喜欢这篇论文的原因。

下面讲解这篇论文如何实现在不使用GPU的情况下处理动态场景的问题。

3

论文主要通过两个方面实现上述目的:第一,关于动态场景部分遮罩的生成,因为论文使用YOLO模型进行动态物体的识别,这是个相对比较耗时的操作,所以这里使用上一帧生成的动态物体的包围盒,避免每一帧都进行YOLO计算带来的资源消耗。第二,在做相机跟踪的时候,对于非关键桢采用光流的方法,而对于关键桢使用ORB特征点的方式进行计算,这样可以减少计算量,并且有很好的鲁棒性。

4

如图所示,在DETECTION阶段YOLO模型生产动态物体的包围盒,在SEGMENTATION阶段利用深度信息对包围盒进行细化的分割,SAMPLING对于分割的区域进行15*15的点提取,TRACKING则使用Lucas-Kanade光流法对这些特征点进行跟踪,CLUSTERING对outlier进行剔除,最后一步PREDICTION完成遮罩的预测。

5

对比光流法和ORB特征跟踪法的区别。对于上一帧没出现而当前帧出现的动态人物,ORB不能正确的识别。

最后谈一下该论文的一些限制。论文在计算遮罩的时候需要用到深度信息,所以使用的图片源为RGB-D,这就需要对于单目相机或者立体

http://www.cnnetsun.cn/news/64276.html

相关文章:

  • AI产品经理必读:构建智能交互系统的终极指南!
  • 谷歌浏览器性能面板使用指南
  • 警惕绿色积分陷阱!一分钟揭秘消费骗局
  • 13、CentOS网络管理全攻略
  • 技术实践:用大模型平台重构医疗数据分析Pipeline
  • 智元AGIBOT荣登具身智能机器人技术研发排行榜TOP1
  • Gitee vs GitHub 2025深度评测:国产代码托管平台的崛起与超越
  • JVM 安全与沙箱深度解析
  • t-SNE快速降维算法详解与实现
  • Python编程入门从零开始掌握基础语法一
  • 20、BusyBox:嵌入式系统的强大工具
  • python 生成psd文件
  • 25、Linux内核调试全攻略:挑战与解决方案
  • 30、Linux移植与实时性:从定制平台到实时系统的深入解析
  • 【界面案例】火语言RPA读取Excel文件,循环写入界面表格
  • 【JAVA进阶】鸿蒙开发与SpringBoot深度融合:从接口设计到服务部署全解析
  • [C#][winform]基于yolov11的水下目标检测系统C#源码+onnx模型+评估指标曲线+精美GUI界面
  • 【睿擎派】云端一体,多种通信协议构建机械臂运动控制系统
  • 4.1用户空间RTOSAPI
  • 11、嵌入式Linux开发:内核日志存储、追踪系统与设备树管理
  • 17、Yocto项目软件层与应用开发全解析
  • 宁波紧固件产业集群的外向型制造与装备升级路径
  • AI赋能工业4.0:数据堂一站式数据服务加速制造智能化落地
  • 如何打造吸睛动态头像?GIF动态头像制作指南
  • 评估AI的终极答案:LLM-As-a-Judge!AI时代,谁来评判AI?答案是AI自己!
  • Meta封闭技术大门:开源先锋为何倒向闭源阵营?
  • HRNet:深度高分辨率表示学习用于人体姿态估计-k学长深度学习专栏
  • Miniconda环境隔离机制揭秘:保障模型复现精准性
  • 颠覆认知:实测6款AI工具,论文写作“专用”比“通用”强在哪?
  • 【自动控制】自动控制原理中,最小相位系统是什么?