目前学什么专业的人在搞SLAM?各有什么优势?

article/2025/10/3 20:22:37

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

原提问:

目前学什么专业的人在搞SLAM?如需要哪些专业知识,或者找什么专业的人合作?

7c032d8d78fc1e39a8fcf2430272b4e1.png

李雅不诺夫

一些比较牛掰的论文后面都有作者简介的,他们大都是计算机/电子信息专业出身;其实到现在觉得搞SLAM最需要的是数学和编程。

本科机械专业,跨专业跨了几条街转到SLAM里头,目前直博第一年,科研弱鸡一枚,还没什么成果,正在论文→程序→教材无限循环中,想在这儿吐槽一下最近的感受。同时也希望能能够被各路大佬吐槽,批评指正。

本科学过的各种三维建模和机械制图和设计什么的已经彻底用不上了,机械专业也没有太多关于编程的课程,好在自己参加过机器人比赛,写过一点点STM32的程序,至少现在上手编程的时候没那么痛苦。刚刚入学的时候白白浪费了一个学期,硕士阶段的课多到爆炸而且水的一批,根本就没有和自己研究方向相关的课程(除了数学课)。我们组每一届的人的研究方向都不一样,好在网上有不少资源。

编程方面:一开始进课题组的时候,看到有两台turtlebot2,就决定了做移动机器人方向,而且SLAM在移动机器人已经得到很重要的应用。有个硬件平台,更加容易上手。于是从零开始学ubuntu和ROS,在这儿强行安利中科院在慕课网上的ROS教程,跟着做一遍至少能懂得基本的操作了。roslaunch和rosrun别人的程序发现能运行,挺dei啊。可是当自己写起来发现啥都不会,就比如launch文件和.cpp文件之间的变量是怎么关联的,编译不过常常不是因为C++语法的问题而是因为CmakeLists.txt文件,等等。

总之对编程方面的感受就是:现在的ROS教程无非就是给package教你怎么敲命令行,看别人的程序不代表一定真的理解了,一定要亲自动手自己写程序实现一些功能。很多细节和工程技巧是书本上不会写的,需要自己各种百度谷歌慢慢解决,熟能生巧。

去年年底开始看《十四讲》,花一个多月过了一遍。秉承实践出真知的学习方式,从这学期开始用了将近两个月在ROS里写了一个前端,借鉴了第九章 的project,并在rviz里进行可视化,实现了点云的实时显示和里程计信息的可视化。只有一个前端,一点都不鲁棒,很飘。现在确实有了很多很好的开源代码,比如ORB-SLAM,VINS,运行过ORB-SLAM,真的稳得一批。但我觉得自己还是应该尝试着写一个,要不然搬运别人的代码也会有点无从下手,而且总有一天需要自己动手写一个工程。

相关的知识学习方面,除了《十四讲》,还买了《概率机器人》、《机器人学中的状态估计》、《Factor Graphs for Robot Perception》等等,我觉得把那些书都过一遍不现实,都是当工具书来看的。记得导师说过“读PhD不只是学习”;也在看最近两年的论文,还有一些经典的文章和review,不只是SLAM,还有导航和路径规划、人机交互、机器学习在机器人上的应用等等。现在觉得学习和科研就像控制系统有反馈环节,也像SLAM系统有回环检测,需要不停地返回来从教材和论文里寻找答案。我的课题是移动机器人,SLAM是其中一个重要的部分。

目前个人认为,单纯的SLAM,个人在前端(视觉里程计或者tracking thread)方面没找到可以灌水的坑,想基于一些比较稳定的前端进行进一步的研究,比如后端、回环,或者建图之后怎么进行导航、规划;怎么让机器人自动探索环境自主建图;移动机器人上如果装有机械手怎么配合SLAM进行抓取;因子图、强化学习和凸优化等等数学工具能解决什么样的问题...还有好多。但我想还是需要看一些文章再开干。

最后真的机器感激,在SLAM的科普和教学方面,无偿写博客,无私开源的大佬们,还有泡泡机器人公众号(编者注:还有计算机视觉life 公众号哦),等等

计算机视觉life

可以说各个专业都有吧,当然大部分是理工科的。我们从零开始学习slam知识星球里做过大家的背景调查:

我选择了几个放出来,大家先看图

d1b2359357e1a789253b1866586ea434.png c6a0377aff09010cb9d6cef336ede50f.png d66fe5b3d8a5d4ae6ef6e111bbf2a9c1.png aaae5ad4355174b7cf2ba83246c5b5af.png

因为我们也有一个实名交流群。所以对成员背景比较了解,机械,自动化,通信,计算机的最多,也有其他偏门专业(比如核物理,土木,化学)跨行学的,所以学习slam底线差不多就是理工科专业,有一定c/c++语言编程基础,学过基本的大学数学,计算机知识就可以。

至于优势,

数学专业优势在于理论推导,因为slam李群李代数,优化部分还是需要一点数学基础,当然现在很多库都写好了,只是应用不需要深究。

计算机软件专业优势在于编程能力强,slam是应用科学,好的编程能力能够快速读懂,编写代码。

机械自动化专业优势在涉及到机器人相关硬件时有较好的动手能力,快速解决硬件问题。

当然这些优势并不是绝对的,我认识偏门专业自学slam还学的很透的大佬。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

47e7b0edb686efea2315234a4c19bed1.png

87c4427160851d473a5cbf4d0a2309e8.png


http://chatgpt.dhexx.cn/article/liRokO2e.shtml

相关文章

opencv-python学习笔记(十):实现人脸特征转换

引言 本次实验来自实验楼,而实验楼代码的出处为如下GitHub链接,加上一些自己的理解与说明,总结成本文笔记。 https://github.com/matthewearl/faceswap 所需环境 Dlib是一个高级的机器学习库,它是为解决复杂的现实世界问题而创…

ROS会议 ROSCon 2017

----ROSCon2012-2017----来源链接:https://roscon.ros.org 具体讲座的日程安排: 2017:https://roscon.ros.org/2017/ 2016:https://roscon.ros.org/2016/ 2015:https://roscon.ros.org/2015/ 2014:http…

Frenet坐标系下横纵向轨迹决策规划(SL投影及ST投影)及Apollo决策算法解析

参考: (1)《攻城狮说 | 应对复杂路况,自动驾驶如何规划它的下一步? “老司机”炼成记!》微信公众号文章 Pony.ai小马智行 (2)《【Apollo】apollo3.5决策分享 --by 百度美研 Yifei J…

基于Ubuntu 18.04机器人操作系统环境和深度学习环境配置

基于Ubuntu 18.04机器人操作系统环境和深度学习环境配置详解 CUDACudnnROSanacondaubuntu装机必备 笔记本双系统安装U盘启动项安装ubuntu18.04.1关闭无线驱动冲突(联想)(option)更新软件源为国内软件源apt-get 锁问题rc.localaria2c BaiduExport ROS me…

几何向量:向量乘法(叉乘)

转载自: https://blog.csdn.net/yinhun2012/article/details/79444277 之前我们学习了物理意义上的做功,也就是数学中向量点积的实际意义,这一篇我们学习物理上另外一种力的作用,也就是力矩。 物理上定义力矩是力对物体产生转动作用的物理量…

向量和矩阵的点乘和叉乘

向量 定义:向量是由N个实数组成的一行N列或N行一列的的数组。 点乘:又叫做点积、内积、数量积、标量积,向量a[a1,a2,...,an]和向量b[b1,b2b...,bn]点乘的结果是一个标量,记作a.b; 几何解释:a.b |a| |b| &…

向量叉乘与叉乘矩阵

本文以三维向量来说明向量的叉乘计算原理以及叉乘矩阵如何求取 1、向量叉乘的计算原理 a、b分别为三维向量: a叉乘b一般定义为: 或 可是这只是一个符号的定义啊,具体怎么得到代数值呢 关键方法就是引入单位坐标向量, 这里用i j k…

3维向量的点乘叉乘运算

3维向量的点乘叉乘运算 文章目录 3维向量的点乘叉乘运算三维向量的点乘三维向量的叉乘点到直线的距离点到平面的距离 三维向量的点乘 点乘得到的是对应元素乘积的和,是一个标量,没有方向 V1( x1, y1, z1)V2(x2, y2, z2) x1x2 y1y2 z1*z2 点乘可以用…

通俗理解三维向量的点乘与叉乘

通俗理解三维向量的点乘和叉乘 一般接触得比较多的是二维向量的点乘和叉乘,但是做到与三维几何相关的工作的时候,三维向量的知识是必不可少的。 注意:三维向量和三维矢量是同一个东西,都是来自英文单词的Vector的中文翻译&#…

栅栏密码加密/解密【传统型】在线工具

栅栏密码(Rail-fence Cipher)就是把要加密的明文分成N个一组,然后把每组的第1个字符组合,每组第2个字符组合…每组的第N(最后一个分组可能不足N个)个字符组合,最后把他们全部连接起来就是密文。 遇到这种的栅栏加密的密文,解密的…

栅栏密码加密/解密【W型】在线工具

栅栏密码加密/解密【W型】在线工具 栅栏密码(Rail-fence Cipher)就是把要加密的明文分成N个一组,然后把每组的第1个字符组合,每组第2个字符组合…每组的第N(最后一个分组可能不足N个)个字符组合,最后把他们全部连接起来就是密文。 本工具所…

栅栏密码解密

题目: 一只小羊翻过了2个栅栏 KYsd3js2E{a2jda} 通过栅栏密码在线解密即可得出flag 解密结果: flagKEY{sad23jjdsa2}

猪圈密码 摩斯密码 QWE加密 栅栏加密 当铺密码

1.猪圈密码 猪圈密码:对应下图就是HORSE 2.摩斯密码 在线摩斯密码翻译器:http://www.mathsking.net/morse.htm 3.QWE加密 键盘按ABC的顺序排列得到对应的字母,QA,WB.... 4.栅栏加密 加密过程: 如果我们想要加密一句话,…

python3解密栅栏密码的正确方法

python3解密栅栏密码的正确方法 今天在做ctf时想找一个栅栏密码的解密脚本,在网上搜过了下,发现竟然没找到一个正确的脚本(也可能是自己的搜索水平太差),倒不是说大家的脚本都有问题,只是在解决特殊情况时…

维吉尼亚密码加密/解密在线工具

维吉尼亚密码加密/解密在线工具,工具链接:http://www.atoolbox.net/Tool.php?Id856 维吉尼亚密码是在凯撒密码基础上产生的一种加密方法,它将凯撒密码的全部25种位移排序为一张表,与原字母序列共同组成26行及26列的字母表。另外…

Crypto之栅栏密码

栅栏密码是一种简单的移动字符位置的加密方法,规则简单,容易破解。栅栏密码的加密方式:把文本按照一定的字数分成多个组,取每组第一个字连起来得到密文1,再取每组第二个字连起来得到密文2……最后把密文1、密文2……连…

CTF-Show密码学【Base64、栅栏密码、16进制】

题目内容 密文:53316C6B5A6A42684D3256695A44566A4E47526A4D5459774C5556375A6D49324D32566C4D4449354F4749345A6A526B4F48303D 提交格式:KEY{XXXXXXXXXXXXXX}工具下载:https://www.lanzoui.com/i9fn2aj萌新_密码13 分析和解决过程 初步分析…

CTF密码学·置换密码,栅栏密码,曲路密码

CTF密码学置换密码,栅栏密码,曲路密码 1.置换密码列置换周期置换 2.栅栏密码3.曲路密码 1.置换密码 置换密码(Permutation Cipher)又叫换位密码(Transposi-tionCipher),它根据一定的规则重新排列明文,以便…

从加(解)密角度讲栅栏密码

目录 普通型栅栏加密原理解密原理 W型栅栏加密原理实例 解密原理 这今天在做新生赛的一道“只有倒着翻过十八层的篱笆才能抵达北欧神话的终点”,研究了很长时间的栅栏原理,flag没出来,而且自己对于普通和W型的加密解密整的有的蒙… 原先一篇文…