从深度图到点云的构建方式

共 2268字,需浏览 5分钟

 ·

2020-11-16 13:46

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本期我们将一起讨论如何将RGBD图像转换为3D空间中的点

我们将介绍什么是相机的内参矩阵,以及如何使用它将RGBD(红色、蓝色、绿色、深度)图像转换为3D空间。获取RGBD图像的方式有很多种,例如Kinect相机之类的系统,这些系统通过测量红外光的飞行时间来计算深度信息。但也有传闻称iPhone 12将LiDAR集成到其相机系统中。对于无人驾驶汽车而言,最重要的数据来源与汽车上的LiDAR以及标准RGB摄像头。在本文中,我们不会详细介绍如何获取数据。

图1 :(左)以u,v坐标表示的图像平面。每个像素都有指定的颜色和深度。(右)笛卡尔坐标x,y,z中的3D视图。

如果要了解3D环境中每个像素对应的内容,那么了解相机的属性就非常重要。相机的关键参数之一是焦距,它帮助我们将像素坐标转换为实际长度。大家可能看到过像“ 28 mm”这样的焦距,这其实是镜头与胶片/传感器之间的实际距离。

通过简单的几何关系(“相似的三角形”),我们可以轻松地从每个像素的u和d得出位置x。下图仅显示了x和u,但对y和v可以完全相同。对于针孔相机模型,x和y方向的焦距相同。对于带镜头的相机这个结论可能就不一定成立了,我们将在以后的文章中对此进行讨论。

图2:显示xz平面的投影(顶视图)。左侧是针孔照相机,镜头前有一个物体(从上方是相同的蓝色球),并在屏幕上显示。世界坐标系与照相机对齐,因此z轴延伸到照相机所看的方向。在右侧,从左侧开始的两个部分重叠的三角形分开以更加清楚。

从类似的三角方法中,我们立即获得:

通常fₓ和fᵧ是相同的。但是对于例如图像传感器的非矩形像素,镜头变形或图像的后处理,它们可能会有所不同。

综上所述,我们可以仅使用几何参数编写一段很短的Python代码,以将屏幕的坐标系转换为笛卡尔坐标系。

def convert_from_uvd(self, u, v, d):    d *= self.pxToMetre    x_over_z = (self.cx - u) / self.focalx    y_over_z = (self.cy - v) / self.focaly    z = d / np.sqrt(1. + x_over_z**2 + y_over_z**2)    x = x_over_z * z    y = y_over_z * z    return x, y, z


在代码中(cₓ,cᵧ)是摄像机传感器的中心。请注意相机属性pxToMetre常数,利用这些参数可以在一定比例尺下以3D形式精确地显示图片。

当然,有一种更通用的方法可以完成所有这些操作。输入内参矩阵!这是一个包含先前讨论的相机属性(相机传感器的焦距和中心以及偏斜)的单个矩阵。在这里,我们要讨论如何使用它为我们完成上述转换。在下文中,我们将大写粗体字用于矩阵,将小写粗体字用于矢量,将普通脚本用于标量。

接下来,我们介绍齐次坐标。齐次坐标有助于我们将各种不同变换(平移,旋转和倾斜)编写为具有相同维数的矩阵。

以这种方式考虑它。在图2中,我们可以将图像平面移动到任何其他距离,例如从fₓ→2fₓ,并注意我们将其平移的因子h = 2。移位引入了简单的缩放比例,我们总是可以通过将u和v除以h作为返回值。

现在我们可以在齐次坐标上定义各种不同的操作,但是这些操作都保持最后一个维度值不变。

旋转矩阵R,平移矢量t和本征矩阵K组成了相机投影矩阵。它定义为从世界坐标转换为屏幕坐标:

注意[ R | t ]表示块符号,表示我们将R和列向量t = transpose {t₀,t₁,t 2}连接起来,或者换句话说,将其添加到R的右侧。如果我们想以另一种方式进行转换,则会遇到问题。我们对3x4矩阵求逆。但是大家会发现该矩阵的方阵扩展是可以求逆的。为此,我们必须在左侧增加1 / z(视差)才能满足方程式。4x4矩阵称为满秩本征/非本征矩阵。

让我们用最简单的情况验证上面所说的:相机原点和世界原点对齐,即Rt可以忽略,偏斜S为0,图像传感器居中。现在,相机矩阵的逆就是:

只看第一行就可以得出与开始时(方程1)完全相同的结论。使用等式的第二行和第三行对y和z同样适用。对于更复杂的内在矩阵,大家需要在进行此转换之前计算逆。由于它是一个上三角矩阵,因此有很多简单的办法可以处理这个问题:

现在,我们拥有了将深度图或RGBD图像转换为3D场景的所有工具,每个像素代表一个点(图3)。我们在此过程中有一些假设。其中之一是简化的相机模型:针孔相机。但是在现实世界中使用的相机会使用镜头,并且通常只能通过针孔模型进行估算。

图3:根据深度图(灰度)计算出的点云(绿色)

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 89
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报