点云

一句话总结: 点云是在空间中的 3D 数据点集合。每个点都有 X、Y、Z 坐标。点云为自动驾驶与机器人提供 3D 感知能力。

点云是在三维空间中离散分布的一组数据点。每个点的位置由笛卡尔坐标(X、Y、Z)定义。点还可能包含额外属性,例如颜色(RGB)、强度或时间戳。点云用于表示物理物体与环境的表面,是LiDAR传感器与 3D 扫描仪的主要输出。

点云如何生成

  1. LiDAR 扫描:LiDAR 传感器发射激光脉冲并记录每个脉冲的返回时间。飞行时间数据可得到精确的 3D 位置。
  2. 摄影测量:处理多张相互重叠的图像以重建 3D 几何形状。
  3. 双目视觉:两台有位移的摄像头模拟双眼视觉以估计深度。
  4. 结构光:投射图案在物体表面发生形变,摄像头捕捉形变并计算深度。

自动驾驶中的点云

自动驾驶汽车通常每秒最多采集 10 次密集点云。点云展示道路、其他车辆与行人的 3D 布局。在带标注点云上训练的 AI 模型可学习在 3D 空间中检测并分类目标。连续的点云帧还能随时间跟踪移动目标,这对安全路径规划与避撞至关重要。

机器人与建图中的点云

  1. SLAM:机器人实时构建并更新未知环境的 3D 地图。
  2. 抓取:机械臂在抓取前用点云估计物体姿态。
  3. 数字孪生:将工厂与城市扫描为高保真 3D 模型。
  4. GIS 与地形测绘:机载 LiDAR 点云可生成数字高程模型。

用于 AI 的点云处理

原始点云是非结构化数据,AI 模型需要直接从不规则的 3D 数据中学习。PointNet 与 PointNet++ 是点云学习的开创性神经网络架构。基于体素(voxel)的方法会将点云转换为规则的 3D 网格,以便 CNN 处理。点云标注工作量很大——一帧中的每个点都可能需要类别标注。Bright Data 的 数据集包含 3D 传感器数据,可加速面向计算机视觉与机器人领域的训练数据流水线。

准备好开始了吗?