简要介绍

KITTI

数据集是用于评估 3 D 目标检测器的广泛使用的数据集。 包含 7481 个呆住是的 LiDAR 帧用于训练,其中包含汽车、行人、cyclists 等目标类别的 3 D 边界框

网站:KITTI Github 介绍:github GithubPage: page

NuScenes

数据集是一个更有挑战性的数据集。包含 1000 个驾驶序列,其中训练集、验证集和测试集,采集自波士顿和新加坡,这两个城市交通密集且驾驶场景极具挑战性, 提供了 10 个不同类别的 3 D 目标,以及他们的属性和速度信息。为了预测速度和属性,以往所有方法均结合了关键这和过去-。5 秒内帧中的点云数据。该基准测试中,提出新的评估指标,称为 nuScenes 检测分数(NDS),他是 平均精度均值(mAP)、 位置平均误差均值(mATE)、 尺寸平均误差均值(mASE)、 方向平均误差均值(mAOE)、 属性平均误差均值(mAAE)和 速度平均误差均值(mAVE )的加权和

Waymo

Waymo开放数据集包含 789 个训练序列和 202 个验证序列,用于车辆和行人任务。点云有 64 线激光雷达采集,每秒 0.1 秒生成约 180k 个激光雷达点。官方 3D 检测评估指标包括标准 3D 边界框平均精度(mAP)和按朝向精度加权的平均精度(mAPH)。

mAP 和mAPH 基于车辆IoU 阈值 0.7、行人IoU 阈值 0.5 计算

官方评估工具包还提供两种难度级别的性能细分:LEVEL_1 对应具有 5 个以上的激光雷达点的框;LEVEL_2 对应至少一个激光雷达点的框

ScanNet V 2

室内数据

是一个通过丰富注释构建的室内场景三维重建数据集。包含 1513 个室内场景和 18 个物体类别。提供了每个点实例、语义标签和三维边界框的注释。标准评估协议,使用不同 IoU 阈值下的平均精度均值(m AP)进行评估,补考略边界框方向

SUM RGB-D

室内数据

是一个用于三维场景理解的单视角 RGB-D 数据集,包含 5 K 室内 RGB 和深度图像。注释包括每个点的语义标签和 37 个物体类别的定向边界框。采用标准平均精度作为评估指标,评估结果报告基于最常见的 10 个类别

ONCE

大规模自动驾驶场景

Argoverse 2

Occ 3 D (2024)