只能作为一部分骨干网络，对 3 D 目标识别没有特别设计

简要介绍

后续工作如 StruMamba3D、UniMamba 等在自监督、统一时空/通道表示或把卷积与 SSM 结合方面做了延伸（更多结构化/多尺度的 SSM 变体）。

核心问题 之前的点云方法仍然面临两个关键问题：

SSM 处理过程中破坏了 3 D 点的邻接性
在下游任务中随着输入长度的增加，未能保留长序列记忆

StruMamba 3 D 的优点

设计了空间状态，将其作为代理来保留点之间的空间依赖性
通过一种状态更新策略增强了 SSM，并结合了一个轻量级卷积来促进空间状态之间的交互，以实现高效建模
通过引入序列长度自适应策略，降低了预训练的 Mamba 模型对不同长度的敏感性

Stru-Mamba 的两个核心组件

结构化 SMM 块
序列长度自适应策略

核心贡献

提出了 StruMamba 3 D 用于自检度点云表示学习，这是首次在 SSM 的潜在装体中建模结构信息
设计了结构化 SSM，在状态信息选择和传播过程中保持点之间的空间依赖性，同时序列长度自适应策略降低了预训练的 Mamba 类模型对不同输入长度的敏感性
在四个下游任务上的实验结果展示了我们方法的优越性能

此外，消融试验验证了设计的有效性

概述

首先通过最远点采样和 KNN 采样得到初始输入，然后使用轻量级 PointNet 提取特征作为 token 嵌入 $F_{x} \in R^{N \times D}$ ；同时，将空间状态 $P_{h} \in R^{M \times 3}$ 初始化为原始点云中局部结构的代理

这里的局部结构的代理，是 FPS 采样得到的关键点？

最后将空间状态和输入 token 嵌入输入到网络中

结构化 SSM 模块

目标该模块旨在让 SSM 处理过程中保留点之间的依赖关系来捕获复杂的结构特征，分为五个模块：

空间状态初始化

存在问题：原始 Mamba 中，潜在状态不包括几何信息, 这使得建模点云的局部结构变得困难

为解决该问题，在潜在问题中引入了位置属性 $P_{h} \in R^{M \times 3}$ ，使每个状态都能关注点云的不同区域。由于点云的稀疏性，根据原始点 $P_{raw}$ 初始化状态位置 $P_{h}$ ，以确保点云的全面覆盖

具体，采用 FPS 和 KNN 聚类将点云分割成组 $\{\begin{align}\cal{G}_{m}\end{align}\} ^M_{m=1}$ ，并计算其质心：

P_{h}^{m} = \frac{1}{∣ G _{m} ∣} P_{i} \in G_{m} \sum P_{i}

其中 $P_{h}^{m}$ 是第 m 个状态的位置属性。将具有位置属性的状态称为空间状态，然后使用线性映射 $ϕ$ 将位置属性嵌入为初始状态特征：

F_{h} = ϕ_{h} (P_{h}) \in R^{M \times D}

状态 $F_{h}$ 随后被用作 SSM 的初始潜在状态，并与输入 token 一起更新

状态更新机制

存在问题：原始 Mamba 的状态更新和传播方程依赖与输入 token，而忽略了输入点和空间状态之间的空间关系。这一限制是的 Mamba 难以有效建模点云的结构信息

为解决该问题，修改了状态更新和传播方程，以显示的建模状态和输入之间的空间依赖关系

具体，首先计算输入点 $P_{x}$ 与状态位置 $P_{h}$ 之间的相对偏移：

Δ P_{i}^{m} = P_{x}^{i} - P_{h}^{m}

其中， $Δ P_{i}^{m}$ 表示第 i 个输入点与第 m 个状态之间的相对偏移。接下来将偏移映射到 SSM 参数 $(B, C)$ ，这些参数控制状态更新和传播

但是只考虑空间关系是不够的，因为信息的重要性因点而异。因此设计了一下的状态更新和传播机制：

(B_{i}^{m}, C_{i}^{m}) = ϕ (x_{i}) + MLP (Δ P_{i}^{m})

其中 MLP 是多层感知机， $ϕ$ 是线性投影， $x_{i}$ 表示第 $i$ 个输入点的特征。基于修改后的参数，空间状态可以利用同一区域内的点选择性的更新特征，而输入点可以从状态中获取局部结构信息

实际上，是聚合了小邻域内的点的特征，增强了局部特征的感受；不只是使用空间关系控制 SSM 参数更新，还融合了提取的特征

结构化 SSM

存在问题：单向扫描机制，无法实现输入点之间的双向信息交换

未解决高问题，采用了 VisionMamba 启发的双向扫描机制

具体，使用前向和后向结构化SSM，后向 SSM 以相反的顺序处理输入点；两者都使用空间状态 $\hat{F}_{h}$ 作为初始状态 $\hat{F}_{h}^{0}$ ，为输入点和状态空间生成更新后的特征

最后，使用线性层 $ϕ_{0}$ 融合这些输出，以获得输入点和空间状态的最终特征 $F_{x}^{'}$ 和 $F_{h}^{'}$

轻量化卷积

结构化 SSM 能有效建模空间状态 $P_{h}$ 和输入点 $P_{x}$ 之间的依赖关系。但是 SSM 中的空间状态 $P_{h}$ 仍然是孤立的，彼此之间缺乏直接交互

替换了原始 SSM 中的 1 D 卷积层

为解决该问题，引入一个轻量级卷积模块。受图卷积的启发，该模块基于相对位置信息聚合邻近状态的特征。

具体，对于每个空间状态 $P_{h}^{m}$ ，首先识别其 k 近邻 $N (m)$ 并计算相对位置 $Δ P_{h}^{mj}, j \in N (m)$ 。然后，使用线性层 $ϕ_{w}$ 为每个邻居生成注意力权重 ${w_{mj}}$ ，然后进行 softmax 操作：

w_{h}^{mj} = soft,ax (ϕ_{w} (Δ P_{h}^{mj}, P_{h}^{m}))

每个状态 $P_{h}^{m}$ 的输出状态特征 $\hat{F}_{h}^{m}$ 通过加权聚合获得：

这里是对每一个邻域内部，使用权重重新获得聚合特征

其中， $F_{h}^{mj}$ 表示邻域状态特征（邻域内每个点的）， $ϕ_{c}$ 是一个线性层

通过拓展空间状态的感受野，这种轻量级卷积增强了他们捕获全局语义信息的能力，将其替换 Mamba 块中的因果一维卷积，使其更适合处理具有复杂结构的几何结构的输入的点

序列长度自适应策略

存在问题：未解决下游任务中序列记忆不足的问题，我们提出了一种序列长度自适应策略，该策略继承了自应状态更新机制和空间状态一致性损失

自适应状态更新机制 SSM 参数更新中，参数采样间隔 $Δ$ 通过影响 SSM 中的参数 $\overline{A}, \overline{B}$ 来控制状态更新的频率

较大的 $Δ$ 会使模型更频繁地更新状态特征；较小的 $Δ$ 会允许模型以最小的改变量保持当前的状态

为了在下游任务中为更长的序列保留内存，提出了一种自适应状态更新机制。改机制根据输入序列长度调整采样间隔 $Δ$ ，使模型能够在不同序列长度下保持一致的总采样时间 $Δ_{a ll} = \sum_{i = 1}^{N} Δ_{i}$

每个序列之间的时间间隔一致，但是序列内部时间步是自适应的

具体，使用一个可学习的参数 $τ$ ，它调节了不同长度序列的总采样时间 $Δ_{a ll}$ 。每个输入 token 的采样间隔 $Δ_{i}$ 计算如下：

Δ_{i} = \frac{τ \times Δ _{i}}{\sum _{i = 1}^{N} Δ _{i}}

基于自适应状态更新机制，该模型可以在不同序列长度下保持一致的总采样时间 $Δ_{a ll} = τ$

空间一致性损失 为了进一步确保不同输入序列长度下更新的状态特征的一致性，我们在预训练任务中引入了空间状态一致性损失

这里使用教师模型的方法，略过，对简单的任务友好的效果。对 3 D 目标检测这个方法不太好

ScanObjectNN 和 ModelNet 40

人杰地灵东箭南金

探索

2025-StruMamba3D-Exploring Structural Mamba for Self-supervised Point Cloud Representation Learning

概述

结构化 SSM 模块

空间状态初始化

状态更新机制

结构化 SSM

轻量化卷积

序列长度自适应策略

ScanObjectNN 和 ModelNet 40

关系图谱

目录

最近更新

3D Lidar-Based Object Conditions in Adverse Weather Conditions

GSD+Superpowers

openpcdet-LION环境配置