发布网友
共1个回答
热心网友
【3D目标检测】VoxelNet在领域中的地位,就如同PointNet在点云处理中的重要角色。论文详情可参考arxiv.org/pdf/1711.0639...
VoxelNet的独特创新在于其网络结构,特别是Feature Learning Network部分。受PointNet启发,它利用Locally Aggregated Feature来捕获每个voxel的全局特征,解决点云数据稀疏性带来的挑战。通过将voxel-wise特征表示为稀疏张量,有效地降低了计算成本和内存需求,如图所示。
接着是Convolutional Middle Layers,通过3个3D卷积层增强特征描述,扩大感受野。VoxelNet与Faster RCNN的结构相似,但针对3D数据处理有所优化。学习VoxelNet前,理解Faster RCNN基础概念将大有裨益。
Loss Function部分,VoxelNet使用7维向量表示每个Ground Truth Box,包括中心点坐标、尺寸和偏航角。预测时,将正锚点与GT Box的差异参数化,定义为分类损失和回归损失的计算基础。分类损失采用二值交叉熵,正样本权重更高;回归损失则为L1正则化,仅计算正样本的边界参数,以简化计算。