Skip to content

zz-zik/AAGU

Repository files navigation

AAGU

项目介绍

在多模态目标检测任务中,为解决RGB与TIR图像特征不对齐以及框边界不准确的问题,我们提出了锚框注意力引导融合模块(ABAM)的改进方案。 该方案以BackBone提取的四个尺度的特征图分别作为输入,先通过时序注意力融合(TFAM)模块对RGB和TIR图像的特征做初始融合, 再利用注意力机制动态调整特征融合的权重,突出重要特征并抑制不重要特征。同时,通过卷积操作计算每个锚框的偏移量 h 和 w,衡量RGB与TIR图像中框的对齐情况。 在特征融合时,根据置信度和偏移量判断选择RGB或TIR图像的特征,若偏移量较大,则依据置信度选取特征;若偏移量较小,则直接融合两种图像特征。

系统要求

  • Python 3.12
  • CUDA + PyTorch

安装步骤

1. 创建虚拟环境

conda create -n aagu python=3.12 -y
conda activate aagu

2. 安装依赖包

pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121      
pip install -r requirements.txt

数据集介绍

支持两种数据集结构格式:

1. 默认结构:

数据集的结构如下:

data/
  ├── train/               # 训练集
  │   ├── RGB/             # RGB可见光图像
  │   ├── TIR/             # TIR红外光图像
  │   ├── annotations/     # coco标签文件
  │   │    ├── train.json  # 训练集标签文件
  │   │    ├── val.json    # 验证集标签文件
  │   │    └── val.json    # 测试集标签文件
  │   └── labels/          # yolo标签文件
  ├── val/                 # 验证集
  │   ├── RGB/             # RGB可见光图像
  │   ├── TIR/             # TIR红外光图像
  │   │    ├── train.json  # 训练集标签文件
  │   │    ├── val.json    # 验证集标签文件
  │   │    └── val.json    # 测试集标签文件
  │   ├── annotations/     # coco标签文件
  │   └── label/           # yolo标签文件    
  └── test/                # 测试集
      ├── RGB/             # RGB可见光图像
      ├── TIR/             # TIR红外光图像
      ├── annotations/     # coco标签文件(可选)
      │    ├── train.json  # 训练集标签文件
      │    ├── val.json    # 验证集标签文件
      │    └── val.json    # 测试集标签文件
      └── labels/           # yolo标签文件(可选)

修改参数文件configs中的data_formatdefault

2. 自定义结构:

数据集的结构如下:

data/
  ├── RGB/                # RGB可见光图像
  │── TIR/                # TIR红外光图像
  ├── annotations/        # coco标签文件
  │── label/              # yolo标签文件
  └── list                # 列表文件
      ├── train.txt       # 训练集列表
      ├── val.txt         # 训练集列表
      └── test.txt        # 验证集列表

修改参数文件configs中的data_formatcustom

训练

命令行训练

python train.py -c ./configs/config.yaml

测试

python test.py -c ./configs/config.yaml

贡献

欢迎提交问题和代码改进。请确保遵循项目的代码风格和贡献指南。

许可证

本项目使用 Apache License 2.0

About

基于锚框注意力引导的多模态目标检测特征融合方法

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages