AAGU

项目介绍

在多模态目标检测任务中，为解决RGB与TIR图像特征不对齐以及框边界不准确的问题，我们提出了锚框注意力引导融合模块（ABAM）的改进方案。该方案以BackBone提取的四个尺度的特征图分别作为输入，先通过时序注意力融合（TFAM）模块对RGB和TIR图像的特征做初始融合，再利用注意力机制动态调整特征融合的权重，突出重要特征并抑制不重要特征。同时，通过卷积操作计算每个锚框的偏移量 h 和 w，衡量RGB与TIR图像中框的对齐情况。在特征融合时，根据置信度和偏移量判断选择RGB或TIR图像的特征，若偏移量较大，则依据置信度选取特征；若偏移量较小，则直接融合两种图像特征。

系统要求

Python 3.12
CUDA + PyTorch

安装步骤

1. 创建虚拟环境

conda create -n aagu python=3.12 -y
conda activate aagu

2. 安装依赖包

pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu121      
pip install -r requirements.txt

数据集介绍

支持两种数据集结构格式：

1. 默认结构：

数据集的结构如下：

data/
  ├── train/               # 训练集
  │   ├── RGB/             # RGB可见光图像
  │   ├── TIR/             # TIR红外光图像
  │   ├── annotations/     # coco标签文件
  │   │    ├── train.json  # 训练集标签文件
  │   │    ├── val.json    # 验证集标签文件
  │   │    └── val.json    # 测试集标签文件
  │   └── labels/          # yolo标签文件
  ├── val/                 # 验证集
  │   ├── RGB/             # RGB可见光图像
  │   ├── TIR/             # TIR红外光图像
  │   │    ├── train.json  # 训练集标签文件
  │   │    ├── val.json    # 验证集标签文件
  │   │    └── val.json    # 测试集标签文件
  │   ├── annotations/     # coco标签文件
  │   └── label/           # yolo标签文件    
  └── test/                # 测试集
      ├── RGB/             # RGB可见光图像
      ├── TIR/             # TIR红外光图像
      ├── annotations/     # coco标签文件(可选)
      │    ├── train.json  # 训练集标签文件
      │    ├── val.json    # 验证集标签文件
      │    └── val.json    # 测试集标签文件
      └── labels/           # yolo标签文件(可选)

修改参数文件configs中的data_format为default。

2. 自定义结构：

数据集的结构如下：

data/
  ├── RGB/                # RGB可见光图像
  │── TIR/                # TIR红外光图像
  ├── annotations/        # coco标签文件
  │── label/              # yolo标签文件
  └── list                # 列表文件
      ├── train.txt       # 训练集列表
      ├── val.txt         # 训练集列表
      └── test.txt        # 验证集列表

修改参数文件configs中的data_format为custom。

训练

命令行训练

python train.py -c ./configs/config.yaml

测试

python test.py -c ./configs/config.yaml

贡献

欢迎提交问题和代码改进。请确保遵循项目的代码风格和贡献指南。

许可证

本项目使用 Apache License 2.0

Name		Name	Last commit message	Last commit date
Latest commit History 40 Commits
configs		configs
dataloader		dataloader
engines		engines
examples		examples
models		models
optim		optim
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
benchmark.csv		benchmark.csv
requirements.txt		requirements.txt
test.py		test.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

AAGU

项目介绍

系统要求

安装步骤

1. 创建虚拟环境

2. 安装依赖包

数据集介绍

1. 默认结构：

2. 自定义结构：

训练

命令行训练

测试

贡献

许可证

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

License

zz-zik/AAGU

Folders and files

Latest commit

History

Repository files navigation

AAGU

项目介绍

系统要求

安装步骤

1. 创建虚拟环境

2. 安装依赖包

数据集介绍

1. 默认结构：

2. 自定义结构：

训练

命令行训练

测试

贡献

许可证

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages