Script minimal pour entraîner un modèle de segmentation sémantique avec Detectron2 sur vos propres données COCO.
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
# Ou installez Detectron2 selon votre version de CUDA :
pip install detectron2 -f https://dl.fbaipublicfiles.com/detectron2/wheels/cu118/torch2.0/index.html
Préparez vos données COCO dans :
dataset/train/images
etdataset/train/annotations.json
dataset/valid/images
etdataset/valid/annotations.json
python train.py --backbone mask_rcnn_R_50_FPN_3x --max-iter 5000 \
--train-json dataset/train/annotations.json --train-img-dir dataset/train/images \
--val-json dataset/valid/annotations.json --val-img-dir dataset/valid/images
Argument | Type | Défaut | Description |
---|---|---|---|
-b , --backbone |
str | mask_rcnn_R_50_FPN_3x |
Backbone Detectron2 à utiliser |
--max-iter |
int | 5000 |
Nombre d'itérations d'entraînement |
--output |
str | output_semseg |
Dossier racine de sortie |
--train-json |
str | dataset/train/annotations.json |
Fichier COCO d'entraînement |
--train-img-dir |
str | dataset/train/images |
Dossier images d'entraînement |
--val-json |
str | dataset/valid/annotations.json |
Fichier COCO de validation |
--val-img-dir |
str | dataset/valid/images |
Dossier images de validation |
--augment / --no-augment |
bool | --augment (activé par défaut) |
Active ou désactive la data augmentation avancée (rotations, flips, luminosité, contraste) pour l'entraînement |
Backbones disponibles : mask_rcnn_R_50_FPN_3x
, mask_rcnn_R_101_FPN_3x
, panoptic_fpn_R_50_3x
, panoptic_fpn_R_101_3x
- Par défaut, la data augmentation avancée est activée lors de l'entraînement :
- Rotations multiples (90°, 180°, 270°)
- Flips horizontaux et verticaux
- Ajustements de luminosité et de contraste
- Pour désactiver ces transformations aléatoires, ajoutez simplement l'option
--no-augment
à votre commande.
Exemples :
- Avec data augmentation (par défaut) :
ou simplement
python train.py --augment ...
python train.py ...
- Sans data augmentation :
python train.py --no-augment ...
Ce projet est distribué sous licence MIT.
Script de diagnostic et documentation pour installer et valider une chaîne GPU/CUDA/PyTorch compatible RTX 5090 sous WSL2 (Windows Subsystem for Linux 2).
Ce projet fournit :
- Un script Python pour diagnostiquer la compatibilité GPU/CUDA/PyTorch, spécialement pour les GPU Ada Lovelace (RTX 5090).
- Une documentation complète pour installer CUDA et PyTorch sous WSL2.
- Créer et activer un environnement virtuel avec uv
uv venv source .venv/bin/activate
- Installer PyTorch (nightly, CUDA 12.8, RTX 5090)
uv pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
- Installer le CUDA Toolkit dans WSL2
- Suivre le guide détaillé : INSTALL_CUDA_WSL2.md
Lancez le diagnostic complet avec :
python main.py
Vous obtiendrez un rapport sur :
- Le GPU détecté et ses caractéristiques
- La version CUDA disponible
- La version et la compatibilité PyTorch/CUDA
- Les conseils pour corriger la chaîne si besoin
Consultez le guide complet d'installation et de résolution de problèmes ici :
Ce projet est distribué sous licence MIT. Voir le fichier LICENSE.
- Auteur principal : @NaPtaX
- Contributions bienvenues via Pull Request !