Behavior Cloning Tutorial: Autonomous Driving with CNNs

This repository provides a comprehensive tutorial on implementing Behavior Cloning (BC) for autonomous driving using Convolutional Neural Networks (CNNs). The tutorial demonstrates end-to-end imitation learning in the CarRacing-v0 environment from OpenAI Gym.

Overview

Behavior Cloning is a supervised learning approach to imitation learning where a neural network learns to replicate expert behavior from demonstration data. This implementation focuses on autonomous driving, where:

Input: RGB images from the simulation environment
Output: Continuous control actions [steering, brake, throttle]
Learning Paradigm: Supervised learning with expert trajectories

Key Features

CNN-based architecture for visual perception
Temporal frame stacking for dynamic understanding
Expert data collection interface
Comprehensive training and evaluation pipeline
Performance visualization tools

Technical Architecture

Neural Network Design

The model implements a Convolutional Neural Network specifically designed for visual control tasks, based on the architecture proposed by Irving et al. (2023).

Input: 84x84x4 (grayscale, 4-frame stack)
    ↓
Conv2D Layers + Batch Normalization + ReLU
    ↓
Global Average Pooling
    ↓
Fully Connected Layers 
    ↓
Output: 3 continuous actions [steering, brake, throttle]

Figure 1: CNN Architecture for Behavior Cloning

Data Preprocessing Pipeline

Image Preprocessing:
- Convert RGB frames to grayscale (96x96) -> (84x84)
- Normalize pixel values to [0,1]
- Apply temporal stacking (4 consecutive frames)
Action Space:
- Steering: [-1, 1] (left/right)
- Brake: [0, 1] (no brake/full brake)
- Throttle: [0, 1] (no gas/full gas)

Environment Setup

Prerequisites

Python 3.8+

Quick Start

Navigate to the src directory and execute:

make run

This command will:

Create a Python virtual environment
Install all required dependencies
Execute the training (main.py)
Generate evaluation metrics and visualizations

Manual Installation

# Create virtual environment
python -m venv bc_env
source bc_env/bin/activate  # Linux/Mac
# bc_env\Scripts\activate   # Windows

# Install dependencies
pip install -r requirements.txt

Data Collection

Expert Data Generation

To collect expert demonstration data:

make expert

This launches an interactive session where:

Arrow Keys: Control steering
Up Arrow: Accelerate
Down Arrow: Brake
ESC: Exit and save trajectory

Data Storage: Trajectories are saved as pickle files in src/data/trajectories/ containing observation-action pairs.

Training Process

Load expert trajectories from src/data/trajectories/
Split data into train/validation sets (80/20)
Train CNN with Adam optimizer
Save best model based on validation loss
Generate performance metrics

Evaluation and Visualization

Performance Metrics

make plot

Generates visualizations for:

Reward progression over episodes.

Project Structure

simple-bc-tutorial/
├── src/
│   ├── main.py              # Main training script
│   ├── cnn.py               # CNN architecture definition
│   ├── car_racing_v0.py     # Expert data collection
│   ├── data/
│   │   └── trajectories/    # Expert demonstration data
│   ├── models/              # Saved model checkpoints
│   └── plots/               # Generated visualizations
├── Makefile                 # Build automation
├── requirements.txt         # Python dependencies
└── README.md               # This file

Known Limitations

Distribution Shift: Performance degrades when encountering states not in training data
Compounding Errors: Small prediction errors can accumulate over time
Data Efficiency: Requires substantial expert demonstration data

Advanced Configuration

Network Architecture Modifications

Edit cnn.py to experiment with:

Different layer configurations
Alternative activation functions
Regularization techniques
Attention mechanisms

Training Enhancements

Modify main.py for:

Data augmentation strategies
Advanced optimizers (AdamW, RMSprop)
Learning rate scheduling
Early stopping criteria

Environment Variations

The framework can be extended to other OpenAI Gym environments:

LunarLander-v2
BipedalWalker-v3
Custom simulation environments

References

Core Publications

Irving, B. (2023). Imitation learning for autonomous driving: disagreement-regularization and behavior cloning with beta distribution. Master's Thesis, UFSC.

Technical Resources

Contributing

We welcome contributions to improve this tutorial! Please follow these steps:

Fork the repository
Create a feature branch (git checkout -b feature/amazing-feature)
Make your changes and add tests
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
src		src
.gitignore		.gitignore
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
carRacing_CNN.png		carRacing_CNN.png
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Behavior Cloning Tutorial: Autonomous Driving with CNNs

Table of Contents

Overview

Key Features

Technical Architecture

Neural Network Design

Data Preprocessing Pipeline

Environment Setup

Prerequisites

Quick Start

Manual Installation

Data Collection

Expert Data Generation

Training Process

Evaluation and Visualization

Performance Metrics

Project Structure

Known Limitations

Advanced Configuration

Network Architecture Modifications

Training Enhancements

Environment Variations

References

Core Publications

Technical Resources

Contributing

About

Uh oh!

Releases

Packages

Languages

License

Brenda-Machado/simple-bc-tutorial

Folders and files

Latest commit

History

Repository files navigation

Behavior Cloning Tutorial: Autonomous Driving with CNNs

Table of Contents

Overview

Key Features

Technical Architecture

Neural Network Design

Data Preprocessing Pipeline

Environment Setup

Prerequisites

Quick Start

Manual Installation

Data Collection

Expert Data Generation

Training Process

Evaluation and Visualization

Performance Metrics

Project Structure

Known Limitations

Advanced Configuration

Network Architecture Modifications

Training Enhancements

Environment Variations

References

Core Publications

Technical Resources

Contributing

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages