World Happiness Report 2023 Analysis

This project analyzes the World Happiness Report 2023 dataset to understand factors contributing to happiness across different countries.

Project Structure

├── config/                 # Configuration files
├── data/                   # Data directory
│   ├── raw/               # Raw data files
│   └── processed/         # Processed data files
├── notebooks/             # Jupyter notebooks
├── src/                   # Source code
│   ├── data/             # Data processing scripts
│   ├── features/         # Feature engineering
│   ├── models/           # Model training and evaluation
│   └── visualization/    # Visualization scripts
└── results/              # Output results and visualizations
    ├── models/           # Trained models
    └── visualizations/   # Generated visualizations

Prerequisites

Python 3.8 or higher
pip (Python package installer)

Setup

Clone the repository:

git clone <repository-url>
cd world-happiness

Create a virtual environment:

python -m venv venv
source venv/bin/activate  # On Windows: venv\Scripts\activate

Install dependencies:

pip install -r requirements.txt

Usage

Running the Complete Pipeline

To run the entire pipeline (download data, preprocess, visualize, and train model):

python src/main.py

Running Individual Components

Download the dataset:

python src/data/download_data.py

Preprocess the data:

python src/data/preprocess.py

Create visualizations:

python src/visualization/create_visualizations.py

Train the model:

python src/models/train.py

Jupyter Notebook Analysis

For interactive analysis:

jupyter notebook notebooks/01_exploratory_data_analysis.ipynb

Project Components

Data Preprocessing

Data cleaning and validation
Missing value handling
Feature scaling
Train-test split

Exploratory Data Analysis (EDA)

Statistical summaries
Distribution analysis
Correlation analysis
Feature importance visualization

Feature Engineering

Feature scaling
Feature selection
Feature importance analysis

Predictive Modeling

Random Forest model
Hyperparameter optimization using Optuna
Model evaluation metrics
Feature importance analysis

Visualization

Happiness score distribution
Correlation heatmap
Top/bottom countries analysis
Regional analysis
Feature importance plots

Results

The project generates various outputs in the results/ directory:

results/models/: Trained models and feature importance
results/visualizations/: Generated plots and interactive visualizations
pipeline.log: Detailed logging of the pipeline execution

Troubleshooting

Data Download Issues
- Check your internet connection
- Verify the URL in src/data/download_data.py
- Ensure write permissions in the data directory
Preprocessing Errors
- Verify the raw data file exists in data/raw/
- Check for correct column names in the configuration
- Ensure sufficient disk space
Model Training Issues
- Verify processed data exists
- Check for memory constraints
- Adjust model parameters in config/config.yaml
Visualization Problems
- Ensure all required packages are installed
- Check for write permissions in the results directory
- Verify data format and column names

Contributing

Fork the repository
Create a feature branch
Commit your changes
Push to the branch
Create a Pull Request

License

This project is licensed under the MIT License - see the LICENSE file for details.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
config		config
notebooks		notebooks
outputs/2025-03-22		outputs/2025-03-22
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

World Happiness Report 2023 Analysis

Project Structure

Prerequisites

Setup

Usage

Running the Complete Pipeline

Running Individual Components

Jupyter Notebook Analysis

Project Components

Data Preprocessing

Exploratory Data Analysis (EDA)

Feature Engineering

Predictive Modeling

Visualization

Results

Troubleshooting

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Languages

pareek-ml/world-happiness-data-analysis

Folders and files

Latest commit

History

Repository files navigation

World Happiness Report 2023 Analysis

Project Structure

Prerequisites

Setup

Usage

Running the Complete Pipeline

Running Individual Components

Jupyter Notebook Analysis

Project Components

Data Preprocessing

Exploratory Data Analysis (EDA)

Feature Engineering

Predictive Modeling

Visualization

Results

Troubleshooting

Contributing

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages