Breast Cancer Diagnosis using Machine Learning

This project explores multiple machine learning models to predict breast cancer diagnosis (Benign vs. Malignant) using the Wisconsin Breast Cancer Diagnostic dataset. We implement feature engineering, model evaluation, interpretability using LIME, and advanced hyperparameter tuning.

Dataset

Source: UCI Machine Learning Repository
Name: Breast Cancer Wisconsin (Diagnostic)
Features: 30 numeric features extracted from cell nuclei
Target: Diagnosis (M = Malignant, B = Benign)

Models Used

Model	Accuracy	Precision	Recall	F1 Score	AUC-ROC
Logistic Regression	94.74%	0.9737	0.8810	0.9250	0.9921
Random Forest	97.37%	1.0000	0.9286	0.9630	0.9929
Support Vector Machine	90.35%	1.0000	0.7381	0.8493	0.9808
K-Nearest Neighbors	91.23%	0.9706	0.7857	0.8684	0.9547
Gradient Boosting	96.49%	1.0000	0.9048	0.9500	0.9947
Naive Bayes	93.86%	1.0000	0.8333	0.9091	0.9934

Key Features

Data Preprocessing
Missing value check, label encoding, feature scaling
Model Building
Logistic Regression, Random Forest, SVM, KNN, Naive Bayes, Gradient Boosting
Model Interpretation (Explainability)
Used LIME (Local Interpretable Model-Agnostic Explanations) for individual predictions
Model Evaluation
Accuracy, Precision, Recall, F1 Score, ROC-AUC, comparison bar plots
Hyperparameter Tuning
Used GridSearchCV for Random Forest and Gradient Boosting
(Optional) Fairness Check
You can extend to check model bias against demographic groups (if features are available)

Visualization

LIME explanations of local predictions
Bar charts comparing evaluation metrics across models
Confusion matrices

Installation

pip install -r requirements.txt

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
Plots		Plots
Breast_Cancer_Diagnosis_ML_Report (1) (1).pdf		Breast_Cancer_Diagnosis_ML_Report (1) (1).pdf
README.md		README.md
breast_cancer_01.ipynb		breast_cancer_01.ipynb
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Breast Cancer Diagnosis using Machine Learning

Dataset

Models Used

Key Features

Visualization

Installation

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Ayush291202/breast-cancer-ml-diagnosis

Folders and files

Latest commit

History

Repository files navigation

Breast Cancer Diagnosis using Machine Learning

Dataset

Models Used

Key Features

Visualization

Installation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages