Bu projede, model performansını artırmak amacıyla RandomizedSearchCV kullanılarak Hyperparameter Tuning yapılmıştır. Kullanılan makine öğrenmesi modelleri arasında CatBoost en yüksek başarıyı elde etmiştir. Test veri seti üzerinde yapılan değerlendirmelere göre, CatBoost modelinin accuracy_score %80 olarak ölçülmüştür. Ayrıca, CatBoost modelinin değişken (feature) önem düzeyleri incelenmiş ve hangi değişkenlerin model üzerinde daha fazla etkisi olduğu belirlenmiştir.

Confusion Matrix: for Test Data

Heart Attack

📌 Proje Açıklaması

Bu projede, veri setindeki aykırı değerlerin (outliers) tespiti için Z-skoru ve Winsorizing yöntemleri kullanılmıştır. Ayrıca, kategorik özellikler (categorical features) için uygun Encoding işlemleri gerçekleştirilmiştir. Model optimizasyonu aşamasında ise GridSearchCV kullanılarak Hyperparameter Tuning yapılmıştır. Bu projede kullanılan makine öğrenmesi modelleri arasında LogisticRegression en yüksek başarıyı elde etmiştir. Test veri seti üzerinde yapılan değerlendirmelere göre, LogisticRegression modelinin accuracy_score %88 olarak ölçülmüştür.

Confusion Matrix	ROC Curve

MNIST

📌 Proje Açıklaması

Bu projede Principal Component Analysis (PCA) kullanılarak boyut indirgeme işlemi gerçekleştirilmiştir.
Model optimizasyonu için Hyperparameter Tuning yöntemi uygulanmış ve GridSearchCV kullanılarak en iyi parametreler belirlenmiştir.

Bu projede kullanılan makine öğrenmesi modelleri arasında MLP ve SVM, en yüksek başarıyı elde etmiştir. Test veri seti üzerinde yapılan değerlendirmelere göre, doğruluk oranı %97 olarak ölçülmüştür. Model değerlendirme sürecinde Voting Classifier (Soft Voting) kullanıldı ve test verisi üzerindeki doğruluk oranı %96 olarak hesaplanmıştır.

MLP Confusion Matrix

SVM Confusion Matrix

Voting Classifier (Soft) Confusion Matrix

California Housing Prices

📌 Proje Açıklaması

To download the dataset, you need to set up the Kaggle API using the kaggle.json API key.

Steps to Set Up Kaggle API

Sign in to Kaggle:
- Go to Kaggle and log in to your account.
Create a New Kaggle API Token:
- Visit the Kaggle API page.
- Click on the "Create New API Token" button.
- This will download the kaggle.json file.
Place the kaggle.json File in the Appropriate Directory:
- Windows: Move the kaggle.json file to the following path:
```
C:\Users\YourUser\.kaggle\kaggle.json
```
- Mac/Linux: Move the kaggle.json file to the following path:
```
~/.kaggle/kaggle.json
```
Install the Kaggle Package: Run the following command to install the Kaggle API Python package:
```
pip install kaggle
```

Bu projede, konut fiyatlarını tahmin etmek amacıyla çeşitli regresyon modelleri kullanılmıştır. Veri seti üzerinde bazı veri işleme teknikleri uygulanmış, model hiperparametre ayarlamaları yapılmış ve en iyi sonuç veren model seçilmiştir.

Veri İşleme Adımları

Kategorik Verilerin Kodlanması: Kategorik sütunlar için One-Hot Encoding kullanılmıştır.
Eksik Verilerin Tamamlanması: Eksik veriler, K-Nearest Neighbors (KNN) algoritması ile tamamlanmıştır.
Korelasyon Analizi: Değişkenler arasındaki ilişkiler incelenmiş ve hedef değişkenle en güçlü ilişkiyi gösteren özellikler belirlenmiştir.

Model Seçimi ve Hiperparametre Ayarlaması

Hiperparametre Ayarlaması: GridSearchCV kullanılarak modellerin hiperparametreleri optimize edilmiştir.
En İyi Model: En iyi performans DecisionTreeRegressor (DTR) modeli ile elde edilmiştir. Bu modelin performans metrikleri:
- MSE (Ortalama Kare Hatası): 3,5
- R² Skoru: 0.7308
Özellik Önem Düzeyleri: Final modeldeki özelliklerin önem düzeyleri incelenmiştir.

Customer Segmentation - Clustering

📌 Proje Açıklaması

Veri Analizi ve Ön İşleme: Kategorik değişkenlerin encode edilmesi, verinin standartlaştırılması
Boyut Azaltma: PCA ile optimum bileşen sayısının belirlenmesi
Optimum Küme Sayısının Belirlenmesi: Yellowbrick
Kümeleme Modelleri: K-Means ve Hiyerarşik Kümeleme (Dendrogram - Complete yöntemi)

Random User Login Logs - Clustering

📌 Proje Açıklaması

Bu projede, random kullanıcı giriş kayıtları verisi oluşturulmuş ve çeşitli analizler ile kümeleme yöntemleri uygulanmıştır.

Veri Seti Oluşumu: Normal dağılıma sahip rastgele kullanıcı giriş logları oluşturuldu.
Veri Analizi ve Görselleştirme: Özelliklerin dağılımları ve korelasyonlar incelenmiştir. Verinin daha iyi anlaşılması için t-SNE tekniği ile görselleştirme yapılmıştır.
Kümeleme ve Modelleme: Elbow yöntemi ile optimum küme sayısı belirlenmiştir. Daha esnek bir model olan Gaussian Mixture Model (GMM) kullanılarak kümeleme gerçekleştirilmiştir. Dendrogram yöntemiyle kümeleme, ward yöntemi kullanılarak gerçekleştirilmiştir.

Taxi-v3 Reinforcement Learning

📌 Proje Açıklaması

Bu proje, OpenAI Gym ortamındaki Taxi-v3 problemi üzerinde Q-learning algoritması kullanılarak gerçekleştirilmiştir.🚖 Ortam hakkında detaylı bilgi için 👉 https://gymnasium.farama.org/environments/toy_text/taxi/

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
1-WaterQuality-BinaryClassification		1-WaterQuality-BinaryClassification
2-HeartAttack-BinaryClassification		2-HeartAttack-BinaryClassification
3-MNIST-ImageMultiClassification		3-MNIST-ImageMultiClassification
4-HousingPrices-Regression		4-HousingPrices-Regression
5-CustomerSegmentation-Unsupervised-Kmeans		5-CustomerSegmentation-Unsupervised-Kmeans
6-UserLoginLogs-Clustering-CreatingDataSet		6-UserLoginLogs-Clustering-CreatingDataSet
7-ReinforcementLearning-TaxsiV3		7-ReinforcementLearning-TaxsiV3
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Table of Contents

Water Quality

📌 Proje Açıklaması

Heart Attack

📌 Proje Açıklaması

MNIST

📌 Proje Açıklaması

California Housing Prices

📌 Proje Açıklaması

Steps to Set Up Kaggle API

Veri İşleme Adımları

Model Seçimi ve Hiperparametre Ayarlaması

Customer Segmentation - Clustering

📌 Proje Açıklaması

Random User Login Logs - Clustering

📌 Proje Açıklaması

Taxi-v3 Reinforcement Learning

📌 Proje Açıklaması

About

Uh oh!

Releases

Packages

Languages

License

havva-nur-ezginci/ML-Applications

Folders and files

Latest commit

History

Repository files navigation

Table of Contents

Water Quality

📌 Proje Açıklaması

Heart Attack

📌 Proje Açıklaması

MNIST

📌 Proje Açıklaması

California Housing Prices

📌 Proje Açıklaması

Steps to Set Up Kaggle API

Veri İşleme Adımları

Model Seçimi ve Hiperparametre Ayarlaması

Customer Segmentation - Clustering

📌 Proje Açıklaması

Random User Login Logs - Clustering

📌 Proje Açıklaması

Taxi-v3 Reinforcement Learning

📌 Proje Açıklaması

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages