Credit card fraud
Bu projede, kredi kartı verilerini kullanarak dolandırıcılığı tespit etmek için gözetimli öğrenme teknikleri uygulanmıştır. Modelin başarısını değerlendirmek ve performansını artırmak hedeflenmiştir.
Proje, Kredi Kartı Dolandırıcılığı Verisi veri setini kullanmaktadır. Veri seti, dolandırıcılık etiketleriyle birlikte çeşitli özellikleri içeren kredi kartı işlemlerini içerir.
- Model: Lojistik Regresyon, Rastgele Orman, vb.
- Hedef: Dolandırıcılığı sınıflandırmak.
- Değerlendirme Metrikleri: Doğruluk, F1 Skoru, ROC AUC.
- Lojistik Regresyon: Basit ve etkili bir sınıflandırıcıdır.
- Rastgele Orman: Ensemble öğrenme tekniği ile performans artırılmıştır.
- Model Performansı: Lojistik Regresyon, Rastgele Orman ve XGBoost modellerinin performans değerlendirmeleri.
- Hiperparametre Optimizasyonu: Daha iyi sonuçlar için hiperparametrelerin optimizasyonu.
- Veri Ön İşleme: Daha fazla veri özelliği ekleyerek modelin doğruluğunu artırma.
- Model Entegrasyonu: Modelin gerçek dünyada uygulanması ve geniş veri setleri ile test edilmesi.
- Algoritma: K-Means, DBSCAN, Hierarchical Clustering.
- Hedef: Müşteri segmentlerini oluşturmak.
- Değerlendirme Metrikleri: Silhouette Skoru, Davies-Bouldin Skoru.
- K-Means: Belirli sayıda küme oluşturmak için kullanılmıştır.
- DBSCAN: Gürültü ve farklı yoğunlukları ayırt etmek için kullanılmıştır.
- Segmentasyon Sonuçları: K-Means, DBSCAN ve Hierarchical Clustering algoritmalarının sonuçları.
- En İyi Algoritma: K-Means algoritması, en iyi segmentasyon sonuçlarını sağlamıştır.
- Segmentasyon Performansı: Segmentasyon sonuçlarını iyileştirmek için algoritma optimizasyonları.
- Ek Veri Özellikleri: Müşteri özellikleri üzerine daha fazla veri eklenerek segmentasyonun geliştirilmesi.
- Model Entegrasyonu: Segmentasyon sonuçlarının iş dünyasında uygulanması ve daha geniş veri setleri ile test edilmesi.
https://www.kaggle.com/code/sinemeviker/fork-of-creditcard-supervised https://www.kaggle.com/code/sinemeviker/creditcard-unsupervised