Bu proje, TOBB ETÜ'nün BIL401 (Big Data) dersi kapsamında gerçekleştirilmiş olup, kredi kartı işlemleri üzerinden dolandırıcılık tespitini amaçlamaktadır. Projede, Kaggle'dan edinilen veri seti kullanılmıştır. Bu veri seti, işlemlere ait çeşitli özellikler içermekte ve dolandırıcılık tespiti için gerekli derinlemesine analizleri sağlamaktadır.
Bu proje, veri ön işleme, keşifsel veri analizi (EDA) ve makine öğrenimi model eğitimi gibi adımları içermektedir. Proje sürecinde, büyük veri işleme ve analizinde etkin bir çözüm olan Apache Spark teknolojisi kullanılmıştır. Apache Spark, projenin veri işleme ve model eğitimi bölümlerinde kritik bir role sahiptir.