Proyek ini melakukan scraping data Daftar Penduduk Potensial Pemilih Pemilu (DP4) dari situs resmi KPU, mencakup jumlah pemilih per provinsi dan jenis kelamin. Tujuannya adalah menyimulasikan proses sampling survei nasional menggunakan pendekatan stratified random sampling.
- Scraping data pemilih berdasarkan provinsi dan gender
- Menghitung ukuran sampel dengan rumus Slovin (Margin of Error: 3%)
- Menerapkan stratified sampling berdasarkan provinsi & gender
- Melakukan oversampling (Γ2) pada 7 provinsi dengan sampel kecil
- Menghitung pembobotan agar hasil tetap representatif
-
Web Scraping
Mengambil data dari website KPU menggunakanBeautifulSoup
. Data terdiri dari:- Nama Provinsi
- Jumlah Laki-laki
- Jumlah Perempuan
- Jumlah Total
-
Perhitungan Ukuran Sampel
Menggunakan rumus Slovin:$$n = \frac{N}{1 + N \cdot e^2}$$ Di mana
N
adalah total populasi dane = 0.03
. -
Stratified Sampling
Sampel dibagi secara proporsional berdasarkan provinsi dan gender. Pemilihan dilakukan secara acak dengannumpy
. -
Oversampling (Eksperimen)
Provinsi dengan sampel terkecil dikalikan dua (Γ2) untuk mengurangi under-representation. -
Pembobotan
Menghitung bobot untuk mengembalikan proporsi populasi asli:$$\text{Bobot} = \frac{\text{Proporsi Populasi Nyata}}{\text{Proporsi Sampel}}$$