Skip to content

Proyek ini melakukan web scraping pada data DP4 KPU untuk menghitung ukuran sampel survei menggunakan Slovin dengan Margin of Error 3%. Menggunakan stratified random sampling berdasarkan provinsi dan gender, eksperimen oversampling diterapkan pada 7 provinsi dengan sampel kecil, diikuti pembobotan untuk distribusi akurat

Notifications You must be signed in to change notification settings

ranggaakhli/Scrapping-KPU-web

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

4 Commits
Β 
Β 
Β 
Β 

Repository files navigation

πŸ“Š Sampling Data Pemilih DP4 – Web Scraping & Stratified Random Sampling

🧠 Ringkasan Proyek

Proyek ini melakukan scraping data Daftar Penduduk Potensial Pemilih Pemilu (DP4) dari situs resmi KPU, mencakup jumlah pemilih per provinsi dan jenis kelamin. Tujuannya adalah menyimulasikan proses sampling survei nasional menggunakan pendekatan stratified random sampling.

🎯 Tujuan

  • Scraping data pemilih berdasarkan provinsi dan gender
  • Menghitung ukuran sampel dengan rumus Slovin (Margin of Error: 3%)
  • Menerapkan stratified sampling berdasarkan provinsi & gender
  • Melakukan oversampling (Γ—2) pada 7 provinsi dengan sampel kecil
  • Menghitung pembobotan agar hasil tetap representatif

πŸ› οΈ Langkah-langkah

  1. Web Scraping
    Mengambil data dari website KPU menggunakan BeautifulSoup. Data terdiri dari:

    • Nama Provinsi
    • Jumlah Laki-laki
    • Jumlah Perempuan
    • Jumlah Total
  2. Perhitungan Ukuran Sampel
    Menggunakan rumus Slovin:

    $$n = \frac{N}{1 + N \cdot e^2}$$

    Di mana N adalah total populasi dan e = 0.03.

  3. Stratified Sampling
    Sampel dibagi secara proporsional berdasarkan provinsi dan gender. Pemilihan dilakukan secara acak dengan numpy.

  4. Oversampling (Eksperimen)
    Provinsi dengan sampel terkecil dikalikan dua (Γ—2) untuk mengurangi under-representation.

  5. Pembobotan
    Menghitung bobot untuk mengembalikan proporsi populasi asli:

    $$\text{Bobot} = \frac{\text{Proporsi Populasi Nyata}}{\text{Proporsi Sampel}}$$

About

Proyek ini melakukan web scraping pada data DP4 KPU untuk menghitung ukuran sampel survei menggunakan Slovin dengan Margin of Error 3%. Menggunakan stratified random sampling berdasarkan provinsi dan gender, eksperimen oversampling diterapkan pada 7 provinsi dengan sampel kecil, diikuti pembobotan untuk distribusi akurat

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published