Transjakarta adalah sistem transportasi bus rapid transit (BRT) di Jakarta yang melayani jutaan penumpang setiap harinya. Data transjakarta ini dapat memberikan wawasan berharga tentang pola penggunaan, efisiensi operasional, dan kepuasan pelanggan. Analisis data ini penting untuk meningkatkan layanan dan membuat keputusan yang lebih baik.
- Mengidentifikasi dan menangani anomali dalam data pola penggunaan Transjakarta.
- Melakukan visualisasi data untuk memahami distribusi.
- Melakukan analisis statistik untuk mendapatkan insight yang dapat digunakan untuk meningkatkan layanan Transjakarta.
- Memberikan rekomendasi yang dapat diimplementasikan oleh manajemen Transjakarta.
Transjakarta.csv
- transID: Unique transaction id for every transaction
- payCardID: Customers main identifier. The card customers use as a ticket for entrance and exit.
- payCardBank: Customers card bank issuer name
- payCardName: Customers name that is embedded in the card.
- payCardSex: Customers sex that is embedded in the card
- payCardBirthDate: Customers birth year
- corridorID: Corridor ID / Route ID as key for route grouping.
- corridorName: Corridor Name / Route Name contains Start and Finish for each route.
- direction: 0 for Go, 1 for Back. Direction of the route.
- tapInStops: Tap In (entrance) Stops ID for identifying stops name
- tapInStopsName: Tap In (entrance) Stops Name where customers tap in.
- tapInStopsLat: Latitude of Tap In Stops
- tapInStopsLon: Longitude of Tap In Stops
- stopStartSeq: Sequence of the stops, 1st stop, 2nd stops etc. Related to direction.
- tapInTime: Time of tap in. Date and time
- tapOutStops: Tap Out (Exit) Stops ID for identifying stops name
- tapOutStopsName: Tap out (exit) Stops Name where customers tap out.
- tapOutStopsLat: Latitude of Tap Out Stops
- tapOutStopsLon: Longitude of Tap Out Stops
- stopEndSeq: Sequence of the stops, 1st stop, 2nd stops etc. Related to direction.
- tapOutTime: Time of tap out. Date and time
- payAmount: The number of what customers pay. Some are free. Some not.
a. Identifikasi dan Penanganan Missing Values b. Identifikasi dan Penanganan Outliers c. Data Formatting d. Identifikasi dan Penanganan Data Duplikat
- Menggunakan histogram untuk distribusi waktu penggunaan
- Menggunakan line plot untuk melihat tren penggunaan harian
a. Statistika Deskriptif b. Statistika Inferensial
Jam sibuk pagi: 6:00 - 7:00 Jam sibuk sore: 17:00 - 18:00 Rekomendasi:
- Penambahan armada pada jam sibuk pagi dan sore hari untuk mengurangi kepadatan.
- Penyesuaian jadwal keberangkatan untuk mengakomodasi peningkatan jumlah penumpang pada jam sibuk.
- Peningkatan layanan pelanggan dengan menyediakan informasi real-time tentang jadwal dan ketersediaan armada.
Link Visualisasi Tableau : https://public.tableau.com/app/profile/gugun.muhammad.fauzi/viz/DashboardTransjakarta-PurwadhikaJCDSOL-14-GugunMuhammadFauzi/Dashboard1?publish=yes