Với bộ dữ liệu về một rạp phim được cung cấp bởi ban tổ chức cuộc thi Data GotTalent 2024, đội ngũ DataSquad đã xử lý, phân tích và đưa ra những đề xuất nhằm tối ưu hóa hoạt động kinh doanh.
Bên cạnh đó, DataSquad còn xây dựng một database với nền tảng Azure nhằm lưu trữ dữ liệu cùng với một data pipeline để thực hiện quá trình ETL bao gồm extract dữ liệu từ file spreadsheet, transform dữ liệu và load vào database.
Sau cùng, một dashboard được xây dựng với Streamlit để báo cáo kinh doanh.
Dashboard: https://dashboardcinema-datasquad2024.streamlit.app/
- analysis_cinema.ipynb:
- Giai đoạn 1: Làm sạch và khám phá dữ liệu
- Giai đoạn 2: Nạp dữ liệu
- Tạo server, database trên Azure:
- Sử dụng pyodbc để connect db trên azure
- Thiết kế database: Cấu hình các trường dữ liệu, tạo ràng buộc(FK) giữa các bảng.
- Đẩy dữ liệu lên database
- Tạo server, database trên Azure:
- Giai đoạn 3: Phân tích dữ liệu
- Phân tích doanh thu
- Phân tích khách hàng
- dashboard_cinema.py
- Sales dashboard
- Customer dashboard
- Giới thiệu
- report_cinema.pdf
- Tổng hợp nội dung phân tích
- Tiền xử lý và khám phá dữ liệu
- Phân tích dữ liệu
- cleaned_data_cinema.xlsx
- Customer
- Ticket
- Film
- requirements.txt
- Môi trường để lập trình
- Phạm Anh Vĩ
- Xây dựng database và data pipeline
- Xây dựng dashboard
- Phân tích dữ liệu
- Quản lý dự án
- Phù Trung Thiện
- Phân tích dữ liệu
- Data storytelling
- Huỳnh Thông
- Khám phá, tiền xử lý dữ liệu
- Phân tích dữ liệu
- Trần Ngọc Tuấn
- Phân tích dữ liệu
- Tiền xử lý dữ liệu