이 프로젝트는 경기도 내 시·군 데이터를 활용하여 출산율에 영향을 주는 주요 요인을 분석하고, 데이터 기반의 정책 인사이트를 도출하는 것을 목표로 합니다.
보육, 의료, 치안, 교육 인프라 등 다양한 공공 데이터를 활용하여 회귀 모델을 적용하고, 변수별 영향력을 시각화합니다.
- 출산율(2023년 기준)에 영향을 미치는 주요 피처(변수) 파악
- 모델별 성능 비교 및 변수 중요도 분석
- 데이터 기반의 정책 제안 도출
다음과 같은 항목이 포함되어 있습니다:
- 유치원 수
- 병원 수
- 초등학교 수
- 돌봄교실 수
- 범죄 발생 건수
- 출산장려금 지원금
- 인구밀도
- 출산아 수 (2023년)
- 선형 회귀 (Linear Regression)
- 릿지 회귀 (Ridge)
- 라쏘 회귀 (Lasso)
- 랜덤 포레스트 회귀 (Random Forest Regressor)
- 그래디언트 부스팅 회귀 (Gradient Boosting Regressor)
- 모델별 R² 점수 비교
- 모델별 변수 가중치(계수 또는 중요도) 매트릭스
- 평균 정규화 변수 중요도 시각화
- 출산율과 인프라 간 관계에 대한 정책 인사이트