개발기간
- 2024-10-07 ~ 2024-11-21
참여인원
이름 | 직책 |
---|---|
김민지 | 팀리더 |
김용태 | 팀원 |
박규리 | 팀원 |
원종철 | 팀원 |
1️⃣ 칼럼 추출
- 건강과 관련된 소비 데이터(의료, 스포츠)를 칼럼으로 추출
2️⃣ 상관분석
- 의료 데이터: 비율, 금액 상관성X
- 스포츠 데이터: 비율, 금액 상관성O / 골프장 상관성O
3️⃣ 피처 엔지니어링
- 이용금액과 이용비율을 곱해서 ‘1인당 소비 기대금액’ 칼럼 추출
4️⃣ 이상치 처리
- 의료 데이터: 과도하게 큰 값 제외(보험사 관심 대상X)
- 스포츠 데이터: 과도하게 큰 값 제외X(보험사 관심 대상)
5️⃣ 군집 분석, 비율검정
- Elbow Method, Silhouette Analysis를 통한 최적의 군집개수(k) 선정
- 군집별 고객군 연령대 분포 확인
- 2번 클러스터를 기준으로 또 다시 군집분석 시행
- 해당 군집의 보험 데이터 관련 특성 분석
해당 군집(20대, 건강관심)의 건강 보험 가입률 증진을 목표로 함
- 타겟층 확장(기존고객, 카드고객, 신규고객)
- 기존 신한 라이프 "마이 데이터" 서비스 개선방향 제시