Skip to content

ggororok/Shinhan_Bigdata

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

49 Commits
 
 

Repository files navigation

신한마크 신한그룹 빅데이터 해커톤 (제 3회)

메인이미지

신한마크 주제: 건강을 더하다 +he(the) 건강 서비스

개발기간

  • 2024-10-07 ~ 2024-11-21

참여인원

이름 직책
김민지 팀리더
김용태 팀원
박규리 팀원
원종철 팀원

✨ 프로젝트 제안 배경(3C분석)

1. 시장(트렌드)분석: '건강' 키워드 선정

2. 경쟁사 분석: 일상 속 맞춤형 고객 서비스 다수

3. 자사 분석: 일상 속 간편한 육체 건강 서비스 부족


🧑🏻‍💻 분석 및 모델링 과정

1️⃣ 칼럼 추출

  • 건강과 관련된 소비 데이터(의료, 스포츠)를 칼럼으로 추출

2️⃣ 상관분석

  • 의료 데이터: 비율, 금액 상관성X
  • 스포츠 데이터: 비율, 금액 상관성O / 골프장 상관성O

3️⃣ 피처 엔지니어링

  • 이용금액과 이용비율을 곱해서 ‘1인당 소비 기대금액’ 칼럼 추출

4️⃣ 이상치 처리

  • 의료 데이터: 과도하게 큰 값 제외(보험사 관심 대상X)
  • 스포츠 데이터: 과도하게 큰 값 제외X(보험사 관심 대상)

5️⃣ 군집 분석, 비율검정

  • Elbow Method, Silhouette Analysis를 통한 최적의 군집개수(k) 선정
  • 군집별 고객군 연령대 분포 확인
  • 2번 클러스터를 기준으로 또 다시 군집분석 시행
  • 해당 군집의 보험 데이터 관련 특성 분석

🔍 결과물 설계

해당 군집(20대, 건강관심)의 건강 보험 가입률 증진을 목표로 함

  • 타겟층 확장(기존고객, 카드고객, 신규고객)
  • 기존 신한 라이프 "마이 데이터" 서비스 개선방향 제시

💻 Technology

python  Visual Studio Code  
NumPy   Pandas   SciPy  
Matplotlib   scikit-learn 

About

[신빅해] 건강을 더하다 +he(the) 건강 서비스

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published