Skip to content

SKNETWORKS-FAMILY-AICAMP/SKN18-1st-3Team

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

3 Commits
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

πŸš€ ν”„λ‘œμ νŠΈλͺ… (예: SKN18‑1st‑3Team)

νŒ€λͺ…, ν”„λ‘œμ νŠΈλͺ…, 개발 κΈ°κ°„, 슬둜건 λ˜λŠ” ν•œ 쀄 μ†Œκ°œ


πŸ“‹ λͺ©μ°¨

  1. νŒ€ μ†Œκ°œ
  2. ν”„λ‘œμ νŠΈ κ°œμš”
  3. 기술 μŠ€νƒ
  4. μ‹œμŠ€ν…œ ꡬ쑰 및 ν”Œλ‘œμš°
  5. μ£Όμš” κΈ°λŠ₯
  6. 데이터 흐름 및 μ €μž₯ 방식
  7. UI ꡬ성 (Streamlit 닀쀑 νŽ˜μ΄μ§€)
  8. ERD
  9. UI(νŽ˜μ΄μ§€) ꡬ성

1. νŒ€ μ†Œκ°œ

πŸ‘₯ νŒ€μ› μ†Œκ°œ

λ°•μ„Έμ˜ κΉ€λ‹΄ν•˜ κΉ€λ―Όμ£Ό μ΄μƒνš¨ μž„μŠΉμ˜₯ 채린
@github1 @DamHA-Kim @kmjj0801 @lsh7159 @SeungOk00 @cofls99

2. ν”„λ‘œμ νŠΈ κ°œμš”

βœ… ν”„λ‘œμ νŠΈ λͺ©ν‘œ

  • μžλ™μ°¨ 등둝 μˆ˜μ™€ λ‹€μ–‘ν•œ μ‚¬νšŒ μ§€ν‘œκ°„μ˜ 상관 관계 뢄석
  • μ „κΈ°μ°¨ μƒμš©ν™” 동ν–₯ 예츑
  • κΈ°μ•„ μžλ™μ°¨ FAQ

3. 기술 μŠ€νƒ

βœ” 크둀링 (faq.py)

  • κΈ°μ•„ 고객 FAQ μ›Ή νŽ˜μ΄μ§€μ—μ„œ μΉ΄ν…Œκ³ λ¦¬λ³„ μ§ˆλ¬Έβ€‘λ‹΅λ³€ 전체 μˆ˜μ§‘
  • νŽ˜μ΄μ§€ 처리 및 반볡 데이터 μˆ˜μ§‘ μžλ™ν™”
  • κ²°κ³Όλ₯Ό csv 파일둜 μ €μž₯

βœ” DB μ €μž₯ (common/insert_db.py)

  • CSV 파일 기반 MySQL ν…Œμ΄λΈ” 생성 및 데이터 μ‚½μž…

βœ” UI 섀계 (pages/ν•˜λΆ€νŽ˜μ΄μ§€)

  • FAQ 검색 + μΉ΄ν…Œκ³ λ¦¬ ν•„ν„° κΈ°λŠ₯
  • μ‚¬νšŒ μ§€ν‘œμ— λŒ€ν•œ 뢄석 κ²°κ³Ό 좜λ ₯
  • μ „κΈ°μ°¨ 동ν–₯

6. 데이터 흐름 및 μ €μž₯ 방식

  • selenium 및 beautifulsoup으둜 μ›ΉνŽ˜μ΄μ§€λ₯Ό 크둀링 μž‘μ—…
  • μˆ˜μ§‘ 데이터 μ €μž₯ ν˜•νƒœ: CSV/XLSX (kia_faq_data.csv λ“±)
  • 이 데이터λ₯Ό insert_db.py둜 MySQL ν…Œμ΄λΈ” kia_faq에 μ €μž₯
  • μ‹€μ‹œκ°„ μ‘°νšŒλŠ” Streamlit이 DBλ‘œλΆ€ν„° 직접 μ½λŠ” 방식 λ˜λŠ” pandas CSV λ‘œλ”© 방식
  • DB 접속 μ •λ³΄λŠ” .env νŒŒμΌμ— μ €μž₯ (host, port, user, password, db_name λ“±)

7. UI ꡬ성 (Streamlit 닀쀑 νŽ˜μ΄μ§€)

CHAP1/
β”œβ”€β”€ assets/                  # 이미지, 둜고 λ“± 정적 λ¦¬μ†ŒμŠ€
β”‚   β”œβ”€β”€ electric_car.png
β”‚   └── skn_logo.png

β”œβ”€β”€ common/                  # 곡톡 μœ ν‹Έ 및 DB μ΄ˆκΈ°ν™” μ½”λ“œ
β”‚   β”œβ”€β”€ .env                 # DB ν™˜κ²½ λ³€μˆ˜ 파일
β”‚   β”œβ”€β”€ create_db.sql        # DB μŠ€ν‚€λ§ˆ 생성 쿼리
β”‚   β”œβ”€β”€ insert_db.py         # CSV β†’ MySQL 데이터 μ‚½μž… 슀크립트
β”‚   └── utils.py             # DB 접속 및 기타 μœ ν‹Έ ν•¨μˆ˜

β”œβ”€β”€ data/
β”‚   └── KIA_FAQ/            
β”‚       β”œβ”€β”€ faq.py           # Selenium 기반 FAQ 크둀러
β”‚       └── kia_faq_data.csv # μˆ˜μ§‘λœ CSV 데이터

β”œβ”€β”€ pages/                                  # Streamlit 닀쀑 νŽ˜μ΄μ§€ ꡬ성
β”‚   β”œβ”€β”€ faq_page.py                          # 메인 FAQ 검색 UI
β”‚   β”œβ”€β”€ 01. Region_Popul_Graph.py           # 지역별 인ꡬ-μžλ™μ°¨ 등둝 μƒκ΄€κ³„μˆ˜
β”‚   β”œβ”€β”€ 02. Employment_and_Industry.py      # 고용자수-μ‚°μ—… μƒκ΄€κ³„μˆ˜ νŽ˜μ΄μ§€
β”‚   β”œβ”€β”€ 03. Number_of_Registering_Car.py     # μ°¨λŸ‰ 등둝 μˆ˜μ™€ 고용/μ†Œλ“/μ‚°μ—… κ°„ 상관관계 뢄석  
β”‚   └── 04. Electric_Car_and_Infra.py    # μ „κΈ°μ°¨ 등둝 및 인프라 뢄포 νŽ˜μ΄μ§€

β”œβ”€β”€ src/
β”‚   └── crawling.py          # 기타 크둀러

β”œβ”€β”€ app.py                   # Streamlit 첫 νŽ˜μ΄μ§€
└── requirements.txt         # μ„€μΉ˜ ν•„μš” νŒ¨ν‚€μ§€ λͺ©λ‘

  • app.pyλŠ” Streamlit page_config 기반으둜 μžλ™ νŽ˜μ΄μ§€ λΌμš°νŒ…
  • 각 νŽ˜μ΄μ§€λŠ” λ…λ¦½μ μœΌλ‘œ ꡬ성 κ°€λŠ₯ (검색, μ‹œκ°ν™”, μ‚¬μš©μž μΈν„°λž™μ…˜ λ“±)

8. ERD


9. UI(νŽ˜μ΄μ§€) ꡬ성

πŸ“„ Page 1: μ „κ΅­ 연도별 고용자 수 및 μ¦κ°€μœ¨

  • μ „κ΅­ 고용자 수 좔이

    • 연도별 λΌμΈκ·Έλž˜ν”„
    • 고용자 수 및 μ¦κ°€μœ¨ ν‘œ
  • 지역별 고용자 수 λ³€ν™”

    • 지역별 연도별 λΌμΈκ·Έλž˜ν”„ 및 ν‘œ
  • μ£Ό μ‚°μ—… 뢄석 (3κ°œλ…„ 평균)

    • 지역별 μ‚°μ—… 비쀑 μ›ν˜• 차트
    • 평균 고용자 수 및 λΉ„μœ¨ ν‘œ
  • Top3 μ‚°μ—…κ΅° 뢄석

    • 지역별 λŒ€ν‘œ μ‚°μ—…κ΅° λ‘œλ“œλ§΅ + μ›ν˜• 차트
    • μš”μ•½ ν‘œ (μ§€μ—­, μ‚°μ—…, μˆœμœ„, 고용자 수)

πŸ“„ Page 2: μ°¨λŸ‰ λ“±λ‘μˆ˜ vs 고용/μ†Œλ“/산업뢄포

  • 고용자 수 vs μ°¨λŸ‰ 등둝 수

    • 지역별 산점도 + μ„ ν˜• νšŒκ·€μ„ 
    • μƒκ΄€κ³„μˆ˜ 및 p-value 뢄석 ν‘œ
  • μ§€μ—­ μ†Œλ“ vs μ°¨λŸ‰ 등둝 수

    • 산점도 μ‹œκ°ν™” 및 상관관계 뢄석
  • 산업별 영ν–₯도

    • 산업이 μ°¨λŸ‰/고용자 μˆ˜μ— λ―ΈμΉ˜λŠ” 영ν–₯ κ³„μˆ˜ κ·Έλž˜ν”„ (coef + μ—λŸ¬λ°”)

πŸ“„ Page 3: μ „κΈ°μ°¨ 인프라 및 ν™”μž¬ κ΄€λ ¨ 데이터 μ‹œκ°ν™”

πŸ”Ή Table 1: 인ꡬ수 & 건물 수 밀도

  • Figure 1: 건물 수 β†’ 히트맡 (νžˆνŠΈκ°’: 면적당 인ꡬ수)
  • Figure 2: 인ꡬ 수 β†’ 히트맡 (νžˆνŠΈκ°’: 면적당 건물 수)

πŸ”Ή Table 2: μ „κΈ°μ°¨ 등둝 좔이

  • Figure 1: 지역별 면적당 μ „κΈ°μ°¨ 수 β†’ λ§‰λŒ€κ·Έλž˜ν”„
  • Figure 2: 2024λ…„ 월별 μ¦κ°€λŸ‰ β†’ λΌμΈκ·Έλž˜ν”„

πŸ”Ή Table 3: μ „κΈ°μ°¨ ν™”μž¬ λ³€ν™”

  • Figure 1: 지역별 ν™”μž¬ λ°œμƒ λ³€ν™”μœ¨ β†’ λ§‰λŒ€κ·Έλž˜ν”„

πŸ”Ή Table 4: μΆ©μ „μ†Œ ꡬ좕 ν˜„ν™©

  • Figure 1: 연도별 면적당 μΆ©μ „μ†Œ 수 β†’ λ§‰λŒ€κ·Έλž˜ν”„

10. 회고 및 감사 인사

πŸ™ 회고

  • λ°•μ„Έμ˜: 데이터 뢄석 κ°œλ…μ„ 배우기 전에 μΈμ‚¬μ΄νŠΈλ₯Ό λ½‘μœΌλ €λ‹€λ³΄λ‹ˆ μ–΄λ €μš΄ 뢀뢄은 λΆ„λͺ…νžˆ μžˆμ—ˆμ§€λ§Œ νŒ€μ›λ“€ λͺ¨λ‘ μ˜μ§€κ°€ λ„˜μ³μ„œ λ‹€μ–‘ν•œ λ°©ν–₯으둜 μ§„ν–‰ν•΄λ³Ό 수 μžˆμ–΄μ„œ μ’‹μ•˜μŠ΅λ‹ˆλ‹€.
  • κΉ€λ‹΄ν•˜: ν•˜λ“œμΊλ¦¬ κ°μ‚¬ν•©λ‹ˆλ‹€. 덕뢄에 μ–΄κΊ λ„ˆλ¨Έλ‘œ 많이 λ°°μ›Œκ°”μŠ΅λ‹ˆλ‹€.
  • κΉ€λ―Όμ£Ό:
  • μ΄μƒνš¨: LLM이 많이 λ°œλ‹¬ν•œ 것 κ°™μŠ΅λ‹ˆλ‹€ cursor ν˜•λ‹˜μ΄ μ§±μž…λ‹ˆλ‹€.
  • 채린: 이번 ν”„λ‘œμ νŠΈλ₯Ό 톡해 μ‹€μ œ 데이터λ₯Ό κ°€μ§€κ³  λ‹¨μˆœν•œ 수치 비ꡐλ₯Ό λ„˜μ–΄ 쑰건별 상관관계λ₯Ό μ •λŸ‰μ μœΌλ‘œ λΆ„μ„ν•˜κ³  μ‹œκ°ν™”ν•˜λŠ” κ²½ν—˜μ„ ν•  수 μžˆμ—ˆμŠ΅λ‹ˆλ‹€. Streamlit을 ν™œμš©ν•œ λŒ€μ‹œλ³΄λ“œ κ΅¬ν˜„κ³Ό erd 섀계 과정을 μˆ˜ν–‰ν•˜λ©΄μ„œ 데이터 뢄석 κ²°κ³Όλ₯Ό λˆ„κ΅¬λ‚˜ μ§κ΄€μ μœΌλ‘œ μ ‘κ·Όν•˜κ³  해석할 수 μžˆλŠ” ν˜•νƒœλ‘œ μ „λ‹¬ν•˜λŠ” λ°©λ²•μ˜ μ€‘μš”μ„±μ„ λ‹€μ‹œ ν•œλ²ˆ λŠκΌˆμŠ΅λ‹ˆλ‹€. 비둝 ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•œ μƒκ΄€κ΄€κ³„λŠ” λ°œκ²¬λ˜μ§€ μ•Šμ•˜μ§€λ§Œ, 데이터 기반으둜 문제λ₯Ό μ •μ˜ν•˜κ³  κ²°κ³Όλ₯Ό μ •μ œλœ ν˜•νƒœλ‘œ μ „λ‹¬ν•˜λŠ” μ „ 과정을 직접 μˆ˜ν–‰ν•˜λ©° 데이터 λΆ„μ„μ˜ 탐색적 κ°€μΉ˜μ™€ ν•œκ³„ λͺ¨λ‘λ₯Ό 싀감할 수 μžˆλŠ” 의미 μžˆλŠ” ν”„λ‘œμ νŠΈμ˜€μŠ΅λ‹ˆλ‹€.

πŸ’Œ 감사 인사

λ³Έ ν”„λ‘œμ νŠΈλŠ” SK λ„€νŠΈμ›μŠ€ AI μΊ ν”„ 1κΈ° 3쑰의 ν˜‘μ—… κ²°κ³Όλ¬Όμž…λ‹ˆλ‹€.
ν”Όλ“œλ°± 및 κ°œμ„  사항은 μ–Έμ œλ“  ν™˜μ˜ν•©λ‹ˆλ‹€!


πŸ“Œ μ‹€ν–‰ κ°€μ΄λ“œ (간단 μš”μ•½)

# 가상 ν™˜κ²½ 생성 및 μ§„μž…
uv venv .venv --python 3.13
.venv/Scripts/activate

# 개발 ν™˜κ²½ μ„ΈνŒ…
uv pip install -r requirements.txt

# DB μ΄ˆκΈ°ν™”
mysql -u YOUR_USER -p < common/create_db.sql

# 크둀링 μ‹€ν–‰ (CSV 생성)
python data/KIA_FAQ/faq.py

# DB μ‚½μž…
python common/insert_db.py

# Streamlit μ‹€ν–‰
streamlit run app.py

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •