💗💗💗💗💗
HSU 2022 Capstone Project
따뜻한 세상을 위한 통합 기부 플랫폼
마모모의 데이터를 수집 및 조작합니다.
마모모 프로젝트의 전체적인 구조 및 동작 방법에 대한 설명은 Frontend, Backend 레포지토리의 리드미를 참고해 주세요!
📦donation-crawler
┣ 📂crawler
┃ ┣ 📜campaign.py
┃ ┣ 📜cherry.py
┃ ┣ 📜chromeDriver.py
┃ ┣ 📜happybean.py
┃ ┣ 📜kakao.py
┃ ┗ 📜thedirectdonation.py
┣ 📂data
┃ ┣ 📜cherry.json
┃ ┣ 📜happybean.json
┃ ┣ 📜kakao.json
┃ ┗ 📜thedirectdonation.json
┣ 📂elasticSearch
┃ ┗ 📜elasticSearch_crud.py
┣ 📜app.py
┣ 📜extract.py
┗ 📜stopwords.txt
기부 사이트 데이터를 크롤링합니다.
크롤링 한 데이터를 json파일로 저장한 결과물들 입니다.
Elasticsearch에 insert 및 update 작업을 수행합니다.
Spring서버의 텍스트마이닝 요청을 받는 Flask서버를 운영합니다.
Spring쪽에서 요청받은 텍스트를
KoNLpy
로 형태소 단위로 분해하고- 📜stopwords.txt 목록을 이용해 불용어를 제거합니다.
scikit-learn
으로 빈도수를 분석해 주요 단어를 추출합니다.{"단어": 추출값}
리스트를 Spring에 보냅니다.