์ด ํ๋ก์ ํธ๋ ๋๋๊ฐ์ 8๊ฐ ๋ณด์์ ๋ฐ๊ฒฌ๋๋ cyanobacteria 4์ข (Microcystis, Anabaena, Oscillatoria, Aphanizaomenon)๊ณผ ์ด ์ง์(TN), ์ด ์ธ(TP) ์์น, ๋ ์ฑ ๋ฌผ์ง(MC-LR) ๊ฐ์ ์๊ด๊ด๊ณ์ ์์ธ์ ๋ถ์ํ๋ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๊ตฌํํฉ๋๋ค. ์ด ๋ชจ๋ธ์ ํ๊ฒฝ ๋ฐ์ดํฐ(https://water.nier.go.kr/web) ๋ฅผ ํตํด ์์ง ๊ด๋ฆฌ ํํฉ์ 2020-2023.7์๊น์ง ๋ถ์ํ์ฌ ์ ์ํ์ต๋๋ค. ํ๋ก์ ํธ์ ๋ชฉ์ ์ ๋ ์ง ๋ฐ ๊ณ์ ์ ๋ฐ๋ฅธ cyanobacteria ์ ๋ฐ ๋ค๋ฅธ ์์ธ๋ค๊ณผ ์ด์ ์ํฅ์ ๋ฐ๋ ๋ ์ฑ ๋ฌผ์ง ์์น์ ๋ณํ๋ฅผ ๋ถ์ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
๋ณธ ๋ชจ๋ธ์ ๋ค์์ ์ฃผ์ ๋ด์ฉ์ ๋ถ์ํ์ต๋๋ค. :
- ์๊ด๊ด๊ณ ๋ถ์: ๋๋๊ฐ 8๊ฐ ๋ณด์์ ์ฑ์ทจํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, cyanobacteria์ 4์ข ๊ฐ์ฒด ์์ TN, TP ์์น ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ๋ถ์ํฉ๋๋ค.
- ์ธต๋ณ ๋ ์ ๋ฌผ์ง ๋ถ์: ์์ง ๋ฐ์ดํฐ ์ค ๋ ์ฑ์ ์ผ์ผํค๋ MC-LR ๋์ ๋ฌผ์ง์ ํ์ธต๊ณผ ํผํฉ์ธต์์ ๊ฐ๊ฐ ์์ง๋ฉ๋๋ค. ๋ชจ๋ธ์ ์ด ๋ ์ธต์ ๊ฐ ์ธต์ cyanobacteria ๊ฐ์ฒด์์ ๋์ ๋ฌผ์ง ์์น ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ์ด๋ป๊ฒ ๋ค๋ฅธ์ง 8๊ฐ ๋ณด๋ง๋ค ํ๊ท ๋ถ์(Linear Regression)์ ํตํด ๋ถ์ํฉ๋๋ค.
- Microcystis cells ๋ถ์: 2 ์ดํ cyanobacteria ์ค ์๊ด๊ด๊ณ๊ฐ ๋์ ์ข ์ ์์ ์ด ์ข ์ ์์ ์ํฅ์ ๋ฏธ์น๋ ์์ธ๋ค์ ๋ํ ๋ถ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ(Linear Regression, Decision Tree, SVM, RF ๋ชจ๋ธ)์ ํ์ฉํ์ฌ ์งํํฉ๋๋ค.
๋ฐ์ดํฐ๋ ๋๋๊ฐ์ 8๊ฐ ๋ณด(์์ฃผ๋ณด, ๋๋จ๋ณด, ๊ตฌ๋ฏธ๋ณด, ์น ๊ณก๋ณด, ๊ฐ์ ๊ณ ๋ น๋ณด, ๋ฌ์ฑ๋ณด, ํฉ์ฒ์ฐฝ๋ ๋ณด, ์ฐฝ๋ ํจ์๋ณด)์์ ์์ง๋์์ผ๋ฉฐ, ๋ค์๊ณผ ๊ฐ์ ์ ๋ณด๋ฅผ ํฌํจํฉ๋๋ค:
- Cyanobacteria ๊ฐ์ฒด์ (4์ข )
- ์ด ์ง์(TN) ๋ฐ ์ด ์ธ(TP) ์์น
- 8๊ฐ ๋ณด์ ํ์ธต ๋ฐ ํผํฉ์ธต์์ ์์ง๋ MC-LR
- WT(Water Temperature), pH, DO, Chl-a, DTN, DTP, EC(Electric Conductivity), NH3-N, NO3-N, PO4-P, 8๊ฐ ๋ณด ๊ทผ์ฒ 7์ผ๊ฐ ๊ฐ์๋ ํ๊ท , BOD, COD, TOC, SS
์ด ํ๋ก์ ํธ์์ ์ฌ์ฉ๋ ์ฃผ์ ๊ธฐ์ ๋ฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- Python
- Scikit-learn
- Pandas
- NumPy
- Matplotlib
- statsmodels
- seaborn
- Scipy
์ด ๋ชจ๋ธ์ ๋๋๊ฐ์์์ cyanobacteria ๊ฐ์ฒด์ ์ค Microcystis๊ฐ ์์์ผ ์์น ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ๋ค๋ฅธ ์ข ๋ณด๋ค ๋๋ค๋ ๊ฒ์ ๋ฐํ๋์ต๋๋ค. ๊ฒฐ๊ณผ๋ (https://colab.research.google.com/drive/1A0qJ7vzFH2BczOxfAyMLiwTWSaSz3AlT) ๊ณผ ๊ฒฐ๊ณผ-(https://colab.research.google.com/drive/16HYS8W9_h_8L4jOIzC_I7dvl2mpGPuvZ#scrollTo=AWY6gtOafHHG) ์์ ํ์ธํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ถ์์ ๊ณ์ ๋ณ๋ก ์ด๋ค ์์ธ์ด ๊ฐ์ฒด ์ ์ฆ๊ฐ์ ์ํฅ์ ์ฃผ๋์ง ๋ํ ์์๋ด์ด ํฅํ ์์ง ๊ด๋ฆฌ ๋ฐ ์๋ฐฉ ์กฐ์น์ ์ฌ์ฉ๋ ๊ฒ์ ๋๋ค.