Skip to content

daeunni/KED_Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 

Repository files navigation

KED_Project

[분석] 사업목적을 활용한 업종코드 예측

대회 기간 수행내용 결과
예선 21.04.09 ~ 21.05.23 사업목적을 활용한 업종코드 예측 본선 진출
본선 21.06.12 프레젠테이션 우수상(2위)

📌 Techniques

NLP


📌 Process

1) Tokenizer - Mecab

다음과 같이 git-clone하여 사용

  %cd /content/
  !git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git
  %cd Mecab-ko-for-Google-Colab
  ! bash install_mecab-ko_on_colab190912.sh

2) Embedding - Fasttext

위키피디아 pretrain model 사용

3) Modeling - BILSTM

단어 구성에 주목할 수 있는 양방향 순환신경망 고려

  def build_model():
    model = tf.keras.Sequential()
    model.add(tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(128, return_sequences=True), input_shape=(None, n_features)))
    model.add(tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(128)))
    model.add(tf.keras.layers.Dense(100, kernel_initializer= 'he_normal', activation='relu'))
    model.add(tf.keras.layers.Dropout(0.3))
    model.add(tf.keras.layers.Dense(19, activation='softmax'))    
    return model      

📌 실행 환경

  • Tensorflow 2.4.0 버전에서 작성되었습니다.
  • colab pro 환경에서 작성되었습니다.

About

KED(한국기업데이터) 분석공모전 (우수상, 2위)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages