Peer_Session_Week_4

Jump to bottom

JAEHEE RYU edited this page May 24, 2021 · 1 revision

Day17💫

2021.05.18 (화)

멘토링(with 조용래 멘토님)

1️⃣ Costum Model 검토 및 조언 요청

아래와 같은 형태의 Model을 구현해서 사용중입니다. 초록색 글씨와 같은 의문이 있는데 어떻게 하는 것이 좋을까요?

2️⃣ Validation Dataset 학습 관련

Validation Dataset을 함께 학습시키려고 합니다. 전체 Data를 모두 사용하고, 특정 시점에 학습을 종료하는 것이 좋을까요? 혹은 K-Fold로 접근하는 것은 어떻게 생각하시나요?

Validation Set을 학습 시킬 Epoch도 하이퍼파라미터의 일종으로 생각할 수 있음. 리스키하나, 결국 Public Score를 기준으로 잡을 수 있을 것 같다.
K-Fold 목적
- 최적의 하이퍼 파라미터 찾기
- K-Fold를 이용한 앙상블
결론 : K-Fold도 사용할 수 있는 방법이다!

3️⃣ ODQA Task의 Ensemble

너무 다양한 방법이 있음 ex) 임베딩을 앙상블 할지, 결과를 앙상블 할지...
- 정립된 방법이 아직 없음 그저 아이디어!
- ODQA 분야가 아직 신생 분야이기 때문
context의 token마다의 확률값을 평균
여러 모델로부터의 start & end 조합 score들을 평균

4️⃣ 대회 막바지, 무엇을 해야할까요?

여유를 부려라...ㅋㅋㅋㅋㅋㅋ
혹시나 private 리더보드에서 순위가 바뀔 가능성이 있을까 조금 걱정...
- 멘토님께서 대회 마무리 즈음 하시는 것
  - 앙상블, 후처리, 노가다성 룰베이스 활동들
  - 암호화 기법을 이용한 코드 암호화.....? ⇒ 필수!
정리가 중요하다! 미리미리 기록해두는 것...