Skip to content

bcaitech1/p4-dkt-decayt

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

58 Commits
Β 
Β 
Β 
Β 
Β 
Β 

Repository files navigation

❓ 지식 μƒνƒœ μΆ”λ‘ (Deep Knowledge Tracing)

πŸ†μ΅œμ’… 성적

  • Public LB: AUROC 0.8422 | ACC 0.7823 | 2λ“±:2nd_place_medal:
  • Private LB : AUROC 0.8456 | ACC 0.7715 | 4λ“±

πŸ“šTask Description

μ‚¬μš©μž(학생) 개개인이 ν‘Ό 문제 λ¦¬μŠ€νŠΈμ™€ μ •λ‹΅ μ—¬λΆ€κ°€ λ‹΄κΈ΄ λ°μ΄ν„°λ‘œλΆ€ν„° μ΅œμ’… 문제λ₯Ό λ§žμΆœμ§€ 틀릴지 μ˜ˆμΈ‘ν•˜λŠ” 지식 μƒνƒœ μΆ”λ‘  Task

  • κΈ°κ°„ : 2021.05.24 ~ 2021.06.15(4μ£Ό)

  • Deep Knowledge Tracing(DKT) description :

    • μ£Όμš” λ°μ΄ν„°λŠ” .csv ν˜•νƒœλ‘œ 제곡되며, train/test ν•©μ³μ„œ 총 7,442λͺ…μ˜ μ‚¬μš©μžκ°€ μ‘΄μž¬ν•©λ‹ˆλ‹€. 이 λ•Œ 이 μ‚¬μš©μžκ°€ ν‘Ό λ§ˆμ§€λ§‰ λ¬Έν•­μ˜ 정닡을 맞좜 것인지 μ˜ˆμΈ‘ν•˜λŠ” 것이 μ΅œμ’… λͺ©ν‘œμž…λ‹ˆλ‹€.

      image

      • userID μ‚¬μš©μžμ˜ κ³ μœ λ²ˆν˜Έμž…λ‹ˆλ‹€. 총 7,442λͺ…μ˜ 고유 μ‚¬μš©μžκ°€ 있으며, train/test셋은 이 userIDλ₯Ό κΈ°μ€€μœΌλ‘œ 9 : 1의 λΉ„μœ¨λ‘œ λ‚˜λˆ„μ–΄μ‘ŒμŠ΅λ‹ˆλ‹€.

      • testId μ‹œν—˜μ§€μ˜ κ³ μœ λ²ˆν˜Έμž…λ‹ˆλ‹€. λ¬Έν•­κ³Ό μ‹œν—˜μ§€μ˜ κ΄€κ³„λŠ” μ•„λž˜ 그림을 μ°Έκ³ ν•˜μ—¬ μ΄ν•΄ν•˜μ‹œλ©΄ λ©λ‹ˆλ‹€. 총 1,537개의 κ³ μœ ν•œ μ‹œν—˜μ§€κ°€ μžˆμŠ΅λ‹ˆλ‹€.

      • assessmentItemID λ¬Έν•­μ˜ κ³ μœ λ²ˆν˜Έμž…λ‹ˆλ‹€. 총 9,454개의 고유 문항이 μžˆμŠ΅λ‹ˆλ‹€. "A+μ•ž 6자리"λŠ” testId의 정보λ₯Ό λ‚˜νƒ€λ‚΄κ³  있으며, λ’€ 3μžλ¦¬λŠ” 문제의 번호λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.

        img

      • answerCode μ‚¬μš©μžκ°€ ν•΄λ‹Ή 문항을 λ§žμ·„λŠ”μ§€ 여뢀에 λŒ€ν•œ 이진 데이터이며 0은 μ‚¬μš©μžκ°€ ν•΄λ‹Ή 문항을 ν‹€λ¦° 것, 1은 μ‚¬μš©μžκ°€ ν•΄λ‹Ή 문항을 맞좘 κ²ƒμž…λ‹ˆλ‹€.

      • Timestamp μ‚¬μš©μžκ°€ 해당문항을 ν’€κΈ° μ‹œμž‘ν•œ μ‹œμ μ˜ λ°μ΄ν„°μž…λ‹ˆλ‹€.

      • KnowledgeTag λ¬Έν•­ λ‹Ή ν•˜λ‚˜μ”© λ°°μ •λ˜λŠ” νƒœκ·Έλ‘œ, μΌμ’…μ˜ 쀑뢄λ₯˜ 역할을 ν•©λ‹ˆλ‹€. νƒœκ·Έ 자체의 μ •λ³΄λŠ” 비식별화 λ˜μ–΄μžˆμ§€λ§Œ, 문항을 κ΅°μ§‘ν™”ν•˜λŠ”λ° μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 912개의 고유 νƒœκ·Έκ°€ μ‘΄μž¬ν•©λ‹ˆλ‹€.

  • Metric :

    • DKTλŠ” μ£Όμ–΄μ§„ λ§ˆμ§€λ§‰ 문제λ₯Ό λ§žμ•˜λŠ”μ§€ ν‹€λ ΈλŠ”μ§€λ‘œ λΆ„λ₯˜ν•˜λŠ” 이진 λΆ„λ₯˜ λ¬Έμ œμž…λ‹ˆλ‹€.

    • 평가λ₯Ό μœ„ν•΄ AUROC(Area Under the ROC curve)와 Accuracyλ₯Ό μ‚¬μš©ν•©λ‹ˆλ‹€.

    • λ¦¬λ”λ³΄λ“œμ— 두 μ§€ν‘œκ°€ λͺ¨λ‘ ν‘œμ‹œλ˜μ§€λ§Œ, μ΅œμ’… ν‰κ°€λŠ” AUROC 둜만 μ΄λ£¨μ–΄μ§‘λ‹ˆλ‹€.

      image

πŸ’»Team Strategy

  • Git Projects ν™œμš©

    • μΉΈλ°˜λ³΄λ“œλ₯Ό ν™œμš©ν•œ ν˜‘μ—…

      image

  • Notion ν™œμš©

    • notion을 ν™œμš©ν•œ νŒ€ μ‹€ν—˜ κ²°κ³Ό 곡유 및 feature engineering EDA 곡유
    • ν”Όμ–΄μ„Έμ…˜ 기둝 λ“±
    • **μ—¬κΈ°**μ—μ„œ 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.



πŸ“ν”„λ‘œμ νŠΈ ꡬ쑰

code  
β”œβ”€β”€ README.md  
β”œβ”€β”€ args.py  
β”œβ”€β”€ baseline.ipynb  
β”œβ”€β”€ dkt  
β”‚   β”œβ”€β”€ criterion.py  
β”‚   β”œβ”€β”€ dataloader.py  
β”‚   β”œβ”€β”€ metric.py  
β”‚   β”œβ”€β”€ model.py  
β”‚   β”œβ”€β”€ scheduler.py  
β”‚   β”œβ”€β”€ trainer.py  
β”‚   └── utils.py  
β”œβ”€β”€ evaluation.py  
β”œβ”€β”€ inference.py  
β”œβ”€β”€ requirements.txt  
└── train.py



🀝Reference

  • μ΄κ³³μ—μ„œ 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.

πŸ‘¨β€πŸ’» Contributors

μœ€λ„μ—°(ydy8989) | μ „μž¬μ—΄(Jayten) | μ„€μž¬ν™˜(anawkward) | λ―Όμž¬μ›(ekzm8523) | 김봉진(BongjinKim) | νƒœμ˜λˆ(taepd)

About

p4-dkt-decayt created by GitHub Classroom

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 5