24_MiniProject_Domain-Specific_LanguageModel_Tuning_by_SFT-DPO

SFT_DPO를 활용한 도메인 특화 QA Model 성능 개선 프로젝트

과정

SFT 및 DPO를 통해 특허 도메인 내에서의 기술적 Question And Answering 능력을 높이도록 함

이때, EXAONE model을 Baseline Model로 삼고, Fine tune 전 후를 비교하여 성능을 파악함 QA set는 AI hub내 데이터 셋을 이용하여 생성하였으며, 검증을 위한 QA set은 Human Resource로 생성

결과

기존 모델에 비해 약간의 성능 향상을 보임(~5%)

Model 자체가 본 데이터셋을 학습했을 가능성이 있음

시사점

특허 데이터셋 자체도 QA를 만들기 쉽지 않았음(덜 정형화되어있음) 타 Medical QA 셋과 같이 정제되지 못했을 가능성
SFT의 중요성-> DPO는 약간의 변주

팀원

Team members: [고혜정] ,[신진섭], [홍준기]

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
dpo_train.py		dpo_train.py
sft_train.py		sft_train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

24_MiniProject_Domain-Specific_LanguageModel_Tuning_by_SFT-DPO

과정

결과

시사점

팀원

About

Uh oh!

Releases

Packages

Languages

BOAZ-bigdata/24_MiniProject_Domain-Specific_LanguageModel_Tuning_by_SFT-DPO

Folders and files

Latest commit

History

Repository files navigation

24_MiniProject_Domain-Specific_LanguageModel_Tuning_by_SFT-DPO

과정

결과

시사점

팀원

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages