Safety Performance Enhancement Experiment with SFT + RLHF (PPO)

Deliberative Alignment 구현을 위한 koGPT 및 kcBERT를 활용한 toy project

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
hugging-face-code-commented/trl		hugging-face-code-commented/trl
safety_RM		safety_RM
safety_finetuning		safety_finetuning
README.md		README.md
requirements.txt		requirements.txt
train_ppo.py		train_ppo.py

Provide feedback