Pythia feedback #80

LorrinWWW · 2023-03-31T03:41:10Z

This PR did several things:

Add feedback data in data/OIG/prepare.py
Add a fine-tuning script in training/finetune_Pythia-Chat-Base-7B-feedback.sh, which further fine-tune upon the ckpt produced by training/finetune_Pythia-Chat-Base-7B.sh.
Some trivial changes:
- Add --checkpoint-load-path: load another ckpt before training starts
- Restart step counting with --init-steps

LorrinWWW added 3 commits March 31, 2023 03:09

fine-tune feedback

81388ad

finetune feedback

e414888

merge

b393de4

LorrinWWW requested a review from csris March 31, 2023 03:41

Provide feedback