Eeyore: Realistic Depression Simulation
with Expert-in-the-Loop Supervised and Preference Optimization

Will Update Soon

Model Checkpoints
Preference Generation Codes
Reproducing Codes of Baselines

Email me if you need the above materials earlier

Data

Stage	Link
Seperated Profiles and Dialogues	liusiyang/eeyore_profile
Instruction-tuning Data for SFT	liusiyang/eeyore_depression_sft
Model-generated Preference Data for DPO	liusiyang/eeyore_depression_generated_preference

Model Training

SFT Script with Slurm

# Load any necessary modules
source ~/.bashrc
cd $LOG_DIR
export PATH=$CONDA_ENV_PATH/bin:$PATH
conda init bash
conda activate $CONDA_ENV_NAME
deepspeed  --module openrlhf.cli.train_sft \
   --max_len 4096 \
   --dataset liusiyang/eeyore_depression_sft \
   --input_key messages \
   --train_batch_size 16 \
   --micro_train_batch_size 2 \
   --apply_chat_template \
   --tokenizer_chat_template "{% set loop_messages = messages %}{% for message in loop_messages %}{% set content = '<|start_header_id|>' + message['role'] + '<|end_header_id|>\n\n'+ message['content'] | trim + '<|eot_id|>' %}{% if loop.index0 == 0 %}{% set content = bos_token + content %}{% endif %}{{ content }}{% endfor %}{% if add_generation_prompt %}{{ '<|start_header_id|>assistant<|end_header_id|>\n\n' }}{% endif %}" \
   --max_samples 3500 \
   --pretrain meta-llama/Llama-3.1-8B-Instruct \
   --save_path $SAVE_PATH \
   --save_steps -1 \
   --eval_dataset liusiyang/eeyore_depression_sft \
   --eval_split train \
   --logging_steps 1 \
   --eval_steps 30 \
   --zero_stage 3 \
   --max_epochs 2 \
   --bf16 \
   --flash_attn \
   --l2 1e-3 \
   --multiturn \
   --learning_rate 5e-6 \
   --use_wandb $WANDB_API_KEY \
   --gradient_checkpointing \

DPO Script with Slurm

# Load any necessary modules
source ~/.bashrc
cd $LOG_DIR
export PATH=$CONDA_ENV_PATH/bin:$PATH
conda init bash
conda activate $CONDA_ENV_NAME


deepspeed  --module openrlhf.cli.train_dpo \
   --save_path $SAVE_PATH \
   --save_steps 30 \
   --logging_steps 30 \
   --eval_dataset liusiyang/eeyore_depression_generated_preference \ #Just to see the metrics on the training set
   --eval_steps 200 \
   --eval_split train \
   --train_batch_size 8 \
   --micro_train_batch_size 1 \
   --pretrain $SFT_MODEL \
   --bf16 \
   --max_epochs 1 \
   --max_len 5120 \
   --zero_stage 3 \
   --learning_rate 5e-7 \
   --beta 0.1 \
   --dataset liusiyang/eeyore_depression_generated_preference \
   --apply_chat_template \
   --chosen_key chosen \
   --rejected_key rejected \
   --prompt_key prompt \
   --flash_attn \
   --gradient_checkpointing \
   --use_wandb $WANDB_API_KEY \
   --ref_offload \

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
code		code
.gitignore		.gitignore
README.md		README.md
icon.png		icon.png
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Eeyore: Realistic Depression Simulation
with Expert-in-the-Loop Supervised and Preference Optimization

Will Update Soon

Data

Model Training

About

Uh oh!

Releases

Packages

Languages

MichiganNLP/Eeyore

Folders and files

Latest commit

History

Repository files navigation

Eeyore: Realistic Depression Simulation with Expert-in-the-Loop Supervised and Preference Optimization

Will Update Soon

Data

Model Training

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Eeyore: Realistic Depression Simulation
with Expert-in-the-Loop Supervised and Preference Optimization

Packages