Medical LLM Project

A Language Model fine-tuned for medical applications, progressing from pretraining to instruction fine-tuning and Direct Preference Optimization (DPO).

Datasets

Pretraining: Medical Text Dataset (Kaggle)
Fine-tuning: PMC LLaMA Instructions (Hugging Face)

Project Stages

Pretraining
- Custom GPT model on medical texts
Instruction Fine-tuning
- Used LitGPT for LoRA fine-tuning on instruction dataset
Direct Preference Optimization (DPO)
- Generated variants using fine-tuned model
- Created preference pairs based on Levenshtein distance

Key Features

Customized for medical domain
Progression from general language model to instruction-following
Experiment with preference optimization

Future Work

Larger medical datasets
Advanced DPO techniques
Multi-task learning in medical domain
Benchmark evaluation:
- Compare against established medical NLP models
- Evaluate on standardized medical QA datasets
- Assess performance on clinical decision support tasks

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
Finetuning		Finetuning
Pretraining		Pretraining
RLHF_DPO		RLHF_DPO
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Medical LLM Project

Datasets

Project Stages

Key Features

Future Work

About

Uh oh!

Releases

Packages

Languages

samadon1/LLM-From-Scratch

Folders and files

Latest commit

History

Repository files navigation

Medical LLM Project

Datasets

Project Stages

Key Features

Future Work

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages