By RuoChen from ZJU
- CUDA: 12.4
在主目录下执行:
# 克隆LLaVA仓库
git clone https://github.com/haotian-liu/LLaVA.git
cd LLaVA
# 创建虚拟环境
conda create -n llava python=3.10 -y
conda activate llava
# 安装依赖
pip install --upgrade pip
pip install -e .
在 models
目录下执行:
git lfs clone https://hf-mirror.com/llava-hf/llava-v1.6-vicuna-7b-hf
在 datas
目录下执行:
# 下载LLaVA预训练数据集
git lfs clone https://hf-mirror.com/datasets/liuhaotian/LLaVA-CC3M-Pretrain-595K
# 解压图像文件
unzip images.zip -d images
如遇下载问题,可使用网盘代替:
通过网盘分享的文件:Llava-next必要文件
🔗 链接: https://pan.baidu.com/s/1WxmTcl-NVXqNFSDUG2XeoA?pwd=1234
🔑 提取码: 1234
文件名 | 功能描述 |
---|---|
test.py |
测试原始模型 |
train_Lora.py |
使用LoRA方法训练模型 |
val_Lora.py |
验证LoRA模型效果 |
data.py |
定义自定义数据集及加载方式 |
data.ipynb |
Jupyter Notebook版本的data.py |
# 测试原始模型
python test.py
# LoRA微调训练
python train_Lora.py
# 验证LoRA模型
python val_Lora.py
.
├── LLaVA/ # LLaVA主代码库
├── models/
│ └── llava-v1.6-vicuna-7b-hf/ # LLaVA模型文件
├── datas/
│ ├── LLaVA-CC3M-Pretrain-595K/ # 预训练数据集
│ └── images/ # 解压后的图像文件
├── test.py # 测试脚本
├── train_Lora.py # LoRA训练脚本
├── val_Lora.py # 验证脚本
├── data.py # 数据集定义
└── data.ipynb # Notebook版本
This project would not be possible without the following codebases:
haotian-liu • zero_nlp • B站:良睦路程序员
如有问题,欢迎提交 Issue 或 PR!