persimmons-huanhuan-chat

概述

手把手演示 llama-3-8b-instruct 微调一个嬛嬛-Chat mvp版本的过程以及 LLM数据集生成

LLaMA3_8B_Instruct_Lora_huanhuan.ipynb ：微调过程
generation_dataset ：需要LLM生成数据集，查看此脚本
Getting_to_know_Llama.ipynb :了解 Llama 3：开始构建所需的一切

微调环境

算力互联 - 控制台：4090D-24G

微调过程

先充值：5块，新注册后领取5块抵50卷，然后使用，充值
购买机器：

根据提示填写端口号，然后直接创建实例
回到实例
打开实例的 Jupyter
双击进入 fssd目录
双击进入终端

克隆项目

git clone https://github.com/a-persimmons/persimmons-huanhuan-chat.git

cp persimmons-huanhuan-chat/LLaMA3_8B_Instruct_Lora_huanhuan.ipynb .

双击打开微调脚本 LLaMA3_8B_Instruct_Lora_huanhuan.ipynb
开始炼丹微调，按步骤一步一走
⚠️注意⚠️

在开始微调后面会打印loss，我这里的演示最后的loss只到了1.几（没有炼丹完成，只是为了演示整个过程）；
一般判断炼丹效果方法：最后的loss接近0，如果等于0就变成了死记硬背了。不过也要看你的业务要求。
在你的微调过程中你需要根据loss的情况调整相关参数，这里说一下有哪些参数：
- 首先是Epoch参数，通过增加学习次数来增加学习效果，调整再微调看loss，如果loss还是没有下降，那么就可能是lora的参数矩阵不够。
- 接下来调整lora_rank 64 lora_alpha 128,增加Lora参数来提高学习率。
- 另外一种也可以直接切换参数量的尺寸的模型。

本地“安装”模型和设置

下载模型

单机这个图标

进入fsas 目录

单机右键选择下载即可
本地部署模型
1. 安装ollama，根据你的系统进行下载安装：ollama.com/download，然后打开终端命令行ollama serve或图标（mac/win）启动
2. 复制刚刚下载的gguf文件名（不要.gguf后缀）
3. 在你下载的gguf的同级目录下，创建一个文件Modelfile，然后输入以下内容：
```
FROM <刚刚复制的文件名>.gguf
TEMPLATE """{{ if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ .Response }}<|eot_id|>"""
PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|reserved_special_token"
```
4. 打开终端，cd 到刚刚下载的gguf目录下，或在此目录下打开终端（支持的话）
5. 执行”安装“gguf模型命令：
```
ollama create <刚刚复制的文件名>:8b -f ./Modelfile
```
6. 加载完成，看见success就是“安装”完成。
7. 查看“安装”的模型列表：
```
ollama list
```
8. 测试模型：
```
ollama run <复制 ollama list中NAMA列的全名称（包含:后面的）>
```
9. 然后和他像在ChatGPT一样，和他对话，比如“你是谁”
10. 结束测试模型：ctrl/control + D
安装Docker(已安装跳过)

安装完成后，然后注册/登录
1. Mac：Install Docker Desktop on Mac | Docker Docs
2. Win：Install Docker Desktop on Windows | Docker Docs
3. Ubuntu/Linux：Install Docker Desktop on Linux | Docker Docs

安装前端界面（使用像ChatGPT的类界面，本地使用模型），这里使用的是open-webui/open-webui: User-friendly WebUI for LLMs (Formerly Ollama WebUI) (github.com)

# 有GPU的话使用这个，比如 有nvidia显卡的游戏本 Win/ubuntu
docker run -d -p 3000:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama

# 只有CPU的话用这个，比如 mac（Intel）
docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama

等待安装完成，最后访问：http://localhost:3030，随便注册下，进入下面界面：
设置连接本地ollama服务
1. 点开右上角设置图标
2. 设置中文
3. 设置Ollama API 连接：http://host.docker.internal:11434，然后点击旁边的刷新按钮，最后保存
4. 查看是否连接成功，如下是否能看见之前ollama list,看到的模型列表

开始聊天

回到聊天界面，顶部选择模型，愉快的Chat

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
README.assets		README.assets
generation_dataset		generation_dataset
Getting_to_know_Llama.ipynb		Getting_to_know_Llama.ipynb
LLaMA3_8B_Instruct_Lora_huanhuan.ipynb		LLaMA3_8B_Instruct_Lora_huanhuan.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

persimmons-huanhuan-chat

概述

微调环境

微调过程

本地“安装”模型和设置

开始聊天

鸣谢

About

Uh oh!

Releases

Packages

Uh oh!

Languages

a-persimmons/persimmons-huanhuan-chat

Folders and files

Latest commit

History

Repository files navigation

persimmons-huanhuan-chat

概述

微调环境

微调过程

本地“安装”模型和设置

开始聊天

鸣谢

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages