Mô hình hỏi-đáp luật dựa trên RAG là một trong những mô hình để có giúp người dùng hỏi đáp những vấn đề liên quan đến pháp luật Việt Nam, giúp cải thiện khả năng hiểu biết của người dùng về luật pháp của Việt Nam.
- Python 3.12.+
- Docker Desktop
Để có thể cài đặt thư viện cần thiết ta sẽ cần khởi tạo env cho môi thư mục code của chúng ta bằng câu lệnh sau:
python3 -m venv myenv
source myenv/bin/activate
Sau đó ta sẽ xài lệnh sau để tải các module cần thiết cho dự án:
pip install -r requirements.txt
MacOS và Windows: Đối với hệ điều hành MacOS và Windows, bạn có thể cài đặt Ollama thông qua trang website chính thức của Ollama theo link. Linux: Đối với hệ điều hành Linux, bạn có thể cài đặt Ollama bằng cách sử dụng câu lệnh sau:
curl -fsSL https://ollama.com/install.sh | sh
Để có thể cài đặt được Milvus database, bạn cần cài đặt Docker Desktop trên máy tính của bạn. Sau đó, bạn có thể sử dụng câu lệnh sau để cài đặt Milvus database phiên bản Standalone bằng các câu lệnh sau:
# Download the installation script
curl -sfL https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh -o standalone_embed.sh
# Start the Docker container
bash standalone_embed.sh start
Để có thể chạy mô hình trong Ollama, ta cần thực hiện tải về trên Ollama thông qua câu lệnh trên trang web của Ollama, ở đây ta sẽ tải mô hình Llama v3.2 theo đường link. Tiếp theo ta có thể tải mô hình Llama v3.2 theo số lượng Parameter mà ta mong muốn là 3B hay 1B tuỳ theo nhu câu:
# Pulling and running Llama 3.2 3B
ollama pull llama3.2
ollama run llama3.2
# Pulling and running Llama 3.2 1B
ollama pull llama3.2:1b
ollama run llama3.2:1b
Để có thể thêm dữ liệu vào cơ sỡ dữ liệu vector,đầu tiên ta cần phải đảm bảo container của Milvus đang chạy sau đó ta cần phải chạy theo các lệnh sau:
python indexing.py
Trong lúc đó, hệ thống sẽ tự động indexing từng dữ liệu vào vector database, nếu muốn kiểm tra bao nhiêu dữ liệu đã được index, ta có thể sử dụng câu lệnh sau:
cd utilities
python entities.py
Sau khi hoàn tất tải dữ liệu cũng như đảm bảo rằng mô hình của chúng ta đã chạy, ta có thể chạy ứng dụng bằng cách sử dụng câu lệnh sau:
python app.py