Skip to content

qaz45647/MandarinDialectTranslator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

img1

Introduction

MandarinDialectTranslator是一個結合LLM及RAG來實現的翻譯大陸用語的視覺化界面。使用者可以輕易地使用此程式來翻譯大陸用語及下載聊天紀錄。

Function

  • 將大陸用語翻譯成台灣用語
  • 下載聊天紀錄

RAG Architecture

img2

  1. 首先對輸入的文字進行POS(詞性標註)。
  2. 提取出詞性為名詞、動詞、形容詞、量詞的單字。
  3. 對大陸用語資料集進行比對。
  4. 提取出與之匹配的資料。
  5. 傳遞給LLM

Installation

Install via GitHub

Clone the repo:

git clone git@github.com:qaz45647/MandarinDialectTranslator.git
cd MandarinDialectTranslator

Create a conda environment:

conda create -n MandarinDialectTranslator python=3.9
conda activate MandarinDialectTranslator

Use pip to install required packages:

pip install -r requirements.txt

Usage

Execute program

Move to MandarinDialectTranslator folder:

cd MandarinDialectTranslator

Set gemini key

在檔案api_key.txt中放入自己的api key

Execute app.py:

python app.py

Modify dataset

翻譯的準確性取決於LLM本身的知識及資料集的內容。欲擴充資料集,使用者可於ch.csv中進行新增或修改資料。

Implemented Components

models:

  • gemini-1.5-flash
  • zh_core_web_trf

dataset:

About

一個用於翻譯大陸用語的視覺化界面。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published