Проект для автоматизации модерации резюме на русском языке с использованием современных языковых моделей.
- Модерация резюме: Анализ соответствия критериям, тональности и релевантности.
- Zero-shot подход: Классификация без предварительного обучения на доменных данных.
meta-llama/Llama-Guard-3-8B— классификация резюме.meta-llama/Llama-3.1-8B-Instruct— zero-shot инференс.seara/rubert-base-cased-russian-sentiment— анализ тональности.intfloat/multilingual-e5-large— сравнение эмбеддингов.t-tech/T-lite-it-1.0— русскоязычная классификация.
PyTorch · Transformers · Pandas · llama-index
git clone https://github.com/LISA-ITMO/LLM-resume-moderator.git &&
cd LLM-resume-moderator &&
docker-compose -f docker-compose.prod.yaml up -d Сервис уже развёрнут и доступен по адресам:
- api url: http://89.169.149.254:8000
- Swagger-документация: http://89.169.149.254:8000/docs
| Ноутбук | Описание |
|---|---|
1_EDA_preproc.ipynb |
EDA, предобработка данных, анализ тональности и сходства эмбеддингов. |
2_llamaguard_3_8b_zeroshot.ipynb |
Zero-shot классификация резюме с Llama-Guard. |
3_extract_rules.ipynb |
Извлечение критериев модерации из документов. |
4_inference.ipynb |
Классификация резюме с Llama-3.1-8B-Instruct. |
5_local_inference.ipynb |
Локальный инференс на русском с моделью T-lite-it-1.0. |
Telegram: @Vlodimirshil
Email: vladimir@itmo.ru