Сервис предназначен для решения задачи STS - Semantic Textual Similarity.
В качестве модели используется universal-sentence-encoder-multilingual-large
Структура проекта:
data_parser.py
- Модуль парсинга данных из электронной библиотекиdata_convertor.py
- Модуль реструктуризации распаршенных данныхcloud_loader.py
- Модуль загрузки/выгрузки данных/эмбеддингов в облачное хранилищеuse_model.py
- Модуль взаимодействия с модельюsts_webserver.py
- Бэк на Flask
Пример развёртывания
$ cd src
$ python sts_webserver.py
Скрипт эмуляции клиента
import json
import requests
text = <YOUR TEXT>
url = 'http://0.0.0.0:5050/find_similar'
response = requests.post(url=url, json={'text': text, 'top_n': 2})
print(response.text)