OCR сервер с FastAPI (CPU и GPU)

Этот проект предоставляет API для распознавания текста с изображений с использованием различных OCR-движков: EasyOCR, Tesseract, PaddleOCR, SuryaOCR. Вы можете выбрать нужный движок через веб-интерфейс или API.

Структура проекта

triple-ocr-server/
├── app/
│   ├── templates/
│   │   └── index.html      # Шаблон страницы для загрузки изображения
│   ├── static/
│   │   └── style.css       # Стиль для страницы
│   ├── main.py             # Основной код сервера FastAPI
│   ├── requirements.txt    # Список зависимостей
├── Dockerfile              # Dockerfile для создания Docker образа
└── README.md               # Этот файл

Установка зависимостей

Клонируйте репозиторий:

git clone https://github.com/UlianaDzhumok/multi-ocr-server
cd multi-ocr-server

Установите зависимости:

pip install -r requirements.txt

В requirements.txt указаны все необходимые библиотеки для работы с сервером.

Запуск локально через Uvicorn

Если вы хотите запустить сервер локально, выполните следующие шаги:

Убедитесь, что у вас установлен Uvicorn:

pip install uvicorn

Запустите сервер:

uvicorn main:app --host 0.0.0.0 --port 8000

Сервер будет доступен по адресу http://0.0.0.0:8000.

Откройте в браузере страницу для загрузки изображения и выбора движка OCR:

http://0.0.0.0:8000

Запуск через Docker

Создание Docker образа

Сначала создайте Docker образ выполнив команду из директории где находится Dockerfile:

docker build -t ocr-server .

Запустите контейнер (с использованием GPU с указанием HOST и PORT для развертки):

docker run --gpus all -e USE_GPU=true -e HOST=127.0.0.1 -e PORT=9000 -p 9000:9000 ocr-server

Теперь сервер будет доступен по адресу http://127.0.0.1:9000.

Запуск из уже готового Docker образа

Если у вас уже есть готовый Docker образ (например из пакетов этого проекта: multi-ocr-server), вы можете просто запустить его с использованием GPU:

docker run --gpus all -e USE_GPU=true multi-ocr-server p 8000:8000

Или только для CPU:

docker run -e USE_GPU=false multi-ocr-server -p 8000:8000

Пример работы с API

Запрос на распознавание текста

С помощью метода POST вы можете отправить изображение и выбрать OCR-движок для обработки. Поддерживаемые движки: easyocr, tesseract, paddleocr, suryaocr.

Пример запроса через curl:

curl -X POST http://localhost:8000/GetOcr \
-H "Content-Type: application/json" \
-H "Accept: application/json" \
-d '{
    "file": "path/to/image.jpg",
    "engine": "easyocr"
}'

Ответ будет в формате JSON:

{
  "result": {
    "engine": "easyocr",
    "execution_time": "59.95",
    "text": "Распознанный текст с изображением с использованием EasyOCR"
  }
}

Получение списка доступных движков

С помощью метода GET вы можете получить список доступных OCR-движков.

Пример запроса через curl:

curl -X GET http://localhost:8000/GetOcrList

Ответ будет в формате JSON:

{
  "available_engines": ["easyocr", "tesseract", "paddleocr", "suryaocr"]
}

Тестирование API с использованием `test_API.py`

Вы можете протестировать API, используя скрипт test_API.py.

Настройка:

Убедитесь, что файл test_image.jpg находится в той же папке, что и test_API.py.
Убедитесь, что сервер API запущен локально на http://0.0.0.0:8000.

Запуск теста:

python test_API.py

Скрипт выполняет следующие действия:

Отправляет запрос к /GetOcrList для получения списка доступных движков OCR.
Тестирует каждый движок (easyocr, tesseract, paddleocr, suryaocr) с изображением test_image.jpg.

Пример вывода:

Available OCR Engines: ['easyocr', 'tesseract', 'paddleocr', 'suryaocr']

Testing OCR with easyocr engine:
Engine: easyocr
Execution Time: 59.95 seconds
Recognized Text:
Распознанный текст с изображением с использованием EasyOCR

Testing OCR with tesseract engine:
Engine: tesseract
Execution Time: 3.16 seconds
Recognized Text:
Распознанный текст с изображением с использованием Tesseract

Testing OCR with paddleocr engine:
Engine: paddleocr
Execution Time: 1.00 seconds
Recognized Text:
Распознанный текст с изображением с использованием PaddleOCR

Testing OCR with suryaocr engine:
Engine: suryaocr
Execution Time: 1.00 seconds
Recognized Text:
Распознанный текст с изображением с использованием SuryaOCR

Примечание

Убедитесь, что файл изображения правильно закодирован в Base64 перед отправкой в API.

Доступ к веб-интерфейсу

Кроме того, для удобства предоставляется веб-интерфейс для загрузки изображений и выбора OCR-движка. Перейдите по следующему адресу в браузере:

http://0.0.0.0:8000

Вы можете выбрать движок OCR, загрузить изображение и получить результат распознавания текста.

Список зависимостей

Проект использует следующие библиотеки:

FastAPI — для создания веб-сервера и API.
Uvicorn — ASGI сервер для FastAPI.
OpenCV — для обработки изображений.
EasyOCR — движок OCR для распознавания текста.
Tesseract — классический движок OCR.
Pytesseract — Python интерфейс для Tesseract.
PaddleOCR — ещё один мощный движок OCR.
SuryaOCR - движок OCR для 90+ языков.

Name		Name	Last commit message	Last commit date
Latest commit History 119 Commits
.github/workflows		.github/workflows
app		app
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
example.jpg		example.jpg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

OCR сервер с FastAPI (CPU и GPU)

Структура проекта

Установка зависимостей

Запуск локально через Uvicorn

Запуск через Docker

Создание Docker образа

Запуск из уже готового Docker образа

Пример работы с API

Запрос на распознавание текста

Получение списка доступных движков

Тестирование API с использованием `test_API.py`

Настройка:

Запуск теста:

Примечание

Доступ к веб-интерфейсу

Список зависимостей

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Languages

License

UlianaDzhumok/multi-ocr-server

Folders and files

Latest commit

History

Repository files navigation

OCR сервер с FastAPI (CPU и GPU)

Структура проекта

Установка зависимостей

Запуск локально через Uvicorn

Запуск через Docker

Создание Docker образа

Запуск из уже готового Docker образа

Пример работы с API

Запрос на распознавание текста

Получение списка доступных движков

Тестирование API с использованием test_API.py

Настройка:

Запуск теста:

Примечание

Доступ к веб-интерфейсу

Список зависимостей

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Languages

Тестирование API с использованием `test_API.py`

Packages