Для рейтинга арбитражных судов требуется составление двух итоговых таблиц. 1-я таблица состоит из данных о судьях АС:
- Количество уникальных дел.
- Имя судьи.
- Название суда.
- Состояние, в котором находится дело (is_finish)
- Количество удовлетворенных исков/отклоненных
- Тип дела.
- Количество завершенных дел.
- id дела.
- Решения по делу.
- Принятые меры.
- Отводы
- Вознаграждения.
2-я таблица состоит из обобщенных данных по судам:
- Количество уникальных дел.
- Нагрузка на судью, рассчитывающаяся по формуле.
- % отмены актов различного рода.
- Максимальное вознаграждение.
- Реализована процедура веб-скрейпинга для получения корректных данных по судьям (ФИО)
- Реализован парсер со своими правилами для обработки, чтения и извлечения данных из pdf-документов (для извлечения решений, судей, вознаграждений)
- Созданы функции, позволяющие поэтапно получить все необходимые данные
- Итоговые стадии проекта находятся в разработке...
!!!ВАЖНО: Проект выполнен на основе кода Абалакина Тимофея Владимировича (ссылка на гит, к сожалению, отсутствует). Опубликованный код является модификацией с ускорением работы и дополнительных фич.
Python (pandas, numpy, aiohttp, yargy, fitz (PyMuPDF), pymorphy3, ThreadPoolExecutor), SQL (PGSQL)