Skip to content

octantus/Russian-courts-case

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 

Repository files navigation

Цель

Для рейтинга арбитражных судов требуется составление двух итоговых таблиц. 1-я таблица состоит из данных о судьях АС:

  • Количество уникальных дел.
  • Имя судьи.
  • Название суда.
  • Состояние, в котором находится дело (is_finish)
  • Количество удовлетворенных исков/отклоненных
  • Тип дела.
  • Количество завершенных дел.
  • id дела.
  • Решения по делу.
  • Принятые меры.
  • Отводы
  • Вознаграждения.

2-я таблица состоит из обобщенных данных по судам:

  • Количество уникальных дел.
  • Нагрузка на судью, рассчитывающаяся по формуле.
  • % отмены актов различного рода.
  • Максимальное вознаграждение.

Задачи

  1. Реализована процедура веб-скрейпинга для получения корректных данных по судьям (ФИО)
  2. Реализован парсер со своими правилами для обработки, чтения и извлечения данных из pdf-документов (для извлечения решений, судей, вознаграждений)
  3. Созданы функции, позволяющие поэтапно получить все необходимые данные
  4. Итоговые стадии проекта находятся в разработке...

!!!ВАЖНО: Проект выполнен на основе кода Абалакина Тимофея Владимировича (ссылка на гит, к сожалению, отсутствует). Опубликованный код является модификацией с ускорением работы и дополнительных фич.

Cтек проекта

Python (pandas, numpy, aiohttp, yargy, fitz (PyMuPDF), pymorphy3, ThreadPoolExecutor), SQL (PGSQL)

About

russian-courts-case

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published