Проект команды Stardust Crusaders на Online Hackathon 2020.
Описание решения --- report.pdf
Описание кейса:
В компании вводятся так называемые “барьеры безопасности”, анализ которых сможет предотвратить негативные происшествия. Однако аналитика сопряжена с рядом проблем:
● 16-20 тысяч сообщений на естественном языке в месяц. Объем регистрируемых сообщений об опасных действиях/опасных условиях с производственных площадок по компании
● 5 рабочих дней затрачивается на сбор обработку сообщений сотрудниками блоков и ДО. Длительный процесс не даёт возможность оперативно реагировать на сообщения о работоспособности производственных барьеров
● Человеческий фактор при классификации. Субъективный результат классификации сообщений и как результат – отсутствие сквозной аналитики (между ДО)
Сейчас существует цифровой проект «Определение барьеров производственной безопасности из сообщений об опасных условиях-опасных действиях».
В рамках проекта разрабатывается инструмент для классификации записей об опасных действиях и условиях, поступающих от ДО и подрядных организаций в различных информационных системах (контур безопасности, ОУ ОД БРД, АЗИМУТ и другие).
Решение позволит повысить достоверность данных, на которых принимаются решения о работоспособность барьеров и делается оценка рисков ПБ. Появление новой аналитики позволит сфокусировать усилия сотрудников на предупреждение «пробоя» барьера промышленной безопасности. Сократятся трудозатраты на обработку заявки и создание аналитики с 5 дней до нескольких часов.
Замечания по данным:
● Иногда в графу прецеденты респонденты заносят сразу несколько опасных действий и условий
● Данные содержат аббревиатуры, термины, неточные выражения, опечатки и сленг
Необходимо:
● Построить модель кластеризации. В дальнейшем эти кластеры помогут провести аналитику для сопоставления прецедентов с классификацией опасных действий и условий — с барьерам безопасности.
● Объяснить получившиеся кластеры: почему они такие. Сделать вывод, можно ли с помощью них упростить какую-либо полуавтоматическую разметку данным по классам
Глобально можно выделить несколько возможных кластеров:
● Прецеденты, связанные с вождением, и управлением транспортным средством (ТС)
● Прецеденты, связанные с использованием исправного инструмента
● Прецеденты, связанные с работой на высоте и с подъемом грузов
● Прецеденты, связанные с защитой (СИЗ (средства индивидуальной защиты), СИЗОД (средства индивидуальной защиты органов дыхания), перчатки, куртки и тп)
● Все остальное