Создать надёжную и понятную систему валидации пользовательского аудио- и видеоконтента через Telegram-бота, используя ML и принципы Human-Centered AI (HCAI).
Основные задачи:
- Верификация личности, речи, обстановки.
- Выявление признаков фейков (в т.ч. дипфейков).
- Обеспечение безопасности цифровой идентификации.
- Требуется участие человека и ресурсы.
- Участились случаи дипфейков и подделок.
- Нет удобного интерфейса для проверки медиа.
- Распознавание лиц (FaceNet), речи (Whisper).
- Проверка метаданных (ffprobe, EXIF).
- Объяснение результатов через Telegram.
- ≥ 85% точности распознавания лиц и речи.
- Ответ < 10 секунд.
- Интерпретируемый результат для пользователя.
- Отправка медиа для верификации.
- Без установки приложений (через Telegram).
- Доверие к результатам за счёт XAI.
- REST API и Telegram-бот.
- Распознавание лиц, речи, видеообработка.
- Docker, PostgreSQL, MinIO.
- Docker-инференс (лицо + речь).
- Проверка метаданных на реалистичность.
- Работа без GPU, с возможностью масштабирования.
- Одна персона, фраза и сценарий.
- Без внешней интеграции.
- Нет полноценной проверки liveness.
- Telegram-бот.
- Распознавание лица и речи.
- Сравнение с эталоном.
- Проверка метаданных.
- Интерпретация и обратная связь.
- Мульти-пользовательская поддержка.
- Интеграция с биометрическими базами.
- Глубокая дипфейк-детекция.
- Пользователь отправляет видео в бота.
- Бот → Backend → Сервисы:
- 🎭 Лицо
- 🗣️ Речь
- 🧾 Метаданные
- Результат с объяснением → Telegram.
- FastAPI backend
- PostgreSQL
- Whisper / FaceNet / ffprobe
- Docker + MinIO
- Telegram Bot API
{
"user_input": "Видео с лицом и голосом",
"face_match": true,
"speech_match": false,
"metadata_valid": true,
"explanation": "Лицо совпадает, но сказанная фраза не соответствует ожидаемой. Метаданные подтверждают, что запись сделана недавно на смартфон."
}
- Поддержка нескольких пользователей.
- Интеграция с системами верификации (ЕСИА и др.).
- Дипфейк-детекция (DeepFaceLab, FakeCatcher).
- Видео-интерпретация и визуальная обратная связь.
- Streamlit dashboard или Telegram inline preview.
Участник | Роль |
---|---|
Дарья | ML-инженер (лицо) |
Артур | Backend + ASR (Whisper) |
Илья | Дипфейк + метаданные |
Никита | Scene validation |
Ильяс | Документация Readme |