Trinoculars - это инструмент для выявления текста, созданного искусственным интеллектом. Метод включает два различных, но взаимодополняющих анализа: оценка "удивительности" содержимого и анализ широкого спектра лексических признаков текста. Это позволяет проводить комплексный анализ как содержания, так и формы текста.
Попробовать метод в действии можно в демонстрационной версии на Hugging Face.
- Детекция AI-сгенерированного текста
- Поддержка бинарной и трехклассовой классификации
- Интерактивный режим для удобного анализа текстов
- Подробный анализ текста с различными метриками
- Вычисление специальных метрик "удивительности"
$ git clone ---
$ cd ---
$ pip install -e .
python main.py --compute-scores --text "Ваш текст для проверки"
python main.py --compute-scores --interactive
# Анализ текста из файла
python main.py --file path/to/your/file.txt
# Показать подробный анализ текста
python main.py --text "Ваш текст" --analysis
# Использовать трехклассовую модель
python main.py --text "Ваш текст" --model-type three-class
# Комбинирование опций
python main.py --interactive --compute-scores --analysis
- Детектор предназначен для академических целей
- Требуется человеческий контроль при использовании
- Эффективность может варьироваться в зависимости от длины текста
Этот проект основан на работе "Spotting LLMs With Binoculars" (Hans et al., 2024), используя некоторые компоненты их реализации для вычисления метрик perplexity и cross-perplexity. Мы благодарны авторам за их вклад в развитие методов обнаружения AI-сгенерированного текста.