Skip to content

CTLab-ITMO/Trinoculars

 
 

Repository files navigation

Trinoculars

Trinoculars - это инструмент для выявления текста, созданного искусственным интеллектом. Метод включает два различных, но взаимодополняющих анализа: оценка "удивительности" содержимого и анализ широкого спектра лексических признаков текста. Это позволяет проводить комплексный анализ как содержания, так и формы текста.

Демонстрация

Попробовать метод в действии можно в демонстрационной версии на Hugging Face.

Возможности

  • Детекция AI-сгенерированного текста
  • Поддержка бинарной и трехклассовой классификации
  • Интерактивный режим для удобного анализа текстов
  • Подробный анализ текста с различными метриками
  • Вычисление специальных метрик "удивительности"

Установка

$ git clone ---
$ cd ---
$ pip install -e .

Использование

Базовое использование

python main.py --compute-scores --text "Ваш текст для проверки"

Интерактивный режим

python main.py --compute-scores --interactive

Дополнительные опции

# Анализ текста из файла
python main.py --file path/to/your/file.txt

# Показать подробный анализ текста
python main.py --text "Ваш текст" --analysis

# Использовать трехклассовую модель
python main.py --text "Ваш текст" --model-type three-class

# Комбинирование опций
python main.py --interactive --compute-scores --analysis

Ограничения

  • Детектор предназначен для академических целей
  • Требуется человеческий контроль при использовании
  • Эффективность может варьироваться в зависимости от длины текста

Благодарности

Этот проект основан на работе "Spotting LLMs With Binoculars" (Hans et al., 2024), используя некоторые компоненты их реализации для вычисления метрик perplexity и cross-perplexity. Мы благодарны авторам за их вклад в развитие методов обнаружения AI-сгенерированного текста.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Languages

  • Python 99.8%
  • Shell 0.2%