Skip to content

DocMentor - Персональный AI-ассистент для студентов на базе distilBERT с RAG и QLoRA

License

Notifications You must be signed in to change notification settings

TemurTurayev/DocMentor

Repository files navigation

🎓 DocMentor: Персональный AI-ассистент для медицинского образования

Ваш личный помощник в мире медицинских знаний, адаптированный под местные учебные программы с гибридной архитектурой для высших учебных заведений

Made in Uzbekistan Education AI Open Source

🌟 Почему DocMentor?

В современном медицинском образовании студенты сталкиваются с двумя ключевыми проблемами:

  1. Информационная перегрузка: Огромное количество учебных материалов и сложность поиска нужной информации
  2. Несоответствие источников: Международные ресурсы часто не соответствуют локальным учебным программам

DocMentor решает эти проблемы, предоставляя:

  • 📚 Мгновенный доступ к релевантной информации из ваших учебников
  • 🎯 Точные ответы, соответствующие вашей учебной программе
  • 💡 Помощь в понимании сложных медицинских концепций
  • ✨ Возможность загружать и использовать собственные материалы
  • 🏥 Виртуальные пациенты для практики клинических навыков
  • 🎮 Геймификация обучения для повышения мотивации и вовлеченности

🔄 Гибридная архитектура

🔒 Локальный режим (Edge-узлы в вузах)

  • Низкие задержки: Быстрая обработка запросов в кампусе
  • Автономность: Возможность работы даже при отсутствии интернет-соединения
  • Безопасность: Университеты сохраняют контроль над локальными данными
  • Офлайн-синхронизация: Работа без постоянного подключения к интернету

🌐 Облачный режим

  • Централизованное управление: Единая база знаний, синхронизация обновлений
  • Доступ из любой точки: Подключение к облачному серверу при необходимости
  • Расширение возможностей: Дополнительные вычислительные ресурсы

🔄 Синергия локального и облачного подходов

  • Оптимальное распределение нагрузки: Edge-серверы обрабатывают основную нагрузку
  • Масштабируемость: Легкое добавление новых вузовских узлов
  • Гибкость: Возможность работы в различных режимах в зависимости от условий

🚀 Основные функции

🎮 Геймификация образовательного процесса

  • Элементы игры: Лидерборды, значки, баллы и уровни для мотивации студентов
  • Челленджи и квесты: Ежедневные/еженедельные задания по сложным темам
  • Награды: Система бонусов за активное участие, способствующая устойчивому обучению

👨‍⚕️ Модуль виртуальных пациентов и клинических симуляций

  • Интерактивные клинические сценарии: Моделирование клинических случаев
  • Обратная связь: Анализ принятых решений и рекомендации по оптимальным алгоритмам
  • Безопасная практика: Отработка навыков без риска для реальных пациентов

📊 Адаптивное обучение на основе AI

  • Персонализация: Подстройка материалов под индивидуальный темп и стиль обучения
  • Прогнозирование: Выявление пробелов в знаниях на ранних этапах
  • Оптимальный путь: Рекомендации по оптимальной последовательности обучения

🔍 Расширенный анализ медицинских изображений

  • Интеграция с DICOM: Работа с форматами медицинских изображений
  • Обучающие модули: Интерпретация рентгенограмм, КТ, МРТ и других изображений
  • Сравнительный анализ: База данных патологий для сравнения и обучения

🌍 Интеграция с международными медицинскими базами

  • Актуальные данные: Подключение к медицинским базам и научным журналам
  • Постоянное обновление: Получение свежих протоколов лечения и рекомендаций

👥 Социальная платформа для обмена знаниями

  • Коллаборация: Форумы, групповые чаты, обмен материалами
  • Менторство: Система для обмена опытом между студентами и преподавателями

🔗 Интеграция с LMS

  • Совместимость: Работа с популярными системами управления обучением
  • Синхронизация: Единая точка доступа к учебным материалам
  • Единый вход: Использование существующих учетных записей университета

🛠️ Технологическое решение

AI Ядро

DocMentor/
├── Core/
│   ├── Qwen2.5-MED-3B + ITK-SNAP   # Специализированная языковая модель для медицины
│   ├── Vector Database              # Эффективное хранение знаний
│   ├── TREAD Engine                 # Оптимизация обработки токенов
│   ├── PDF Processor                # Продвинутая обработка документов
│   └── Mode Manager                 # Управление режимами работы
│
├── Interface/
│   ├── Streamlit App                # Веб-интерфейс
│   ├── Mobile App                   # Мобильное приложение
│   └── Mode Switcher                # Переключатель режимов
│
├── Edge/
│   ├── Local Server                 # Компоненты для локальных серверов в вузах
│   ├── Sync Manager                 # Менеджер синхронизации с облаком
│   └── Offline Mode                 # Функциональность работы без интернета
│
├── Cloud/
│   ├── Central Server               # Центральный облачный сервер
│   ├── Update Manager               # Менеджер обновлений
│   └── Backup System                # Система резервного копирования
│
└── Knowledge Base/
    ├── Local Storage                # Приватное хранилище
    ├── Cloud Storage                # Облачное хранилище
    ├── Medical Terms                # База медицинских терминов
    ├── Base Books                   # Основная медицинская библиотека
    └── User Books                   # Пользовательские материалы

Ключевые характеристики

  • 🧠 Специализированная медицинская модель Qwen2.5-MED-3B с ITK-SNAP
  • 📊 Векторная база данных для быстрого поиска
  • 🔍 Продвинутая обработка медицинских текстов и изображений
  • 🚀 25x ускорение на слабых CPU благодаря TREAD
  • 🔄 Гибридная архитектура edge/cloud
  • 🔒 Защита конфиденциальности и работа офлайн

🚄 TREAD: Оптимизация обработки токенов

Что такое TREAD?

TREAD (Token Routing for Efficient Architecture-agnostic Diffusion Training) - это инновационный метод обработки токенов, значительно повышающий эффективность работы языковой модели. В DocMentor мы адаптировали TREAD для оптимизации работы с медицинскими текстами.

Особенности реализации

  • Умная маршрутизация:

    • Динамическое распределение токенов по слоям модели
    • Приоритизация медицинских терминов
    • Адаптивные пороги важности для разных слоев
  • Оптимизация производительности:

    • Ускорение обработки текста в 25 раз
    • Снижение потребления памяти
    • Эффективная работа на CPU
  • Медицинская специализация:

    • Встроенная база медицинских терминов
    • Специальные веса для профессиональной лексики
    • Контекстно-зависимая обработка

📈 Метрики эффективности

  • Скорость: Ответы в пределах 0.5-1 секунды благодаря TREAD и edge-архитектуре
  • Точность: >95% релевантных ответов
  • Объем: Поддержка >500 медицинских книг и локальных баз данных
  • Память: Оптимизировано для работы с 4GB RAM на локальных узлах
  • Ускорение: 25x быстрее стандартной обработки
  • Масштабируемость: Поддержка до 50 одновременных узлов для разных вузов

🔜 Планы развития

  • 🤖 Telegram-бот интерфейс
  • 🌐 Мультиязычность (UZ/RU/EN)
  • 📱 Мобильное приложение
  • 💻 Кроссплатформенный десктоп клиент
  • 🤝 Интеграция с популярными LMS
  • 📊 Расширенная аналитика
  • 🚀 Дальнейшая оптимизация TREAD
  • 🏥 Расширение базы виртуальных пациентов
  • 🔍 Улучшение модуля анализа медицинских изображений

🤝 Вклад в проект

Мы открыты для сотрудничества! Особенно приветствуются:

  • 👨‍⚕️ Медицинские студенты с идеями
  • 👩‍🏫 Преподаватели с методическими материалами
  • 👨‍💻 Разработчики с техническими улучшениями
  • 🔬 Исследователи в области AI и ML
  • 🌍 Специалисты в области медицинского образования

📞 Контакты

📜 Лицензия

Этот проект распространяется под MIT лицензией. Подробности в файле LICENSE

About

DocMentor - Персональный AI-ассистент для студентов на базе distilBERT с RAG и QLoRA

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages