Провести анализ успеваемости студентов за текущий год, анализ пройденных курсов, дать рекомендации по дальнейшему взаимодействию со студентами. Получить статистические данные.
- Использовала Python для выгрузки и изучения данных, трактовала данные.
- Исследовала данные на наличие аномалий.
- Аргументировала причины для решений.
- Пронализировала аудиторию с помощью адаптированной кластеризации c последующей визуализацией.
Python (pandas, numpy, matplotlib). Результат работы представлен в итоговом файле: e-learning_var2.ipynb
- Выявлены самые популярные предметы по количеству регистраций на них. А также предметы с самым большим оттоком.
- Выявлен самый сложный для сдачи экзмен по завершаемости (кол-во успешных экзаменов / кол-во всех попыток сдать экзамен). Руководителю следует подумать об упрощении или модернизации экзамена.
- Выявлен триместр с самым низким завершением курсов, что дает пространство для его преобразования и выявления причин в разрезе по курсам.
- Аналитическое заключение об учебном поведении студентов и сформировавшихся кластерах. По результатам исследования можно увидеть, что учащиеся осваивают образовательную програму успешно. Наличие неуспевающих групп говорит о том, что необходимо постоянно контролировать студентов в их учебной деятельности, что поможет поднять общую успеваемость.
assessments.csv — этот файл содержит информацию об оценках в тесте. Обычно каждый предмет в семестре включает ряд тестов с оценками, за которыми следует заключительный экзаменационный тест (экзамен). code_module — идентификационный код предмета.
courses.csv — файл содержит список предметов по семестрам.
studentAssessment.csv — этот файл содержит результаты тестов студентов. Если учащийся не отправляет работу на оценку, результат не записывается в таблицу. id_assessment — тест (идентификационный номер).
studentRegistration.csv — этот файл содержит информацию о времени, когда студент зарегистрировался для прохождения курса в семестре.