
Выбирая датасет для анализа, я опиралась на собственные интересы и рассматривала данный проект как возможность глубже понять проблему депрессии среди студентов — актуальную и важную тему в сфере психического здоровья молодёжи. Целью было выявить основные факторы, влияющие на уровень депрессии, проанализировать распространённость симптомов, а также рассмотреть взаимосвязь с учебными и социальными переменными. Для этого я использовала датасет, найденный на сайте Kaggle, который содержит информацию о психологическом состоянии студентов и связанных с ним показателях. Работа была разделена на этапы. В качестве визуализаций я применяла тепловую карту для демонстрации градаций и корреляций, круговые и столбчатые диаграммы для отображения распределения категориальных данных, а диаграммы рассеяния использовала для наглядного исследования взаимосвязей между признаками.

Палитра из синих, голубых и бирюзовых оттенков подходит для работы по теме депрессии у студентов по нескольким причинам: синий и голубой цвета снижают уровень стресса и вызывают замедление сердечного ритма, активируя парасимпатическую нервную систему, а бирюзовый цвет сочетает в себе свойства синего и зелёного, ассоциируется со свежестью, гармонией и здоровьем, что подчёркивает направленность исследования на улучшение состояния студентов.

Импорт библиотек и настройка шрифта
В начале кода происходит импорт основных библиотек, необходимых для работы с данными и их визуализации. Pandas используется для удобного чтения и обработки табличных данных, numpy — для выполнения числовых операций, matplotlib и seaborn — для создания графиков и визуального анализа. Я выбрала шрифт DejaVu Serif, потому что это свободное и широко распространённое семейство шрифтов с засечками, которое обеспечивает высокую читаемость и эстетическую привлекательность графиков. Этот шрифт поддерживает большое количество символов, включая кириллицу, что важно для корректного отображения русскоязычного текста.
Определение самого «депрессивного» города
Для определения самого депрессивного города из выборки я выбрала столбчатую диаграмму, потому что она кажется мне самой наглядной и простой для восприятия. Мне важно было быстро увидеть, в каких городах уровень депрессии выше, и столбцы хорошо показывают эти различия — каждый город представлен отдельным столбцом, и сразу видно, где показатели выше или ниже.
Самым депрессивным городом в данном исследовании оказался Кальян. Согласно информации, полученной от Нейро (ИИ от Яндекс), причины могут быть связаны с тем, что: - Уровень загрязнения атмосферного воздуха в городе очень высокий. - Отмечается высокий уровень неудовлетворённости работой службы по утилизации мусора. - Шум и световое загрязнение. Основной причиной светового загрязнения называют чрезмерное использование уличных фонарей и рекламы, а также большое количество высотных зданий. Это сильно влияет на длительность и качество сна горожан. - Отсутствие парков и зелёных зон для отдыха.
Распределение людей, принимавших участие в исследовании по гендеру

В этой части кода я решила показать распределение участников исследования по гендеру с помощью круговой диаграммы, потому что она отлично подходит для наглядного отображения долей категориальных данных. С помощью функции подсчёта значений value_counts () я получила количество мужчин и женщин в выборке, а затем визуализировала это с помощью plt.pie (). Выбрала цвета — синий и зелёный — чтобы сделать диаграмму приятной для глаза и легко различимой. (Изображение сгенерировано с помощью Шедеврум.)
Так, можно заметить, что мужчин в данной выборке больше, чем девушек. Результаты довольно неожиданные, так как по данным Всемирной организации здравоохранения (ВОЗ), среди женщин распространённость депрессии примерно на 50% выше, чем среди мужчин. Это может быть связано с различными факторами, включая гормональные изменения, стресс, социальные и экономические проблемы.
Зависимость удовлетворения от учебы и депрессии

В этой части кода я решила показать зависимость между уровнем удовлетворённости учёбой и средним уровнем депрессии у студентов. Для этого сначала сгруппировала данные по значениям удовлетворённости и вычислила среднее значение депрессии для каждой группы, чтобы увидеть общую тенденцию. Выбор линейного графика с точками и соединяющей их линией объясняется тем, что он хорошо отражает изменение средней депрессии в зависимости от уровня удовлетворённости, позволяя легко отследить тренд — растёт ли депрессия при снижении удовлетворённости или наоборот. Мне важно было получить чёткое и плавное представление взаимосвязи между этими двумя переменными, и такой график кажется мне наиболее подходящим для этой задачи. (Изображение сгенерировано с помощью Шедеврум.)
Этот график показал, что чем выше удовлетворенность учебой, тем меньше среднее значение депрессии у студентов. Это указывает на прямую взаимосвязь количества учебной нагрузки (и ее качества) и ментального состояния студентов.
Точечная диаграмма, окрашенная по среднему баллу

В этой части кода я решила построить точечную диаграмму, чтобы визуализировать взаимосвязь между удовлетворённостью учёбой и академическим давлением у студентов, при этом дополнительно показывая влияние среднего балла (CGPA) через цвет и размер точек. Такой подход позволяет одновременно отразить три переменные на одном графике, что даёт более глубокое понимание данных и помогает выявить скрытые закономерности. Размер точек пропорционален CGPA, что подчёркивает важность этого показателя и позволяет сразу заметить, как он соотносится с уровнем удовлетворённости и академической нагрузкой. (Изображение сгенерировано с помощью Шедеврум.)
Диаграмма показывает, что средний балл студентов (цвет и размер кругов) зависит как от удовлетворённости учёбой, так и от уровня академической нагрузки. Наиболее высокие средние баллы (ярко-жёлтые и крупные круги) наблюдаются при средней и высокой удовлетворённости учёбой (значения по оси X от 3 до 5), независимо от уровня академической нагрузки. При низкой удовлетворённости учёбой (значения X 0–2) средний балл, как правило, ниже (зелёные и синие круги меньшего размера).
Заключение
Завершая работу, могу сказать, что изучение данных о депрессии среди студентов подтвердило некоторые мои ожидания, но также открыло новые интересные моменты. Например, оказалось, что уровень депрессии заметно варьируется в зависимости от города, а связь между удовлетворённостью учёбой и депрессией оказалась более сложной, чем я предполагала. Визуализации помогли наглядно увидеть эти закономерности и лучше понять, какие факторы влияют на психологическое состояние студентов. В целом, проект позволил не только углубиться в актуальную тему психического здоровья, но и освоить методы анализа и визуализации данных, что стало для меня полезным и увлекательным опытом.
Описание применения искусственного интеллекта
Для создания цветовой палитры использован сервис Adobe Color.
Для генерации изображений был использован сервис Шедеврум от Яндекса. (Модель v2.5) 1. https://shedevrum.ai/ 2. https://color.adobe.com/ru/create/color-wheel