
Концепция
Московское метро представляет собой одну из самых больших и активно используемых транспортных сетей на планете, оказывая значительное влияние на повседневную жизнь множества людей. Анализ информации о станциях и количестве пассажиров дает возможность лучше осознать, как распределяются нагрузки в системе метрополитена, а также выявить основные направления и тенденции.

В исследовании были задействованы сведения, полученные с портала открытых данных Правительства Москвы. Проект опирается на два набора данных, в которых содержится информация о станциях метро столицы, их расположении в рамках линий, районов и округов города, а также данные о количестве пассажиров, которые заходят и выходят на каждой станции в различные годы и кварталы. Эти сведения позволяют изучить динамику пассажиропотока на протяжении времени и выявить наиболее загруженные и развитые линии.
Для проведения анализа использовались такие параметры, как название станции, линия, год, квартал, количество вошедших и вышедших пассажиров, район, округ и статус станции.
Были подобраны такие типы диаграмм:
(01) круговая диаграмма (02) столбчатая диаграмма (03) точечная диаграмма (04) тепловая карта

Вдохновением для меня стали архивные фотографии метро, сделанные в период его становления. Это помогло провести параллели между прошлым и настоящим, особенно в контексте того, что многие станции, построенные в те годы, до сих пор остаются важными элементами транспортной сети.
Мудборд
Обработка данных
В начале я импортировала необходимые мне библиотеки: pandas, matplotlib.pyplot, seaborn и matplotlib.colors. После чего добавила в Google Colab файл со шрифтом и добавила его в конфигурацию pyplot.
Далее я добавила 2 csv файла с датасетами. В одном находится информация о станциях (на какой ветке, в каком городском округе, в каком районе и какой у неё статус). Во втором — о пассажиропотоке (на станции, ветке в определенном году и квартале, а также сколько человек вошли и вышли).
Затем я удалила первую строчку в обоих датасетах, потому что в них находились названия колонок на русском языке и ненужные для анализа колонки.
Теперь я приступила к подготовке данных для построения графиков.
Для круговой диаграммы по статусам станций был использован метод value_counts. В переменные labels и sizes я положила названия статусов и количество станций соответственно.
Для столбчатой диаграммы по топу веток с наибольшим и наименьшим количеством станций я использовала метод value_counts и затем отсортировала полученное значение сначала по убыванию, потом по возрастанию и взяла первые 5 значениий для каждой сортировки.
Далее идет точечный график для пассажиропотока по веткам московского метро за 2024 год.
В начале преобразовываем строковые данные датасета в числовые. Затем создаем еще один датасет с данными за 2024 год. Добавляем в него колонку с суммой пассажиров, которые входили и выходили на каждой станции. Группируем значения по каждой ветке, суммирум и сортируем.
Потом для тепловой карты отделяем значения пассажиропотока Таганско-краснопресненской линии.
Также, как и в предыдущем графике, создаем колонку с суммой пассажиров.
С помощью метода pivot_table создаем сводную таблицу, в которой по вертикали будут находится года (2021-2024), по горизонтали названия станций, а в ячейках — суммы пассажиров.
Визуализация данных
Круговая диаграмма по статусам станций
Круговая диаграмма позволяет отчетливо увидеть настолько большое московское метро. Поскольку несмотря на большое количество строящихся станций, они занимают малую часть среди всех станций московского метрополитена.
Топ-5 линий с наибольшим количеством станций
Топ-5 линий с наименьшим количеством станций
Здесь используются столбчатые диаграммы, чтобы увидеть какие линии метрополитена имеют наибольшее и наименьшее количество станций. Это поможет в будущем проанализировать есть ли свзяь между размером ветки и пассажиропотоком на ней.
Точечный график по загруженности станций
Точечная диаграмма показала, что самой загруженной линией является Таганско-Краснопресненская, несмотря на то, что это не самая большая ветка.
Тепловая карта пассажиропотока
Тепловая карта показала какие самые загруженные станции на Таганско-краснопресненской линии московского метрополитена.
Данные по станции Китай-город отсутствовали в датасете.