Original size 1140x1600

Анализ московского метро

PROTECT STATUS: not protected
7

Концепция

Московское метро представляет собой одну из самых больших и активно используемых транспортных сетей на планете, оказывая значительное влияние на повседневную жизнь множества людей. Анализ информации о станциях и количестве пассажиров дает возможность лучше осознать, как распределяются нагрузки в системе метрополитена, а также выявить основные направления и тенденции.

big
Original size 3790x1500

В исследовании были задействованы сведения, полученные с портала открытых данных Правительства Москвы. Проект опирается на два набора данных, в которых содержится информация о станциях метро столицы, их расположении в рамках линий, районов и округов города, а также данные о количестве пассажиров, которые заходят и выходят на каждой станции в различные годы и кварталы. Эти сведения позволяют изучить динамику пассажиропотока на протяжении времени и выявить наиболее загруженные и развитые линии.

Для проведения анализа использовались такие параметры, как название станции, линия, год, квартал, количество вошедших и вышедших пассажиров, район, округ и статус станции.

Были подобраны такие типы диаграмм:

(01) круговая диаграмма (02) столбчатая диаграмма (03) точечная диаграмма (04) тепловая карта

big
Original size 3500x1600

Вдохновением для меня стали архивные фотографии метро, сделанные в период его становления. Это помогло провести параллели между прошлым и настоящим, особенно в контексте того, что многие станции, построенные в те годы, до сих пор остаются важными элементами транспортной сети.

Original size 3790x900

Мудборд

Обработка данных

В начале я импортировала необходимые мне библиотеки: pandas, matplotlib.pyplot, seaborn и matplotlib.colors. После чего добавила в Google Colab файл со шрифтом и добавила его в конфигурацию pyplot.

Original size 3790x1500

Далее я добавила 2 csv файла с датасетами. В одном находится информация о станциях (на какой ветке, в каком городском округе, в каком районе и какой у неё статус). Во втором — о пассажиропотоке (на станции, ветке в определенном году и квартале, а также сколько человек вошли и вышли).

Затем я удалила первую строчку в обоих датасетах, потому что в них находились названия колонок на русском языке и ненужные для анализа колонки.

Original size 3790x1500

Теперь я приступила к подготовке данных для построения графиков.

Для круговой диаграммы по статусам станций был использован метод value_counts. В переменные labels и sizes я положила названия статусов и количество станций соответственно.

Original size 3790x900

Для столбчатой диаграммы по топу веток с наибольшим и наименьшим количеством станций я использовала метод value_counts и затем отсортировала полученное значение сначала по убыванию, потом по возрастанию и взяла первые 5 значениий для каждой сортировки.

Original size 3790x700

Далее идет точечный график для пассажиропотока по веткам московского метро за 2024 год.

В начале преобразовываем строковые данные датасета в числовые. Затем создаем еще один датасет с данными за 2024 год. Добавляем в него колонку с суммой пассажиров, которые входили и выходили на каждой станции. Группируем значения по каждой ветке, суммирум и сортируем.

Original size 3790x1500

Потом для тепловой карты отделяем значения пассажиропотока Таганско-краснопресненской линии.

Также, как и в предыдущем графике, создаем колонку с суммой пассажиров.

С помощью метода pivot_table создаем сводную таблицу, в которой по вертикали будут находится года (2021-2024), по горизонтали названия станций, а в ячейках — суммы пассажиров.

Original size 3790x1500

Визуализация данных

Original size 3500x2000

Круговая диаграмма по статусам станций

0

Круговая диаграмма позволяет отчетливо увидеть настолько большое московское метро. Поскольку несмотря на большое количество строящихся станций, они занимают малую часть среди всех станций московского метрополитена.

Original size 3500x2000

Топ-5 линий с наибольшим количеством станций

0
Original size 3500x2000

Топ-5 линий с наименьшим количеством станций

Здесь используются столбчатые диаграммы, чтобы увидеть какие линии метрополитена имеют наибольшее и наименьшее количество станций. Это поможет в будущем проанализировать есть ли свзяь между размером ветки и пассажиропотоком на ней.

Original size 1188x590

Точечный график по загруженности станций

0

Точечная диаграмма показала, что самой загруженной линией является Таганско-Краснопресненская, несмотря на то, что это не самая большая ветка.

Original size 1089x590

Тепловая карта пассажиропотока

0

Тепловая карта показала какие самые загруженные станции на Таганско-краснопресненской линии московского метрополитена.

Данные по станции Китай-город отсутствовали в датасете.

Анализ московского метро
7
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more