
Концепция
Школьные олимпиады — важный и волнительный этап практически каждого ученика. Мне стала интересна эта тема, поскольку я сама не раз участвовала в них, однако редко занимала какие-либо места, поэтому было интересно найти таблицу с данными победителей и призеров и сделать анализ по ним.
В своем проекте я использовала сайт с открытыми данными, который пополняют активисты: Hubofdata
Для графиков была использована информация по годам участия в олимпиадах, названиям учебных заведений, занятым местам, а также названиям самих олимпиад. Всю эту информацию нашла в готовом Dataset

recraft.ai
В моем проекте использованы голубые и синие цвета, поскольку именно они ассоциируются у меня с учебой.
Анализ
Первым делом я скачала библиотеки: pandas, numpy, matplotlib и itertools После этого считала excel файл с датасетом.

В первом графике я использовала столбцы «Class» и «Status», чтобы посчитать, дети из каких классов чаще становятся победителями или призерами в олимпиадах. Также с помощью следующей строки убрала из столбца классы: 1, 2, 3, 4, 12, чтобы избавиться от не интересующей меня информации и более красивой диаграммы.
В данной гистограмме были использованы столбцы: «Subject» и «Status». Мне было интересно понять, по каким предметам ученики чаще всего получают какие-то места. Было очень неожиданно, что большинство победителей именно по физике. При помощи следующих строк мне удалось отделить именно топ 5 предметов
А данная строка помогла мне придерживаться одного шрифта на всех графиках, если указывать «fontproperties=font1»
Данная столбчатая диаграмма состоит из столбцов «ShortName» и «Status». С их помощью мне удалось выявить 5 учебных заведений, в которых чаще всего становились призерами или победителями. Следующая строчка нужна для горизонтальных пунктирных осей. С ними лучше просматривается диаграмма.
На данном этапе мне стало интересно подробнее рассмотреть ГБОУ лицей «Вторая школа», поскольку быть первой среди всех школ Москвы — это очень почетно. Захотелось подробнее увидеть количество побед за все имеющиеся года с помощью точечной диаграммы.
Чтобы диаграмма была в цветах проекта, был использован итератор, который циклически перебирает заданный список цветов.
Также, чтобы убрать в диаграмме правую и верхнюю линию и заменить цвет фона были использованы следующие строки
Отдельную диаграмму я посвятила статистике по Всероссийской олимпиаде, поскольку это важное мероприятие, помогающее ученикам поступать в институты без сдачи ЕГЭ. Очень приятно видеть, что с каждым годом таких людей становится больше.
Данная функция отвечает за отображение всех фигур и графиков, которые были созданы при помощи Matplotlib.
Описание применения AI
Для создания обложки и первых двух визуализаций была использована нейросеть. Промпт прописан рядом с визуализацией.
Ссылка: https://ideogram.ai/t/explore
Ссылка на сайт, с которого взят датасет: http://hubofdata.ru