Original size 939x1302

Анализ данных по онлайн-доставке еды

PROTECT STATUS: not protected
3

Описание датасета

В качестве основы для проекта я выбрала данные об онлайн-доставке еды. Датасет был загружен с сайта kaggle.com. До этого у меня было множество проблем с поиском подходящей информации, так как не все файлы в полной мере подходили для анализа: иногда данных было слишком много, иногда их разброс не позволял создать красивую инфографику. Так что я посчитала, что таблица с такой простой информацией, как пол, возраст, доход, занятость и т. д. точно подойдёт для анализа.

В проекте встретятся такие виды графиков, как:

1. Круговая диаграмма 2. Столбчатая диаграмма. 3. Линейная диаграмма. 4. Скрипичная диаграмма.

Несмотря на свою простоту, мне показалось, что эти графики наиболее точно отражают сравнение показателей.

Процесс работы

big
Original size 1765x502

После загрузки датасета в Google Colab, программа предложила мне достаточно большое количество графиков. Несмотря на разнообразие, некоторые диаграммы не казались мне подходящими, потому что в изначальной таблице не все данные были полезны для сравнения. Поэтому, выбрав самые понятные, я решила работать с ними.

big
Original size 1739x452
big
Original size 941x689

Первый график — анализ возрастов. В датасете был указан диапазон от 18 до 33 лет. Как можно заметить, большинство, пользующаяся услугами онлайн-доставки, — молодые люди в возрасте примерно 22 — 23 лет.

Original size 1317x522

Второй график — сравнение возрастов и пола опрашиваемых. Здесь можно заметить, что диапазон возрастов у мужчин, заказывающих доставку, больше, чем у женщин. Например, заметное снижение по возрастной шкале у женщин начинается примерно в 24, у мужчин же ближе к 26 — 27 годам.

Original size 1640x791

Далее я решила посмотреть на трудоустройство. В датасете были представлены 4 категории людей: студенты, домохозяйки, самозанятые и обычные работники. Круговая диаграмма отлично визуализировала все данные. Согласно ей, абсолютное большинство, 53,4% составляют студенты, после идут рабочие и самозанятые — 30,4% и 13,9% соответственно; домохозяйки занимают последнее место — менее 3%. Такое соотношение весьма логично — у студентов и самозанятых не хватает ни сил, ни, возможно, социальных навыков, чтобы сходить в магазин, рабочие, вероятнее всего, заказывают доставку на рабочее место, а домохозяйки же имеют возможность приготовить всё на собственной кухне.

Original size 1526x790

Последний график — ступенчатая линейная диаграмма. Обычный Line Graph в полной мере не отражал всю предоставленную информацию, а именно сравнение месячного заработка и трудоустройства. Согласно же этому графику можно увидеть, что меньше всего (или вообще ничего) зарабатывают студенты, а наибольший же заработок у обычных сотрудников.

Описание применения генеративной модели

При написании кодов я просила помощи у нейросети replit.com. Основными моими проблемами были вставки нужных цветов, ошибки при путанице со строками и числами. Также я спрашивала нейросеть об альтернативных видов графиков, чтобы заменить уже имеющиеся, но неподходящие мне. Например, Google Colab в одном из графиков предложил тепловую карту, однако она показалось слишком непонятной. Используя промпты, вроде: «У меня есть [КОД ТЕПЛОВОЙ КАРТЫ], напиши другие варианты диаграмм, подходящие под те же данные.»

Также я использовала Bing для генерации изображения для обложки.

Original size 1425x677

Варианты запросов для нейросети

Итог

Original size 1870x763

Конкретных источников вдохновения для палитры у меня не было, поэтому я подобрала цвета, которые бы были просто приятны глазу и сочетались друг с другом. Таким образом, я меняла цвета для итоговых графиков, а также с помощью сайта designcap.com могла поменять шрифты, их размер и некоторые мелкие особенности диаграмм.

График возрастов/График трудоустройства

В первом графике я решила поменять оси возраста и частоты между собой, также изменила цвет столбцов на один из выбранной мной палитры. Круговая же диаграмма стала выглядеть более презентабельно и понятно, без нагромождения текста.

Original size 1029x248

Соотношение пола и возраста

Original size 852x547

Сравнение трудоустройства и месячного дохода

Два последующих графика я не меняла, так как они вышли вполне понятными и лаконичными.

Вывод

Исходя из полученной визуализированной информации можно сказать, что онлайн-доставкой преимущественно пользуются безработные студенты (по большей части мужского пола). Из этого можно сделать вывод, что существуют некие препятствия, мешающие им сходить за покупками. Предположительно, этими проблемными факторами могут быть занятость на учёбе, отсутствие условий для готовки, возможная дешевизна доставки. Теоретически, сотрудники крупных фирм заказывают доставку в офисы, предпочитая не ходить в столовые или кафе, или не отвлекаться от работы. Самозанятые, так как работают из дома, не имеют возможности часто выходить за продуктами, поэтому им проще, не отрываясь от компьютера, сделать заказ. Домохозяйкам же по большей части нет надобности совершать онлайн-покупки еды, поэтому данных о них мало в рамках этого анализа.

Анализ данных по онлайн-доставке еды
3
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more