
Описание датасета
В качестве основы для проекта я выбрала данные об онлайн-доставке еды. Датасет был загружен с сайта kaggle.com. До этого у меня было множество проблем с поиском подходящей информации, так как не все файлы в полной мере подходили для анализа: иногда данных было слишком много, иногда их разброс не позволял создать красивую инфографику. Так что я посчитала, что таблица с такой простой информацией, как пол, возраст, доход, занятость и т. д. точно подойдёт для анализа.
В проекте встретятся такие виды графиков, как:
1. Круговая диаграмма 2. Столбчатая диаграмма. 3. Линейная диаграмма. 4. Скрипичная диаграмма.
Несмотря на свою простоту, мне показалось, что эти графики наиболее точно отражают сравнение показателей.
Процесс работы

После загрузки датасета в Google Colab, программа предложила мне достаточно большое количество графиков. Несмотря на разнообразие, некоторые диаграммы не казались мне подходящими, потому что в изначальной таблице не все данные были полезны для сравнения. Поэтому, выбрав самые понятные, я решила работать с ними.


Первый график — анализ возрастов. В датасете был указан диапазон от 18 до 33 лет. Как можно заметить, большинство, пользующаяся услугами онлайн-доставки, — молодые люди в возрасте примерно 22 — 23 лет.
Второй график — сравнение возрастов и пола опрашиваемых. Здесь можно заметить, что диапазон возрастов у мужчин, заказывающих доставку, больше, чем у женщин. Например, заметное снижение по возрастной шкале у женщин начинается примерно в 24, у мужчин же ближе к 26 — 27 годам.
Далее я решила посмотреть на трудоустройство. В датасете были представлены 4 категории людей: студенты, домохозяйки, самозанятые и обычные работники. Круговая диаграмма отлично визуализировала все данные. Согласно ей, абсолютное большинство, 53,4% составляют студенты, после идут рабочие и самозанятые — 30,4% и 13,9% соответственно; домохозяйки занимают последнее место — менее 3%. Такое соотношение весьма логично — у студентов и самозанятых не хватает ни сил, ни, возможно, социальных навыков, чтобы сходить в магазин, рабочие, вероятнее всего, заказывают доставку на рабочее место, а домохозяйки же имеют возможность приготовить всё на собственной кухне.
Последний график — ступенчатая линейная диаграмма. Обычный Line Graph в полной мере не отражал всю предоставленную информацию, а именно сравнение месячного заработка и трудоустройства. Согласно же этому графику можно увидеть, что меньше всего (или вообще ничего) зарабатывают студенты, а наибольший же заработок у обычных сотрудников.
Описание применения генеративной модели
При написании кодов я просила помощи у нейросети replit.com. Основными моими проблемами были вставки нужных цветов, ошибки при путанице со строками и числами. Также я спрашивала нейросеть об альтернативных видов графиков, чтобы заменить уже имеющиеся, но неподходящие мне. Например, Google Colab в одном из графиков предложил тепловую карту, однако она показалось слишком непонятной. Используя промпты, вроде: «У меня есть [КОД ТЕПЛОВОЙ КАРТЫ], напиши другие варианты диаграмм, подходящие под те же данные.»
Также я использовала Bing для генерации изображения для обложки.
Варианты запросов для нейросети
Итог
Конкретных источников вдохновения для палитры у меня не было, поэтому я подобрала цвета, которые бы были просто приятны глазу и сочетались друг с другом. Таким образом, я меняла цвета для итоговых графиков, а также с помощью сайта designcap.com могла поменять шрифты, их размер и некоторые мелкие особенности диаграмм.


График возрастов/График трудоустройства
В первом графике я решила поменять оси возраста и частоты между собой, также изменила цвет столбцов на один из выбранной мной палитры. Круговая же диаграмма стала выглядеть более презентабельно и понятно, без нагромождения текста.
Соотношение пола и возраста
Сравнение трудоустройства и месячного дохода
Два последующих графика я не меняла, так как они вышли вполне понятными и лаконичными.
Вывод
Исходя из полученной визуализированной информации можно сказать, что онлайн-доставкой преимущественно пользуются безработные студенты (по большей части мужского пола). Из этого можно сделать вывод, что существуют некие препятствия, мешающие им сходить за покупками. Предположительно, этими проблемными факторами могут быть занятость на учёбе, отсутствие условий для готовки, возможная дешевизна доставки. Теоретически, сотрудники крупных фирм заказывают доставку в офисы, предпочитая не ходить в столовые или кафе, или не отвлекаться от работы. Самозанятые, так как работают из дома, не имеют возможности часто выходить за продуктами, поэтому им проще, не отрываясь от компьютера, сделать заказ. Домохозяйкам же по большей части нет надобности совершать онлайн-покупки еды, поэтому данных о них мало в рамках этого анализа.