
ОПИСАНИЕ ПРОЕКТА
На сайте kaggle.com я нашла два датасета: один с супергероям DC, а другой- Marvel, в которых указаны имена героев, их характеристики, количество появлений и дата дебюта. Было решено сравнить персонажей двух вселенных, и наконец-то решить многолетний конфликт между двумя студиями и выяснить, чьи персонажи интереснее, разнообразнее и популярнее.
Может быть выводы этого проекта уничтожат навсегда репутацию одной из франшиз, или, возможно, моё исследование положит начало миру между DC и Marvel.
Типы диаграмм: 1. Столбчатые диаграммы; 2. Круговые диаграммы; 3. Линейная диаграмма; 4. Точечная диаграмма;
ВИЗУАЛИЗАЦИЯ

Фреймы из комикса «Супермен против Удивительного Человека-паука». Джерри Конуэй. 1976
Выбор цветового решения пал на знаковые цвета для супергеройки, цвета Человека-Паука и Супермена — оттенки синего и красного. Кроме того, это классические цвета для демонстрации противоборствующих сторон, что подходит тематике проекта.

Цветовое решение
В качестве шрифта я выбрала Comic Helvetic из-за его стилизации для комиксов.

Код для палитры цветов и шрифтов
СТОЛБЧАТЫЕ ДИАГРАММЫ
Начнем со сравнения насколько часто появлялись персонажи обоих вселенных в комиксах. Диаграмма наглядно показывает, что в топе находятся персонажи Marvel, а это значит, что эта студия выпускает намного больше комиксов, чем их конкурент. Единственные, кто из персонажей DC вырываются вперед — это Бэтмен и Супермен.
Столбчатая диаграмма популярности персонажей DC и Marvel / Код первой столбчатой диаграммы
Далее я решила создать еще две диаграммы, которые помогут более глубоко взглянуть на разницу между вселенными. В целом, все три диаграммы похожи и из них можно сделать вывод о численном преимуществе комиксов Marvel.
Занятно, что несмотря на отставание вселенной DC, Джокер, Бэтмен, Чудо Женщина, Супермен и Лекс Лютор находятся почти на равных с персонажами Marvel, что говорит о их невероятной востребованности в среде фанатов комиксов.
Самые популярные злодеи / Самые популярные женские персонажи / Код второй и третьей столбчатой диаграммы
Дальше я решила сравнить внешние характеристики персонажей — цвет глаз и волос —, которые оказалось почти одинаковыми. Единственное существенное отличие: у Marvel почти две тысячи персонажей без волос (No Hair), что говорит о том, что у этой вселенной больше персонажей «мутантов». Плюс за разнообразие у Marvel.
Четыре столбчатые диаграммы цвета волос и глаз / Коды столбчатых диаграмм с четвертой по седьмую
КРУГОВЫЕ ДИАГРАММЫ
Потом я сравнила какое соотношение женских и мужских персонажей в обеих вселенных.
Круговая диаграмма полового состава персонажей комиксов Marvel и DC / Код круговой диаграммы
Вышло, что и в Marvel и в DC примерное одинаковый половой состав, однако, вселенная DC всё же на 5% ближе к гендерному равенству.
ЛИНЕЙНАЯ ДИАГРАММА
Линейная диаграмма демонстрирует, количество персонажей дебютировавших с 1930-х и по 2010. Так, у обоих студий виден заметный скачок в 90-е и незначительный рост в 60-е — серебряный век комиксов.
Тренд дебютов персонажей Marvel и DC / Код линейной диаграммы
ТОЧЕЧНАЯ ДИАГРАММА
Но в какие года появились самые популярные персонажи? Следующая диаграмма показывает дату дебюта персонажа и количество его появлений. У Marvel заметный скачок появления популярных персонажей примерно в 1960–1965 гг. В то время как у DC было несколько волн популярных персонажей: в 1940-х, 1960-х и 1990-х.
Корреляция между дебютом и популярностью персонажей / Код точечной диаграммы
На диаграмме видны самые популярные персонажи и даты их дебютов: у Marvel Человек-Паук, появившийся в 1962 году и Бэтмен у DC, дебютировавший в 1939 году и находящийся рядом с красной точкой, обозначающей Капитана Америку.
Таким образом, сравнивая две предыдущие диаграммы, я пришла к выводу, что, несмотря на то, что в 90-е была волна дебютов новых персонажей, самые популярные и успешные герои были созданы в 40-е и 60-е года (в золотой и серебряный век комиксов соответственно).
ВЫВОД
После анализа данных, я пришла к выводу, что в численном количестве количестве Marvel выигрывает: их персонажи более популярны и многочисленней. Но количество не равно качеству и из исследования видно, что отдельные персонажи DC составляют конкуренцию Marvel, поэтому нельзя сказать, что DC проиграли. Кроме того, много персонажей, которые были созданы Marvel были проданы в 90-е и 00-е (например, Человек-Паук или Люди Икс), поэтому популярность некоторых персонажей — это работа других компаний.
Но в других аспектах, персонажи обоих вселенных очень схожи: по дате появления или, например, внешним характеристикам.
ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ
В работе над проектом был использован ChatGPT.
Обращение было с целью объединения двух датасетов, создания легенды, поиска методов и настройки внешнего вида диаграмм.
Из комикса «Супермен против Удивительного Человека-паука». Джерри Конуэй. 1976