Original size 896x1344

Кино в цифрах: жанры, рейтинги, тренды

PROTECT STATUS: not protected
5

Описание

В этом анализе я использовала датасет с kaggle, содержащий данные о фильмах IMDb. В нем представлена информация о названиях фильмов, годах выпуска, возрастных рейтингах, жанрах, продолжительности, оценках IMDb, количестве оценок. Основной целью моего исследования было выявить ключевые закономерности в данных о фильмах, распространенность жанров, рейтинги и общие тенденции.

Использование библиотек

Для работы я использовала библиотеку pandas для анализа данных в формате CSV, matplotlib.pyplot для построения визуализации и seaborn для стилизации графиков, matplotlib.colors для работы с цветовыми схемами и градиентами, а также matplotlib.patches для дополнительного оформления элементов диаграммы. Цветовая палитра: #800080, #FF8C00, #483D8B, #9370DB, #8B0000, #DAA520

Визуализация

big
Original size 2104x1094
big
Original size 1798x1388

«Драма» является самым распространённым жанром, такие фильмы часто затрагивают важные темы, вызывают сильные эмоции и интересны зрителям и режиссёрам. На втором месте оказались «приключения» и столько же упоминаний получил «боевик», в которых динамичные и зрелищные картины с путешествиями, экшен-сценами и неожиданными поворотами сюжета.

Original size 1708x1102
Original size 1798x558

Большинство фильмов в датасете получили довольно мало оценок, а действительно популярных картин, которые собрали большое количество отзывов и оценок, не так много. Если график скошен вправо, это значит, что в киноиндустрии очень много менее известных фильмов, которые не привлекли широкую аудиторию.

Внимание зрителей сосредоточено вокруг небольшого числа популярных картин, тогда как большинство фильмов остаются в тени. Это подтверждает распространенное мнение, что только небольшая часть кинолент получает действительно массовую популярность.

Original size 1706x946
Original size 1798x1172

Большинство фильмов идут от 90 до 150 минут, а средняя и медианная длительность почти совпадают. Нет сильного перекоса в сторону слишком длинных или слишком коротких фильмов.

Также видно, что есть редкие исключения — очень длинные или очень короткие фильмы, но их мало. Это может быть что-то вроде короткометражек или эпических фильмов на 3+ часа.

Original size 1688x942
Original size 1798x448

Можно заметить, что в некоторые годы фильмов снимали больше, а в другие — меньше. Например, в последние годы их стало намного больше, чем раньше. Такой тренд может быть связан с развитием технологий, доступностью съемочного оборудования и ростом индустрии. В какие-то годы спад мог быть из-за войн или других кризисов.

Original size 2182x1116
Original size 1876x1148

Этот график показывает, как средний рейтинг фильмов зависит от их жанра. Некоторые жанры стабильно получают высокие оценки, тогда как другие зрители оценивают менее положительно. Например, такие жанры, как биография и исторический фильм, чаще всего имеют высокий средний рейтинг.

В то же время боевики и комедии могут получать более низкие средние оценки, так как ожидания аудитории в этих жанрах сильно различаются.

Original size 1710x1152
Original size 1710x750

График показывает, что большинство фильмов имеют рейтинги PG-13 и R, что свидетельствует о популярности контента для подростков и взрослых. Это объясняется тем, что такие фильмы охватывают широкую аудиторию и допускают больше творческой свободы. Рейтинги G и PG встречаются реже, что указывает на меньшее количество семейных фильмов. А NC-17 практически не представлен, так как такие фильмы сложнее продвигать. В целом, киноиндустрия ориентирована в основном на подростковую и взрослую аудиторию.

Итог

Построенные графики для анализа этого датасета, помогли разобраться, какие фильмы находят наибольший отклик у зрителей. Стало понятно какие жанры встречаются чаще, какие из них получают самые высокие оценки, а также как распределяются возрастные рейтинги. Это даёт представление о том, какие тенденции сейчас преобладают в кино. Кроме того, этот анализ помогает построить рекомендации фильмов на платформах — зная, какие жанры и рейтинги популярны, можно точнее предлагать людям те фильмы, которые им, скорее всего, понравятся.

Описание применения генеративной модели

Для создания обложки было применено изображение сгенерированное нейросетью leonardo.ai

Промпт: A cinematic cover design, featuring a dark, elegant composition in deep purple and black tones. A classic filmstrip with softly illuminated frames curves gracefully along the edges, adding a refined movie-inspired touch. The background has a subtle vignette effect, enhancing depth while keeping the focus on the central space. The overall aesthetic is sophisticated and artistic, evoking the timeless beauty of cinema through a balanced and visually appealing layout. Gentle lighting accents create a sense of atmosphere, making the design feel rich and immersive.

Ссылка: https://app.leonardo.ai/

В ходе работы использовался ChatGPT-4 для оптимизации кода и предложения идей для визуализации данных и разъяснения сложных моментов в анализе и коде.

Ссылка: https://chatgpt.com/

Кино в цифрах: жанры, рейтинги, тренды
5
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more