
Этот набор данных содержит информацию о ценах на продажу домов в округе Кинг, включая Сиэтл. В него входят дома, проданные в период с мая 2014 по май 2015 года. Это отличный набор данных для оценки простых моделей регрессии для прогнозирования цены дома в зависимости от его характеристик.
В данной работе мы проведём два этапа: предобработка и визуализация. Предобработка включает в себя приведение данных к требуемому типу, заполнение пропущенных значений, удаление аномальных значений (выбросы), создание новых признаков. Данный этап позволит нам получить качественный датасет, который максимально точно представляет предметную область. Визуализация позволит нам составить наглядное представление о закономерностях в полученном датасете. В качестве методов визуализации мы будем использовать столбчатые диаграммы, точечный график, географическая карта и другие.
Я выбрала данные о продажах жилой недвижимости в США, так как это богатый и разносторонний источник информации для анализа тенденций рынка, влияния экономических факторов и демографических изменений.


Объекты продажи на карте

Дома с большим количеством ванных комнат, как правило, имеют большую жилую площадь. Это может указывать на то, что более просторные дома часто имеют больше удобств.
Высокое качество дома (grade) связано с большей жилой площадью. Это может указывать на то, что более качественные дома часто имеют больше пространства.
Жилая площадь (sqft_living) и площадь выше уровня земли (sqft_above) сильно связаны. Ожидаемо, так как площадь выше уровня земли обычно является частью общей жилой площади.
В среднем дома из набора данных удаленый от центра на ~20 км.