LIMINAL на HSE Design

Концепция

Создание генеративной модели, способной воспроизводить визуальную эстетику liminal spaces — «переходные» места, которые воспринимаются как жуткие и сюрреалистичные. Главными элементами таких изображений являются пустые интерьеры, искусственное освещение, отсутствие людей и повторяющиеся архитектурные элементы, которые могут казаться «неправильными».

Исходные изображения для обучения

Исходные изображения были взяты с сайта lexica.art. На нём можно воспользоваться генератором AI-изображений, но я взяла уже готовые, сгенерированные другими пользователями по поиску «liminal spaces». Всего получилось 29 изображений, которые я привела к одному размеру 512× 512 и формату png.

Исходный размер 2913x2984

Исходные изображения, взятые с сайта lexica.art

Исходный размер 2913x705

Исходные изображения, взятые с сайта lexica.art

Результат

Для начала я решила менять параметр num_inference_steps и проследить, как меняются результаты. Стало заметно, что при увеличении числа итераций генерации становятся более детализированными как по заполненности комнаты и точности объектов в ней, так и по освещению.

Исходный размер 1750x826

«abandoned empty room with different sized paintings on the walls» с параметром num_inference_steps равным 25 и 100 соотвественно

Исходный размер 1750x826

«room with columns in the middle and doors» с параметром num_inference_steps равным 25 и 100 соотвественно

Исходный размер 1750x826

«barely lit empty carpeted coridor with doors along the walls» с параметром num_inference_steps равным 25 и 100 соотвественно

В процессе я заметила, что цветовая палитра не совпадает с той, которая присутсвует на исходных изображениях. Поэтому я решила уточнять промпты и добавлять слова «yellow», «blue» и «red». Тогда генерации начали больше походить на референсные.

Исходный размер 1024x1024

«yellow room with blue doors and a red carpet on the floor»

Исходный размер 1024x1024

«yellow basketball room»

Исходный размер 1024x1024

«room with plain blue walls and a red chair in the middle»

Используемые инструменты

— Сайт lexica.art (https://lexica.art/) для поиска изображений; — Google Collab для написания кода; — Photoshop для создания коллажей и корретирования скачанных изображений для дальнейшего использования в обучении модели; — HuggingFace для генерации токена в процессе создания модели; — StableDiffusion XL с внедрённым LoRA для обучения модели на загруженных изображениях.

БЛОКНОТ