Концепция
Создание генеративной модели, способной воспроизводить визуальную эстетику liminal spaces — «переходные» места, которые воспринимаются как жуткие и сюрреалистичные. Главными элементами таких изображений являются пустые интерьеры, искусственное освещение, отсутствие людей и повторяющиеся архитектурные элементы, которые могут казаться «неправильными».
Исходные изображения для обучения
Исходные изображения были взяты с сайта lexica.art. На нём можно воспользоваться генератором AI-изображений, но я взяла уже готовые, сгенерированные другими пользователями по поиску «liminal spaces». Всего получилось 29 изображений, которые я привела к одному размеру 512× 512 и формату png.

Исходные изображения, взятые с сайта lexica.art

Исходные изображения, взятые с сайта lexica.art
Результат
Для начала я решила менять параметр num_inference_steps и проследить, как меняются результаты. Стало заметно, что при увеличении числа итераций генерации становятся более детализированными как по заполненности комнаты и точности объектов в ней, так и по освещению.
«abandoned empty room with different sized paintings on the walls» с параметром num_inference_steps равным 25 и 100 соотвественно
«room with columns in the middle and doors» с параметром num_inference_steps равным 25 и 100 соотвественно
«barely lit empty carpeted coridor with doors along the walls» с параметром num_inference_steps равным 25 и 100 соотвественно
В процессе я заметила, что цветовая палитра не совпадает с той, которая присутсвует на исходных изображениях. Поэтому я решила уточнять промпты и добавлять слова «yellow», «blue» и «red». Тогда генерации начали больше походить на референсные.
«yellow room with blue doors and a red carpet on the floor»
«yellow basketball room»
«room with plain blue walls and a red chair in the middle»
Используемые инструменты
— Сайт lexica.art (https://lexica.art/) для поиска изображений; — Google Collab для написания кода; — Photoshop для создания коллажей и корретирования скачанных изображений для дальнейшего использования в обучении модели; — HuggingFace для генерации токена в процессе создания модели; — StableDiffusion XL с внедрённым LoRA для обучения модели на загруженных изображениях.




