Original size 1240x1750

Обучение в стиле Claude Monet

The project is taking part in the competition

1. Идея и цели проекта

Задача моего проекта — это исследовать, как легкая адаптация LoRA позволяет передать живописный стиль импрессионизма на базе модели Stable Diffusion XL. Я выбрала художника — Клод Моне, одиного из основателей импрессионизма, чьи работы известны мягкой передачей света и вибрацией цвета. Основная цель — добиться того, чтобы нейросеть могла создавать новые сцены: пейзажи, сады, городские виды, но в узнаваемой манере Моне. С легкой текстурой мазков, пастельной палитрой и атмосферой утреннего воздуха.

2. Источник и подготовка данных

Датасет: репродукции картин Клода Моне, находящиеся в Public Domain на платформе WikiArt. Размер выборки: 29 изображений, отобранных вручную. Все картины приведены к формату 512 на 512 пикселей и сохранены в папке «claude monet-dataset»

Original size 4000x2250

3. Методика и параметры обучения

Для обучения использовалась модель Stable Diffusion XL Base 1.0, обученная с помощью метода LoRA. Обучение проводилось в среде Kaggle на T4 GPU x2 Instance prompt: monetx style, impressionist painting, broken brushstrokes, luminous atmosphere, pastel palette, soft edges, plein air, canvas texture Полученный адаптер опубликован на Hugging Face: https://huggingface.co/l033ll/claude-monet-pics-sdxl

4. Результаты генерации

После обучения адаптер был подключен к SDXL через pipe.load_lora_weights (). Вес LoRA регулировался в диапазоне 0.8-1.0. Примеры промптов: - «monetx style, sunrise over a small harbor, shimmering water reflections, hazy atmosphere», - «monetx style, garden path with blooming irises and roses, dappled light, plein-air painting», -"monetx style, poplar trees by the river in autumn, high key palette, broken brushwork», -"monetx style, city street in rain, umbrellas, soft edges, luminous fog», Итоговые изображения демонстрируют консистентность стиля — короткие мазки, мягкий свет, приглушенные цвета.

Original size 4000x2250

5. Наблюдения и анализ

- Передача цвета. Модель воспроизводит узнаваемую пастельную гамму — охры, голубые, лавандовые и розовые оттенки. - Текстура мазка. На объектах проявляются короткие, вибрирующие мазки, особенно заметные при высоком контрасте. - Глубина сцены. LoRA добавляет атмосферную перспективу: дальние планы размываются, ближние остаются насыщенными. - Стабильность. Повторные генерации сохраняют консистентность цветовой палитры и характера мазков

6. Выводы

Небольшой датасет оказался достаточным, чтобы LoRA зафиксировала визуальные принципы импрессионизма. Полученный адаптер делает возможным быстрое переключение стилей — например, комбинировать реализм с импрессионизмом. Метод показывает, что даже классические художественные приемы можно воспроизводить средствами генеративных моделей без больших вычислительных затрат.

7. Использование ГенИИ в проекте

Я использовала ChatGPT для генерации промптов на английском языке и подборов параметров обучения.

Код

Обучение в стиле Claude Monet

Aleksandra Borovkova

artificial intelligence

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...