Original size 1240x1750

Обучение в стиле Claude Monet

PROTECT STATUS: not protected
1
The project is taking part in the competition

1. Идея и цели проекта

Задача моего проекта — это исследовать, как легкая адаптация LoRA позволяет передать живописный стиль импрессионизма на базе модели Stable Diffusion XL. Я выбрала художника — Клод Моне, одиного из основателей импрессионизма, чьи работы известны мягкой передачей света и вибрацией цвета. Основная цель — добиться того, чтобы нейросеть могла создавать новые сцены: пейзажи, сады, городские виды, но в узнаваемой манере Моне. С легкой текстурой мазков, пастельной палитрой и атмосферой утреннего воздуха.

2. Источник и подготовка данных

Датасет: репродукции картин Клода Моне, находящиеся в Public Domain на платформе WikiArt. Размер выборки: 29 изображений, отобранных вручную. Все картины приведены к формату 512 на 512 пикселей и сохранены в папке «claude monet-dataset»

big
Original size 4000x2250
big
Original size 4000x2250
Original size 4000x2250
Original size 4000x2250

3. Методика и параметры обучения

Для обучения использовалась модель Stable Diffusion XL Base 1.0, обученная с помощью метода LoRA. Обучение проводилось в среде Kaggle на T4 GPU x2 Instance prompt: monetx style, impressionist painting, broken brushstrokes, luminous atmosphere, pastel palette, soft edges, plein air, canvas texture Полученный адаптер опубликован на Hugging Face: https://huggingface.co/l033ll/claude-monet-pics-sdxl

4. Результаты генерации

После обучения адаптер был подключен к SDXL через pipe.load_lora_weights (). Вес LoRA регулировался в диапазоне 0.8-1.0. Примеры промптов: - «monetx style, sunrise over a small harbor, shimmering water reflections, hazy atmosphere», - «monetx style, garden path with blooming irises and roses, dappled light, plein-air painting», -"monetx style, poplar trees by the river in autumn, high key palette, broken brushwork», -"monetx style, city street in rain, umbrellas, soft edges, luminous fog», Итоговые изображения демонстрируют консистентность стиля — короткие мазки, мягкий свет, приглушенные цвета.

Original size 4000x2250

5. Наблюдения и анализ

- Передача цвета. Модель воспроизводит узнаваемую пастельную гамму — охры, голубые, лавандовые и розовые оттенки. - Текстура мазка. На объектах проявляются короткие, вибрирующие мазки, особенно заметные при высоком контрасте. - Глубина сцены. LoRA добавляет атмосферную перспективу: дальние планы размываются, ближние остаются насыщенными. - Стабильность. Повторные генерации сохраняют консистентность цветовой палитры и характера мазков

6. Выводы

Небольшой датасет оказался достаточным, чтобы LoRA зафиксировала визуальные принципы импрессионизма. Полученный адаптер делает возможным быстрое переключение стилей — например, комбинировать реализм с импрессионизмом. Метод показывает, что даже классические художественные приемы можно воспроизводить средствами генеративных моделей без больших вычислительных затрат.

7. Использование ГенИИ в проекте

Я использовала ChatGPT для генерации промптов на английском языке и подборов параметров обучения.

Обучение в стиле Claude Monet
1
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more