Я не обозреватель нейронок, но с их появлением начал активно использовать этот инструмент в работе. А именно в рекламном дизайне. При этом использую именно Кандинского, как простой, быстрый и бесплатный инструмент, который помогает накидать себе референсов или ассетов. На днях Сбер выпустил в релиз свою новую версию нейронки рисующий картинки по текстовому описанию. По их словам разработчики увеличили количество параметров на 300 млн. Что, в теории должно улучшить результат выдачи. В целом, результат действительно улучшился, но совсем не значительно. Правда сегодня речь не об этом. Я провел некоторое время за бесполезным занятием в виде эксперимента выдачи результатов нейронкой в разных пресетах. Результат ниже. В качестве входной строки было что-то про "Девушку в красном сарафане, красных туфлях на высоком каблуке, с белой сумочкой, гуляющую по вечернему городу среди множества других людей".
Здесь нейронка в принципе забила на понимание "Сарафан" и использовала в генерации просто какое-то платье красного цвета. С ногами у Кандинского тоже все сложно - он их просто обрезал в большинстве случаев. Детали в виде белой сумочки нейронка вообще везде предпочла проигнорировать.
С аниме стилистикой неплохо выходит, но видно, что нейронка заточена под прорисовку персонажа. В отличии от той же Миджорни или хороших моделей Стейбл Дифьюжн, здесь фон картинки получается много беднее. Но зато появились туфельки.
С этим пресетом, сколько бы я не старался, главный персонаж всегда удалялся от камеры. На самом деле я так и не разобрался в каком месте это фото насыщенно деталями больше чем иные картинки. В комментариях добавлю пробы картинок с лицом крупным планом, но и там тоже поры не появляются, каждая отдельно взятая ресничка не выделяется. На мой взгляд пресет бесполезный.
Здесь скорее просто выдержка цветовой гаммы неоновых вывесок и использование иероглифов в вывесках. Никаких кибернетических имплантов в персонаже, никаких тебе футуристических транспортных средств в небе.
Непосредственно Кандинский. Абстракционизм конечно в целом стиль сложный, для многих странный, но лично мной вполне понимаемый. В особенности картины Пикассо, где, среди сложных фигур, можно легко проследить характер человека. Но вот то, что представляет в результате нейронка, со стилем В. Кандинского, как мне кажется, совершенно ничего общего не имеет. Это даже абстракционизмом назвать нельзя.
А вот стиль Пикассо нейронка, как мне кажется, повторяет вполне сносно. Но, конечно, не стоит ожидать от нейронки, что картина, в отличии от работ самого Пабло, в результате сможет отразить настроение людей или передать атмосферу прогулки. Удивительно, что даже в этом пресете лица людей на заднем плане оказываются плохо проработанными, все внимание уделено главному персонажу.
Хороший пресет, но результат совсем не очевиден до получения картинки. Я ожидал, что-то в духе Пусена, Давида, а в итоге просто архитектура начала изобиловать колоннами. Девушка оказалась скорее в средневековом одеянии, а не в тоге.
Дома вернулись в привычное состояние, а одеяние девушки сохранило свой образ и уже стала ближе к эпохе ренессанса. А вот форма одежды людей на заднем плане скорее ближе к 60-м годам прошлого столетия.
Еще 2 интересных пресета, которые занятно отражают стилистику. "Советская мультипликация" действительно использует черты свойственные отечественным мультикам прошлого столетия: четкие линии, сдержанная палитра, минимализм в прорисовке лица, тела и деталей персонажа. А вот обычный "Мультик" уже содержит больше деталей, градиенты цветов (обратите внимание на освещение мощеной дороги), появились детали на платье, волосы оказались проработаны в большей степени. Но замечу, что версия 2.1 давал более мультипликационный результат, что я активно использовал, когда мне надо было получить рисованный ассет в будущем дизайне.
Самый прорабатываемый на детали пресет. Конечно мы попреждему не получаем сарафан, ноги обрезаны, сумочка так и не появилась, но зато появилось много деталей в одежде и мимике. На удивление даже все пальцы на месте и лишних не отросло. Впрочем, картинка все равно получилась кривая: соотношения длин и размеров немного, но нарушены. Ну и толпа на заднем плане тоже испарилась. Видимо этот пресет больше иных заточен на проработку главного объекта, в результате чего игнорируются детали задника.
Забавный вариант, который добавляет в одежду национальные признаки типа вышивки и прочие детали. Улица на заднике в отличии от предыдущих вариантов, как мне показалась, уже скорее с Питера срисована.
И последняя картинка в этом посте. Пресет, который одевает персонажа в зимнюю одежду и насыщает новогодней расцветкой.
В комментарии добавлю еще пару экспериментов, где я генерировал "молодого человека в горах" и уже совсем дичь: "рено дастер в виде космического корабля". Просто хотелось посмотреть как нейронка справится с задачей из области фантастики.