Возможно многие не входят в эту сферу потому что считают что это:
Теперь по пунктам. 1 - сложно в самом начале, пока не поймёшь принцип по которому нейросети генерируют изображения (я вам сегодня с этим немного помогу). 2 - на данный момент существует множество бесплатных (на примере одной из них я и покажу как это работает), условно бесплатных, ну и конечно полностью платных нейросетей. Я не буду здесь всё расписывать, в поисковике есть ГОРА информации по запросу "free ai image generator". 3 - сама генерация занимает от нескольких секунд, до нескольких минут или часов на медленных режимах в условно бесплатных нейросетях - но сегодня мы их не касаемся.
Теперь к главному, в качестве тренажёра мы будем использовать нейросеть Fusion Brain созданную в АНО «Институт Искусственного Интеллекта». Почему она? Потому, что: бесплатная, на русском, быстрая, выдаёт фотореалистичные изображения. Подробней о интерфейсе можно узнать тут. Можете прочитать до, можете после, но рекомендую ознакомится, так как я не буду рассказывать вам о её дополнительных функциях, а их несколько.
Перейдя на сайт мы попадаем в интерфейс программы (хотя сейчас вроде нужно пройти регистрацию). Для начала нас не интересуют доп. функции просто выбираем соотношение сторон и в путь.
Я буду писать подсказку (prompt) на английском языке, так как начинал на midjourney и уже привык к комбинация на английском, но здесь всё отлично работает и на русском. Я буду писать промпты пошагово, что бы была понятна их взаимозависимость. Далее на скринах будут показаны изображения которые сгенерированы по написанному внизу запросу. Для начала я напишу что именно я хочу сгенерировать - "woman" и жму на стрелку. Вот результат:
Но мне нужна более молодая женщина, поэтому нужно уточнение по возрасту. Можно написать "young" или "20 y.o.", но я обычно пишу "model" это слово автоматом выдаёт изображения молодых женщин хорошего качества с минимумом ошибок.
Нужное мне изображение должно быть цветным поэтому пишу "uhd", можно "color". Но опять же "uhd" будет лучшего качества, а "8к" будет выдавать более однообразные изображения без серьёзного повышения качества.
Вроде неплохо, но мне нужно что бы была видна грудь 🍓, поэтому пишу уточнение "torso portrait"
Теперь попробую отодвинуть девушку подальше изменив промпт на "waist portrait"
А теперь хочу всю посмотреть, поэтому меняю подсказку ещё раз на "full body"
Что-то однообразный фон получается, но это даёт о себе знать подсказка "model" ведь модели работают в студии. (У нас серьёзная контора, а не Onlyfans какой-то). В подсказках всё взаимосвязано и каждое слово оказывает влияние на сгенерированное изображение. В некоторых нейросетях есть поле "Negative prompt" в которое можно вписать чего на изображении не должно быть, а здесь нет. Поэтому пишем "detailed background"
Ну теперь деталей хватает поэтому можно представить что девушка будет в средневековой броне "medieval armor"
Заметили как фон стал средневековый? Хотя я писал только про броню. Вообще сложно с одного промпта сгенерировать взаимоисключающие элементы хорошего качества. К примеру не всегда можно с первого раза сгенерировать киберпанк девушку в экзоскилете на площади средневекового города. В Fusion Brain можно воспользоваться ластиком и затереть задний фон, а затем второй подсказкой сгенерировать новый - но эту другая история. А мы состарим девушку на пару тысяч лет подсказкой "savage primitive girl"
Если постоянно обрезает что то нужное, к примеру как на последних изображениях ноги. То можно добавить "Slender legs" или "footwear" (вариантов много: штаны, носки, ступни, красовки, туфли, ). Или изменить соотношение сторон на более вытянутое, что бы всё тело "поместилось" вместе с ногами. Но мне и так сойдёт, а вот лес на фоне хотелось бы поменять на светящиеся джунгли , поэтому "detailed luminescent jungle background"
Теперь мне нужно разглядеть лицо поближе поэтому меняю "full body" на "torso portrait". И вернёмся из джунглей в лес добавив немного магии, изменив "detailed luminescent jungle background" на "detailed bio luminescent magic forest background"
Раз уж у меня всё биолюминисцирует в том числе и тело, а ведь я писал только про лес (это я про влияние ВСЕХ подсказок на изображение) . Ещё такие эффекты есть в киберпанке, можно посмотреть какой эффект будет от их совмещения. Убираю "savage primitive girl", дикари до киберпанка явно не дотянут, а взамен добавляю "cyberpunk style"
Видите что будет если намочить Манту? А всё потому что шлялась полуголая по лесу. Поэтому одеваем в броню, но уже не в обычную, а в футуристическую "biomechanical armor"
Теперь ничего не страшно. Но как то и не сильно стильно для такой бесстрашной красавицы, да и в глазах от свечения рябит - поэтому "white biomechanical armor"
Теперь посмотрим на лицо поближе заменив "torso portrait" на "portrait"
Фублянах а что это за непонятная сыпь на лице? Нужно приблизить добавив "close up face"
Теперь всё ясно - это не сыпь, а какие-то киберпанковские примочки. Но почему такой холод в глазах? Добавить огонька? Ну а КАК ИЗВЕСТНО ВСЕ БАБЫ ВЕДЬМЫ , то и огонёк необычный - зелёный. " bright green eyes"
Как будто чужой в душу смотрит.... Лучше пусть будут холодными чем такими, а ещё лучше и anime. Поэтому меняем " bright green eyes" на " bright cyan eyes" a " woman, model" на "anime girl"
Уже не " woman model" но ещё и не " anime girl". Поэтому добавим эффект рисунка и получим промпт - " drawing anime girl"
Попробую сделать в стиле аниме, но более реалистичной добавив "Digital art"
Хочется больше мультяшности... Убираю " Portrait, digital art, close up face" добавлю "pixar studio"
Глаза явно не "cyan", но видимо у Пиксара других нет, ну и не беда. А как бы выглядела эта девушка в виде игрового персонажа? Убираем всё лишнее, ставим белый фон, добавляем " Digital painting" и в результате получаем запрос вида :
"Drawing full body anime girl , digital painting, game character , white background, cyberpunk style, biomechanical armor,"
И так можно играться бесконечно, меняя/добавляя подсказки и получая различные изображения. Если вы добавляете, меняете подсказки, а изображения получаются однотипными - значит в вашем запросе есть слово " маяк" за которое цепляется нейросеть. Зачастую таким словом может быть "8к" или поза/расса персонажа, или комбинация.
Всем кто дочитал до конца и не запутался БОЛЬШОЙ РЕСПЕКТ.
Если подчерпнули для себя что-то новое не забудьте поставить + за просветительскую работу (ну и мне будет приятно). Если есть какие-то вопросы - спрашивайте, если позволят мои знания, то отвечу. Если интересно ещё что-нибудь по данной тематике пишите в коментах. 99% отвечу, но не факт что очень оперативно.