на a1111 сейчас никак (и даже не уверен будет ли это там),
чуть ниже написал как на comfyui запустить
пока что только через comfyui это доступно, советую начать с его изучения.

но если не хочешь сильно вникать, то вот микрогайд:

===

• ставишь stabilityMatrix (https://github.com/LykosAI/StabilityMatrix)
• там качаешь comfyui
• в comfyui качаешь расширение: https://github.com/cubiq/ComfyUI_IPAdapter_plus
• идешь на страницу расширения и по ссылкам скачиваешь все модели. пихаешь их куда указано.
• смотришь видос из тела поста, в точности повторяешь его workflow (либо я могу свой скинуть завтра).

примеры workflow есть тут: https://github.com/cubiq/ComfyUI_IPAdapter_plus/tree/main/examples (конкретно по переносу стиля он ещё не добавил),
либо в дискорде этого разработчика.

===

после тебе будет достаточно загрузить референс и написать свой prompt.
(и мб чуть-чуть поиграться с настройками)
а это он и есть.
просто разработчик знает как именно он работает и использует ip-adapter в конкретных сценариях.

например раньше перенос стиля работал только в 1.5 моделях, и то "экспериментально". (https://github.com/InstantStyle/InstantStyle)
этот же чел реализовал для sdxl моделей.

тут про новые фишки:
Фигурка получилась из-за "prompt leaking".
У вахи огромный шанс на генерацию фигурок, т.к. в тренировочных датасетах фигурки по вахе и арты назывались одинаково.

Лечится довольно просто: можно первые 10 кадров генерить просто Асуку, остальные уже Асуку с нужной тематикой.
На практике выглядит это как-то так: [Asuka:Asuka warhammer style:10]
Забыл сделать ушки на чулках...
shame on me
нет, но насколько знаю люди так делают.
*даже есть новый скам - заказывают у художника работу -> через время просят скетч, типа посмотреть как работа продвигается -> на основе скетча генерят.

в моём случае это последствия доработки в фотошопе.
убирал слоя - в какой-то момент осталось то что на второй пикче
Titan RTX
(там 24GB VRam. 3090 на минималках)

насчёт чекпоинта в прошлом посте расписал
ControlNet там где мемы (пикчи 2,6,9).
Фотошоп: 1 - добавил текст, чибик сгенеренный; 7 - вставил объект и прогнал через нейронку.
Остальное чисто через prompt'ы.

ну а в прошлом посте вообще без него обошелся.
для гиперперспективы надо либо чекпоинт юзать, который её знает,
либо через ControlNet найти референс и отрисовывать по нему.

в первом случае можно поиграться с ракурсами: "from above" \ "from below" + тег "foreshortening".

Prompt для первой (тут эффект получился из-за чекпоинта + описания всей одежды + "face closeup"):
1girl, frieren, sousou no frieren, elf ears, pointy ears,
japanese school uniform,
pantyhose,
standing, sexy, small breasts,
manga style, greyscale,
simple background, white background,
(bags under eyes:1.4), (face closeup:1.3), (sideways mouth:1.4)


Prompt для третьей:
1girl, frieren, sousou no frieren, elf ears, pointy ears,
japanese school uniform,
pantyhose, loafers,
standing, sexy, small breasts,
manga style, greyscale,
simple background, white background,
constricted pupils, (from below:1.2),
(bags under eyes:1.4)
без лоры, чекпоинт знает её:
https://civitai.com/models/260267/animagine-xl-v3

список персонажей у чекпоинта:
https://huggingface.co/spaces/Linaqruf/animagine-xl/blob/main/wildcard/character.txt
(отсортировано по убыванию количества картинок в обучаемом датасете.
т.е. чем выше персонаж в списке, тем больше шанс что модель его нормально отрисует.)