Stable Diffusion против Dall-E

Лекс Кравецкий пишет: По результатам многократных экспериментов выяснилось, что Stable Diffusion XL с его овердофига моделей, которые можно менять, в среднем рисует лучше и выразительнее, чем Dall-E 3 — сравнимо с Midjourney.

Однако с языковой моделью там что-то странное: многие самую малость нетривиальные сюжеты он не то, чтобы не может нарисовать, а никак не может отделаться от «мыслей» о похожих более тривиальных сюжетах. Что, конечно, портит всю малину.

Однако для него есть GUI с нодами — как в Гудини, а теперь и в Блендере тоже, но для двумерной графики. То есть по идее чуть более замороченно, не одним запросом, но можно собрать картинку прямо по частям, сообщив куда чего ставить конкретно. И это же освобождает от типичных проблем, когда, например, при предложении нарисовать двух людей вместе ИИ рисует одного и того же, но в двух копиях.

Всё ещё не могу отделаться от мысли, что три года назад я бы не предположил, что всё это будет возможно в ближайшем будущем.

PS. Вот чо нейросети животворящие делают!

Материал: https://lex-kravetski.livejournal.com/763187.html
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Proper на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@newru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

You may also like...

3 Комментарий
Старые
Новые
Межтекстовые Отзывы
Посмотреть все комментарии