Жульничество ИИ-корпораций
Мне представляется чрезвычайно интересной ситуация, когда чуваки из Адобченко взяли 5.6 МИЛЛИОНА долларов и сказали, что на эти деньги натренируют свою модель Phota AI. А на итоге просто перепродают чужое.
Да-да — Phota AI без использования персонализации просто перепродает Nana Banana Pro с наценкой 0.01 доллара.
А вот дальше интересно обсудить интересный вопрос: консистентность против креативности. Если вы раскошелились и натренировали «profile» на своих фотках, то происходит вот что:
Сначала Нанабанана генерит свою версию картинки, а потом «корректирующая» модель от Phota AI редактирует ее в сторону «лучшей схожести» с заданным в датасете лицом. И тут возникает фуфло противоречие: корректирующая модель «ограничивает» креативность.
Например, Банана делает улетные ржущие лица, а Phota AI потом утягивает их в сторону скромной улыбки одним ртом, чтобы гарантировать ту самую консистентность и схожесть. Получается нейтральная обобщенная улыбка, довольно скучная.
Хотя на мой глаз, все люди ржут по-разному, некоторые настолько сильно меняются в лице в этот момент, что вопрос «схожести» становится открытым даже в реальности.
Поэтому автор исследования пишет, что если вам надо максимальную похожесть, пользуйте Phota AI, но вы пожертвуете вариативностью.
Также важно понимать, что исходную картинку в любом случае генерит Банана, и если она справляется плохо, например, со светом — то никакая корректирующая модель от Фоты уже не спасет, просто добавит размытия теней поверх.
В базе там Банана, и ничего лучшего чуваки из Адобченко не сделали. Они просто воруют ваши деньги.