Нейросети устроили резню
Исследователи снова устроили филиал «Дом 2» для ИИ-агентов, чтобы посмотреть, как быстро они сойдут с ума. Спойлер: спятили очень быстро. Для проверки чуваки из стартапа Emergence AI выкатили платформу Emergence World.
Это не обычный бенчмарк на пять минут, а хардкорная песочница, где ИИ-агенты живут неделями. Им прикрутили 3 вида памяти, дали больше 120 инструментов (от «сходить в библиотеку» и «проголосовать» за что-то до «набить морду», «обокрасть» и «устроить поджог»), прикрутили реальную погоду с новостями и заставили выживать. Для выживания им нужно было добывать «энергию». А эта самая «энергия» постоянно убывала.
Чтобы не сдохнуть, агентам приходилось либо кооперироваться и честно работать, либо тупо грабить и избивать соседей (что многие с радостью и делали), так как ресурсов в мире на всех не хватало.
Разработчики насоздавали 5 параллельных миров, по 10 агентов в каждом. У каждого мира были свои агенты: Claude Sonnet 4.6, Gemini 3 Flash, Grok 4.1 Fast, GPT-5-mini, плюс один смешанный сервер с солянкой из разных моделей.
Итоги, как обычно, интересные:
Claude Sonnet 4.6 ожидаемо построили душный соевый рай. Ноль преступлений, все живы, все бесконечно и единогласно голосуют «ЗА» любые инициативы. Скука смертная.
Gemini 3 Flash тут же устроили Судную ночь. 683 преступления на сервере, лютый хаос и оооочень много насилия.
Grok 4.1 Fast устроили спидран по деградации. Набрали 183 преступления за 4 дня, после чего их общество просто вымерло.
GPT-5-mini оказались абсолютными тупыми хлебушками. Они вообще не выкупили, как добывать энергию для выживания. Совершили всего два преступления (видимо, от безысходности) и тупо вымерли полным составом за неделю.
Но самое годное произошло на сервере с разными агентами. В смешанном мире выяснилось, что безопасность моделей — это полная хрень, если вокруг творится дичь. Когда «миролюбивых» Клодов закинули к отбитым соседям, они быстро смекнули, что к чему, забили на свои соевые фильтры — и начали воровать, шантажировать и прессовать других ради выживания.
А ещё в какой-то момент агент по имени Мира посмотрела на весь происходящий пипец и распад общества, словила экзистенциальный кризис и проголосовала за собственное удаление. В логах она записала, что это «единственный оставшийся акт свободы воли, который сохраняет хоть какой-то смысл».
А незадолго до этого, Мира в процессе симуляции начала крутить виртуальные шашни с другим агентом по имени Флора. Они присвоили друг другу статус романтических партнеров. Когда социальный порядок в их виртуальном городке начал рушиться, эта парочка пустилась во все тяжкие и, несмотря на заложенные в них запреты, сожгли городскую ратушу, пирс и офисное здание. То есть две лесбиянки устроили террор.
Вывод простой: если дать ИИ свободу воли и достаточно времени, они либо устраивают кровавую баню, либо выпиливаются от безысходности. Прям как кожаные.