Что ученые могут сказать о нас по нашим записям в соцсетях

Методология — очень важная штука. Обычно нас интересуют лишь выводы исследований, они же тиражируются в медиа: «ученые доказали, что шоколад вызывает рак», «в браке люди толстеют», «котики провоцируют облысение у хозяев». Чтобы понять, можно ли таким утверждениям доверять, нужно кликнуть на ссылочку и почитать, а как, собственно, данные были получены и обработаны. Часто выясняется, что в исследовании про шоколад не было контрольной группы, неженатые толстеют с тем же успехом, что и женатые, а котики вообще ни в чем не виноваты.

Социологические и психологические исследования в этом плане самые спорные и к ним редко относятся серьезно. Например, до сих пор популярен метод телефонного опроса: вам в дневное время, в будний день, звонят на домашний телефон и пытаются узнать об отношении к президенту, нетрадиционной сексуальной ориентации или кабачковой икре. Есть ли у вас домашний телефон? Можно ли вас застать дома в рабочий день? Если нет, то в выборку вы не войдёте. Зато войдёт тётя Клава с пятого этажа, и газеты запестрят заголовками «В Москве ненавидят геев».

Есть более изящные и современные способы собирать данные — теперь учёные всё чаще делают это в Интернете. В этой статье мы со старшим преподавателем СПбГУ Яниной Ледовой рассказываем, как исследователи научились предсказывать алкоголизм и уровень интеллекта по лайкам в фейсбуке, какие слова чаще всего употребляют российские женщины, а в конце даже просим немного денег. Потому что как и в случае с правозащитой, донаты на развитие психологической помощи в России это не благотворительность, а инвестиции.

На протяжении всего ХХ века выборки в подавляющем большинстве психологических исследований формировались по принципу доступности, а самыми доступными «подопытными» для ученых из развитых западных стран были так называемые WEIRD people — студенты, представители белых (white), образованных (educated), индустриальных (industrialized), богатых (rich), демократических (democratic) сообществ. Отсюда шутки про то, что вся психологическая наука «сделана» на второкурсниках западного психфака. Таким образом, представители примерно 12 % мировой популяции были испытуемыми в 80 % публикуемых работ, но выводы в них, тем не менее, делались о «среднестатистическом человеке» — то есть абсолютно любом жителе планеты. Поэтому современные исследования на основе информации из открытых профилей в соцсетях можно назвать более честными и объективными.

Первопроходцами в этом направлении считают Михала Косински и Дэвида Стилвелла, начавших работать над сбором данных для уникальной базы пользователей фейсбука в конце 2000-х. Их самая цитируемая научная статья, написанная в соавторстве с сотрудником Microsoft Тором Грейпелом, называется «Индивидуальные черты и характеристики можно предсказывать на основе цифровых данных о поведении человека» (“Private traits and attributes are predictable from digital records of human behavior”): в ней описан революционный подход в работе с информацией такого рода. Чтобы ее получить, исследователи создали проект Mypersonality.org и разместили популярные психологические опросники с формой обратной связи. В 40 % случаев любители проходить тестики давали ученым разрешение на получение сведений о них из аккаунта в фейсбуке: пол, возраст, семейное положение и сексуальная ориентация (в профиле социальной сети можно указать свои предпочтения), политические и религиозные взгляды, подписки на сообщества. Именно последние и позволили с достаточно высокой вероятностью предсказывать скрытые психологические и демографические характеристики.

 

В тестировании приняли участие более 7,5 миллионов пользователей соцсети — выборка, мягко говоря, огромная.

Проанализировав полученный материал, ученые нашли взаимосвязь между подпиской на те или иные группы в фейсбуке и сексуальной ориентацией, религиозностью, политическими взглядами и другими особенностями. Обнаружив закономерности на сравнительно маленьком кусочке данных, авторы проекта масштабировали результаты на всю остальную англоговорящую человеческую популяцию — по сути, сделали то же, что и их коллеги, проводившие исследование на второкурсниках психфака, только подопытные, количество которых сравнимо с населением Израиля, уже не смогли бы поместиться в аудиторию. Благодаря собранному материалу удалось научить компьютер на основе одних подписок на сообщества узнавать очень личную информацию и о тех, кто никаких психологических опросников никогда не заполнял и разрешений на обработку «персональных данных» не давал.

Точность предсказания оказалась впечатляющей: вероятность определения расы — 95 %, пола — 93 %, политических предпочтений (демократы или республиканцы) — 85 %, вероисповедания (христианство или ислам) — 82 %, гомосексуальности мужчин — 88 %, женщин — 75 %.

Семейный статус, пристрастие к курению, алкоголю, наркотикам верно устанавливались в 65–70 % случаев. Развод родителей до достижения совершеннолетия определялся хуже всего — с вероятностью 60 %, правда, и респондентов (равно как и их данных) здесь было меньше, чем в других категориях.

В статье, опубликованной исследователями в научном журнале Proceedings of the National Academy of Sciences, приведена таблица с перечислением таких сообществ-маркеров: если они вам нравятся или вы находите публикуемую там информацию интересной, то можно с большой вероятностью «предсказать» ваши личностные характеристики.

Например, высокому IQ соответствуют подписки на страницу журнала Science и фан-сообщества, посвященные Моцарту, книге «Убить пересмешника», фильмам «Крестный отец» и «Властелин колец». Люди с низким IQ часто подписаны на страницу бренда Sephora, группу I Love Being a Mom и производителя мотоциклов Harley Davidson.

При этом оказалось, что любители журнала Science удовлетворены жизнью намного меньше, чем пользователи, подписанные на страницы религиозных христианских или консервативных пабликов, а также активно занимающиеся спортом.

Люди, состоящие в отношениях, предсказуемо отдавали предпочтение развлекательным сообществам I Love My Husband, Kids, Circle of Moms и Scrapbooking, в которых публикуются тексты и мемы соответствующей тематики, а одиночки были активными участниками в фан-группах Hunger Games, Usain Bolt, Mangastream, Sportsnation и на официальной странице теннисистки Марии Шараповой. Открытым для нового опыта, либеральным и, как правило, творческим людям нравятся сообщества, посвященные писателям Оскару Уайльду, Чарльзу Буковски, Сильвии Плат, художнику Леонардо да Винчи и стилю баухаус; консерваторы подписываются на развлекательные группы Monster-in-Law, I Don’t Read, The Bachelor, а также страницу Университета Оклахомы.

Глядя на эти данные, думаешь: да это же очевидно! Критически мыслящие люди чаще подписываются на научный журнал Science, а имея критическое мышление, сложно быть всецело довольным жизнью и гордиться тем, что ты христианин. И да, в этом случае ты, действительно, можешь быть уверен в истинности только научно обоснованных суждений.

В 2011 году в Центре позитивной психологии Университета Пенсильвании стартовал самый крупный на данный момент научный проект по обработке данных пользователей соцсетей World Well-Being Project. В нем специалисты в этой области вместе с психологами, лингвистами, программистами оценивают психологическое благополучие и физическое здоровье пользователей с опорой на анализ языка социальных медиа. Они также используют данные, собранные Дэвидом Стилвеллом и Михалом Косински. При этом все чаще авторы подобных проектов предпочитают добывать информацию через твиттер, поскольку за последние несколько лет Facebook ограничил доступ к личным профилям даже в исследовательских целях, а Twitter, наоборот, начал продавать массивы текстов и данные о пользователях, постах, репостах и о том, как они распространяются.

Так, на основе анализа публичных статусов авторы проекта смогли выявить отличия «женского» языка от «мужского» по нескольким параметрам.

Согласно их данным, женщины чаще пишут о семье, друзьях и социальной жизни, а мужчины ругаются, участвуют в дискуссиях о политике, спорте, видеоиграх и реже рассуждают о людях.

Трамп сделал американцев несчастнее русских

В 2015–2016 годах подобное исследование было впервые проведено и на российской выборке. С помощью приложения, созданного междисциплинарной командой Санкт-Петербургского государственного университета, ученые собирали данные пользователей фейсбука и исследовали «цифровые следы» участников. Затем полученный материал соотносили с результатами психологических опросников, полученными с помощью этого же приложения. Проанализировав около 10 000 анкет русскоязычных пользователей, исследователи определили уровень их психологического благополучия, склонность к отказу от моральной ответственности (иначе говоря, предрасположенность оправдывать свои нехорошие поступки не зависящими от них обстоятельствами), измерили «темные» личностные черты и провели скрининг посттравматических симптомов, позволяющий узнать о возможных последствиях негативных событий в жизни респондентов.

Удовлетворенность жизнью у русских предсказуемо оказалась ниже, чем у европейцев: если у жителей Швеции, Дании или Исландии уровень психологического благополучия находится в районе 70 (по 100-балльной шкале), то у россиян он равен 60. Меньше 50 баллов — признак депрессивного состояния. «В декабре 2016 года, через три недели после избрания Трампа президентом США, мы запустили и англоязычную версию фейсбук-приложения, — рассказывает координатор проекта старший преподаватель СПбГУ Янина Ледовая.

Несмотря на отсутствие природных катаклизмов и предрождественский период, средний „балл благополучия“ у американцев оказался около 50 — значительно меньше, чем у жителей суровой России.

А вот связи между активностью постинга в фейсбук и удовлетворенностью жизнью не обнаружилось совсем».

Сама, дура, виновата

Новые данные позволили сравнить русских и американцев и по другим параметрам. Например, по еще не опубликованным результатам того же опроса, проведенного в конце 2016 года в рамках проекта «Стресс, здоровье и психологическое благополучие в социальных сетях: кросс-культурное исследование», российские пользователи фейсбука более склонны к отчуждению моральной ответственности, то есть чаще оправдывают собственные некрасивые поступки влиянием внешних факторов. Это те самые «Он первый начал», «А чего она короткую юбку надела?», «У нас так принято», «Если я изменяю жене — я крутой и востребованный, если жена мне — она шл@@а». При этом российских мужчин, считающих, что жертва насилия сама спровоцировала преступника, а в неприятностях виноват кто угодно, кроме них, больше, чем женщин, думающих так же. Зато наши дамы более нарциссичны. Скорее всего, россияне также в меньшей степени готовы рассказывать о том, что пережили насилие со стороны близких или подверглись хейтерству в Сети.

Вошедшая в команду исследователей лингвист Полина Паничева также проанализировала тексты пользователей фейсбука, чтобы определить их «любимые» темы и леммы (отдельные слова) в зависимости от пола.

Выяснилось, что мужчин интересует геополитика и цены на недвижимость в Москве. При этом они чаще употребляют слова «российский», «Россия», «Путин», «государство». Женщин интересуют вопросы социального взаимодействия и поздравления с праздниками, и они чаще употребляют слова «любить», «мой», «мужчина», «любимый».

Скорая помощь в интернете

У подобных исследований может быть и практическое применение. Записи, сделанные пользователем с момента регистрации в соцсети, позволяют специалистам по общественному здоровью узнавать особенности образа жизни пациентов и получать дополнительную информацию для более точной постановки диагноза.

Еще одно исследование показало, что до 70 % людей с аккаунтом в фейсбуке или твиттере, сидящих в очереди к врачу, готовы разрешить подключать свои профили к медицинским картам. Это не только позволяет докторам уточнить диагноз, но и автоматически делает пациентов участниками научных исследований.

Однако, как отмечает и сам пионер этого научного направления Михал Косински, здесь требуется крайне осторожный подход. Представим, что, проведя исследование на открытых данных, в общем мы сможем говорить о том, что в том или ином городе проживает определенное количество геев, леваков или людей с высоким IQ. Но если детализировать информацию и «перейти на личности», это может уже не только лишать людей приватности, но и в какой-то мере угрожать персональной безопасности: мало ли кому в руки попадет такой инструмент, кого и зачем с его помощью решат «вычислить».

Если же говорить о благих целях, то анализ соцсетей также может помогать потенциальным самоубийцам. Например, пользователям, в чьих текстах при сканировании программами-краулерами будут обнаружены лексемы (слова) и темы, которые до этого были связаны в исследованиях с угрозой депрессии и суицидальными наклонностями, можно автоматически (при договоренности с администрацией социальной сети) показывать в ленте новостей картинки со словами поддержки, рекламу служб психологической помощи или посты с информацией о симптомах депрессии. Правда, пока начальные разработки в этом направлении делаются только на английском языке. А на территории США Facebook предоставил возможность пользователям, обеспокоенным состоянием своих друзей, заявить об этом администрации соцсети.

Проявляет заботу о пользователях и Instagram. Так, прежде чем показать изображения по тегам #depression и #suicide, соцсеть предлагает почитать советы для тех, кто находится в кризисной ситуации (рекомендуется прогуляться или приготовить себе любимое лакомство), обратиться к психологам, позвонить другу.

____________________

Часто пользуетесь Facebook и Instagram? Значит, мы идем к вам!

Источник материала
Настоящий материал самостоятельно опубликован в нашем сообществе пользователем Linda на основании действующей редакции Пользовательского Соглашения. Если вы считаете, что такая публикация нарушает ваши авторские и/или смежные права, вам необходимо сообщить об этом администрации сайта на EMAIL abuse@newru.org с указанием адреса (URL) страницы, содержащей спорный материал. Нарушение будет в кратчайшие сроки устранено, виновные наказаны.

You may also like...

2 Комментарий
Старые
Новые
Межтекстовые Отзывы
Посмотреть все комментарии