16 марта в Еврейском музее и центре толерантности прошла лекция «Как жизнь отражается в цифрах». Аналитики компании «Яндекс» Николай Огай и Наталия Крупенина рассказали слушателям, как информация из различных сервисов Яндекса помогает специалистам понять пользователей сети и изучить их вкусы.

Благодаря развитию Интернета появились новые данные о мире, собрать которые иначе невозможно. Это позволяет гораздо эффективнее изучать действительность. Кроме того, Интернет-компании накапливают сведения о поведении людей в сети — так появляется новый тип информации, так называемые «большие данные». Сегодня «биг-дейтинг» быстро набирает популярность: он уже стал новым трендом в статистических исследованиях. Социологи, аналитики и маркетологи с помощью огромных баз данных переходят от частного к общему, тем самым описывая общество и изучая его закономерности.

Аналитики внешних исследований «Яндекс» занимаются популяризацией данных, то есть пытаются показать пользователям, как устроен Интернет изнутри и зачем вообще нужно проводить подобные исследования. Члены команды работают с информацией, собранной из многочисленных сервисов «Яндекса» (карты, такси и прочие), а также с результатами поисковых запросов пользователей. «Яндекс» собирает примерно 250 млн. поисковых запросов в день, благодаря чему специалисты могут проанализировать огромное количество данных.

«Нам важно, чтобы у людей, которые мало работают и находятся в Интернете, сложилось нормальное представление о сети. Они должны понять, что Интернет – это не только вирусы, киберги и порно», – заявил Николай.

В штате внешних исследований семь человек: пять аналитиков и два дизайнера. По словам Николая, ни у одного из них нет образования по специальности – философы, экономисты, лингвисты, социологи, но только не программисты. Такой подход и делает исследования уникальными: специалисты обращают внимание на причины, следствия, внутренние связи, контекст, а не только на цифры.

«Необходимо придумать правильный способ визуализации. Важно понятно и интересно преподнести результаты», – уверена Наталия Крупенина.

По словам Николая, они никогда не работают с личными данными пользователей и не нарушают их неприкосновенность – главная цель состоит в изучении текста, цифр, поисковых запросов. Подобные исследования помогают понять, как меняются интересы и предпочтения пользователей, что волнует их больше всего, каким они видят или хотят видеть мир.

«Это не просто исследование, это показатель социальной активности и интегрированности населения, отражение тем и идей, которые связывают членов общества между собой»

Например, одно из последних исследований посвящено темам, которые вызвали наибольший интерес в 2015 году. В нём собраны самые значимые для пользователей события в стране и мире, люди, а также новости спорта и кино. Это не просто исследование, это показатель социальной активности и интегрированности населения, отражение тем и идей, которые связывают членов общества между собой.  На лекции Николай Огай поделился другим исследованием, в котором изучалась зависимость цены автомобиля от его цвета. По его словам, если стоимость машины превышает 2 млн. рублей, то как минимум половина из всех таких машин будет чёрная. Если же авто стоит меньше 150 тыс. рублей, то чёрными будут лишь примерно 10% машин. Результаты показывают, как в общественном сознании связаны понятия социального статуса, цвета и стоимости. Люди, покупающие дорогие машины, считают, что черный цвет – символ высокого социального статуса, отражение успеха и привилегированности автовладельца.

«Результаты показывают, как в общественном сознании связаны понятия социального статуса, цвета и стоимости»

Интернет-исследования – это не только полезно и интересно, но и весело. Откуда, например, можно ещё узнать, что снится пользователям или что ищут в разных городах России?

Николай Огай и Наталия Крупенина также рассказали о том, что ждёт подобные исследования в будущем. По их мнению, искусственный интеллект и нейронная сеть не способны «понять» все данные и объединить их логично и качественно. Только человек может увидеть скрытые за цифрами явления социальной жизни, проанализировать внутренний и внешние процессы в Интернете и обществе вообще. Главные тренды в развитии подобных исследованиях – новые методы обработки информации, так как специалистам всё ещё сложно связывать между собой разные типы данных, полученные из не связанных между собой сервисов. Только полностью объединив результаты анализа всех сфер, аналитики могут начать комплексное исследование аудитории и изучить её особенности.

Текст: Алина Максименко

Фото: Мария Лапина