Компьютер научился распознавать «пьяные» сообщения в соцсети
Американские ученые разработали алгоритм, способный вычислить записи, которые были отправлены пользователями «Твиттера» в состоянии опьянения. Авторами разработки стали сотрудники Рочестерского университета во главе с Набилом Хоссейном.
Ученые за основу взяли 11 тыс. сообщений в соцсети с привязкой к GPS-координатам, которые были опубликованы в Нью-Йорке и округе Монро в течение года. Далее они их отфильтровали по словам, которые прямо связаны с алкогольным опьянением: «пиво», «пьяный», «спиртное» и пр.
Потом исследователи обратились к краудсорсингому сервису Amazon Mechanical Turk, участники которого помогли ученым отсортировать сообщения. Они делили их на те, которые были написаны пользователями в состоянии опьянения, и на те, которые просто касались темы выпивки. На основе этого эксперимента и была создана программа, определяющая, находился ли пользователь в состоянии опьянения.
Также разработанный алгоритм способен вычислить людей, которые пишут «твитты» дома и в других местах. Как показало исследование, большинство жителей Нью-Йорка предпочитают пить в 100 метрах от дома, а вот население округа Монро пьянствует не менее чем в километре от места своего обитания.