В ближайшее время приложения Twitter для iOS и Android начнут предупреждать пользователей о потенциально оскорбительном характере ответа на чужое сообщение перед его отправкой. Cервис предложит пересмотреть содержание сообщения, но пользователь может проигнорировать это предупреждение. Пока что новая функция будет действовать для публикаций на английском языке.
В компании напомнили, что тестирование этой функции началось в прошлом году. Поначалу алгоритмы допускали ошибки при оценке сообщений, не улавливая смысловой разницы между оскорблениями, сарказмом или дружескими подколками. В процессе тестирования работу алгоритмов удалось улучшить, а сама система показала свою эффективность: 34% пользователей, получивших уведомления, изменяли текст ответов или вовсе не отправляли их. Кроме того, после получения всего одного предупреждающего уведомления пользователи в среднем сокращали количество оскорбительных реплик на 11%.
After testing and improving prompts that ask you to review a potentially harmful or offensive reply, we learned that this feature can help encourage more meaningful convos.
— Twitter Support (@TwitterSupport) May 5, 2021
We're now rolling out these prompts on iOS and soon Android. https://t.co/GdnEGrIvfM pic.twitter.com/5hrK0mrd8f
В компании добавили, что теперь система среди прочего учитывает не только сам текст реплик, но и отношения между пользователями. Так, если два пользователя Twitter подписаны друг на друга и часто обмениваются репликами, то алгоритм предполагает, что они выработали привычный стиль общения.
О сроках запуска этой функции на других языках не сообщается. Отметим, что cервис Instagram, принадлежащий соцсети Facebook, еще в 2019 году запустил алгоритм, предупреждающий пользователей о том, что подпись к фотографии или видеоролику, который они собираются опубликовать, может нарушать правила Instagram.