Во «ВКонтакте» запустили фильтр угроз в комментариях
Команда социальной сети «ВКонтакте» объявила о запуске специального фильтра для борьбы с враждебными высказываниями, который стал доступен администраторам сообществ.
Фильтр на основе нейросети можно включить и отключить в настройках сообщества в любое время, при этом по умолчанию он отключён. Функция уже появилась у владельцев 50% сообществ, а скоро станет доступна всем.
На данный момент алгоритмы «ВКонтакте» умеют определять прямые угрозы — пожелания смерти, обещания причинить вред здоровью и угрозы расправы.
Разработчики собираются продолжить тестирование фильтра: в будущем он может научиться распознавать и другие признаки нетерпимости — например, травлю по национальной или религиозной принадлежности. Руководителям сообществ доступны отфильтрованные публикации с возможностью их восстановить, однако тестовый запуск показал, что отсеянные комментарии возвращают лишь в 1% случаев.
Тестирование фильтра началось в ноябре 2020 года. За этот период функцией уже воспользовались руководители свыше 10% всех сообществ ВКонтакте — это 13 млн публичных страниц, групп и мероприятий. Как отмечают разработчики, сейчас нейросеть правильно определяет угрозы в 80% случаев.