Проблема обработки и фильтрации порно-контента хорошо знакома поисковым системам, социальным сетям и компаниям, предлагающим сервисы хранения, обмена фото и видео. Следует отметить, что наличие подобного контента либо его появление в определенное время и в определенном месте может оказать негативное влияние на имидж компании или восприятие пользователей и даже вызвать судебное разбирательство.
В настоящее время существуют лишь два доступных способа фильтрации фото ? ручная обработка и анализ текстовых описаний к изображениям, видео или полных текстов с сайтов.
Просмотр содержания фотографий посетителей сайта в ручном режиме требует значительных затрат времени и сил. Для такой проверки требуются дополнительные технические ресурсы и персонал. Кроме того, качество обработки контента зависит от внимательности и субъективной оценки контент-менеджеров.
Способ, основанный на анализе тегов и текстовых описаний, позволяет сократить объем ручной обработки, однако качество фильтрации полностью зависит от характера описаний и не слишком гибких критериев фильтрации. Как известно, пользователи сознательно или бессознательно далеко не всегда точно описывают содержание фотографий.
Согласно оценкам компании Recogmission, как минимум в 30% случаев текстовые пояснения к файлам не соответствуют изображенным на них объектам. Кроме того, такой подход приводит к серьезным ошибкам, имеющим негативные последствия. К примеру, на некотором сайте размещается информация о решении, позволяющем защитить пользователей от порно контента.
В результате действующие на сторонних сервисах текстовые фильтры внесут данный сайт в черный список только потому, что на веб-страницах содержатся соответствующие ключевые слова.
Решение, разработанное Recogmission, позволяет изменить подход к выявлению изображений нежелательного содержания. Система локализует объекты на изображениях, распознает их и классифицирует в зависимости от степени пристойности. Изображения с высокой степенью порно или сайты, содержащие такие изображения, автоматически размещаются в отдельный индекс и блокируются для просмотра пользователями. При этом отсутствует зависимость от текстовых описаний или качества работы контент-менеджера.
Данная разработка имеет практическую ценность для компаний, пытающихся защитить интернет-пользователей от навязчивой информации "для взрослых" в электронной почте, в результатах поиска или на сайте. Автоматическая обработка позволяет обеспечить безопасный фото поиск и обмен.