Окулус — нейросеть займется поиском запрещенного контента

На сегодняшний день в интернете очень распространён запрещённый контент, с которым достаточно сложно бороться.

К нему относятся материалы с признаками экстремизма и терроризма, призывы к массовым незаконным мероприятиям, выражение явного неуважение к обществу, государству и официальным символам РФ, информация о способах совершения суицида и методах изготовления наркотиков, пропаганда нетрадиционных сексуальных отношений и демонстрация употребления табачной продукции.

Для борьбы с подобными вбросами было принято решение создать систему «Окулус».

По результатам тендерного отбора ее разработкой для «Главного радиочастотного центра» (ФГУП ГРЧЦ, структура Роскомнадзора) займется ООО «Эксикьюшн Эр Ди Си».

По данным «СПАРК-Интерфакс», ООО «Эксикьюшн Эр Ди Си» (Execution RDS) учреждено в 2014 году с уставным капиталом 10 тыс. руб. По итогам 2021 года компания получила 229 млн. руб. выручки при 23 млн. руб. чистой прибыли. Возглавляет ООО Анастасия Юрикова, 95% принадлежит Артему Пономореву, а 5% — Сергею Браилко. Судя по данным «СПАРК-Интерфакс», компания никогда не была исполнителем по госконтрактам. Execution RDS реализовывала проекты по внедрению в российских компаниях решений на базе софта немецкой SAP, следует из информации на ее сайте.

Сроки для реализации очень сжатые, и, несмотря на огромный бюджет в размере 57,7 млн. руб., есть вероятность, что к 12 декабря проект завершён не будет, да и финансирования не хватит. Более того, среди профессионального мнения есть и такое, что подобную систему создать просто невозможно.

Дело в том, что по плану система должна находить запрещенный контент не только в текстовом виде, но и в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений», анализируя изображения, видео, чаты, материалы различных каналов и тд.

По условиям технического задания кроме самой системы с мощностью в 200 тысяч изображений в сутки, подрядчик обязан предоставить ГРЧЦ дата-сеты, которые позволят определять запрещенную информацию. Исполнитель также поставит ГРЧЦ размеченные наборы данных для обучения модели распознавания лиц «в объеме не менее 100» в соответствии с заявленными функциями «Окулус».

Директор по цифровым технологиям ГРЧЦ Константин Буланов пояснил, что для стабильной работы системы понадобится не менее 48 серверов, оснащенных графическими ускорителями, а поиск запрещенного контента будет осуществляться благодаря нейронным сетям, работающим на основе глубокого машинного обучения.

В то же время гендиректор Smart Engines Владимир Арлазаров выразил сомнения относительно заявленных сроков, так как с его слов «современные модели искусственного интеллекта, классифицирующие поведение человека в видеоряде, обычно обучаются на данных объемом около 1 млн. роликов», а амбициозность этого проекта заявляет анализ 2 кадров в секунду.

Secute - информационная безопасность