«Наш подход основан на последовательном анализе входных видеоданных с различной детализацией (частотой кадров). Этот метод спроектирован так, чтобы быть очень быстрым и применяться к любому способу извлечения характерных признаков лиц на основе глубоких нейросетей без дополнительного обучения всей модели», — сказал заместитель директора центра искусственного интеллекта НИТУ МИСИС Андрей Савченко.
Алгоритм работает так: в первую очередь анализируются два кадра — первый и последний. Если ИИ может сделать правильный вывод, то его работа останавливается. В противном случае добавляется еще несколько кадров в середине, а затем снова проверяется правильность выводов. Например, для простых видео, где выражения лиц хорошо распознаются, решение принимается практически мгновенно, а для более сложных требуется уже обработать намного больше видеокадров.
«Для оптимизации метода важно не просто собирать информацию со всех кадров видео, но и уметь правильно выстраивать последовательность принятия решений, то есть сразу отсеивать ненужную информацию, чтобы оставались только необходимые для классификации данные», — объяснил Андрей Савченко.
Комментарии