СРАВНЕНИЕ ПРОИЗВОДИТЕЛЬНОСТИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ И АЛГОРИТМА ВИОЛЫ – ДЖОНСА ПРИ РЕШЕНИИ ЗАДАЧИ РАСПОЗНАВАНИЯ ЛИЦ
Санников К. А.
Студент,
НИ Томский политехнический университет
СРАВНЕНИЕ ПРОИЗВОДИТЕЛЬНОСТИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ И АЛГОРИТМА ВИОЛЫ – ДЖОНСА ПРИ РЕШЕНИИ ЗАДАЧИ РАСПОЗНАВАНИЯ ЛИЦ
Аннотация
В статье рассмотрено сравнение производительности распознавания лиц при помощи сверточной нейронной сети и алгоритма Виолы – Джонса, определены плюсы и минусы каждого из классификаторов.
Ключевые слова: сверточная нейронная сеть, алгоритм Виолы-Джонса, распознавание лиц.
Sannikov K. A.
Student,
Tomsk Polytechnic University
PERFORMANCE COMPARISON OF CONVOLUTIONAL NEURAL NETWORK AND VIOLA-JONES ALGORITHMS FOR FACE RECOGNITION PROBLEM SOLVING
Abstract
This article contains performance comparison of convolutional neural network and Viola-Jones algorithms for face recognition problem solving. Some advantages and disadvantages are described.
Keywords: convolutional neural network, Viola-Jones algorithm, face recognition.
В последнее время системы идентификации человека набирают все большую популярность (например, для доступа к персональному компьютеру, смартфону, в сфере безопасности различных учреждений). Одной из основных является система идентификации по изображению лица. К преимуществам данной системы можно отнести простоту и мобильность оборудования, а также массовость идентификации.
Для решения задачи распознавания лиц существует множество методов и алгоритмов. В исследования были использованы сверточная нейронная сеть и алгоритм Виолы – Джонса.
Искусственная нейронная сеть - это сеть, состоящей из множества, тесно связанных между собой, искусственных нейронов, которые в совокупности выполняют вычислительные функции. Сверточная нейронная сеть (СНС) является особым классом нейронных сетей, который наилучшим образом подходит для интеллектуальной обработки визуальных данных. Система, предложенная Яном Лекуном, направлена на наиболее эффективное распознавание изображений. В ее состав входит технология глубокого обучения (англ. deep learning). СНС использует некоторые особенности зрительной коры головного мозга, в которой были открыты так называемые простые клетки, реагирующие на прямые линии под разными углами, и сложные клетки, реакция которых связана с активацией определённого набора простых клеток.
Отличительными особенностями сверточных нейронных сетей являются локальные рецепторные поля (обеспечивают локальную двумерную связность нейронов), общие веса (обеспечивают детектирование некоторых черт в любом месте изображения) и иерархическая организация с пространственными сэмплингом (spatial subsampling). Благодаря этим нововведениям СНС обеспечивает частичную устойчивость к изменениям масштаба, смещениям, поворотам, смене ракурса и прочим искажениям. Вычисления происходят от слоя к слою. Исходные данные подаются на первый слой и в результате работы нейронной сети генерируется последний слой, анализируя который можно определить наиболее вероятный образ, соответствующий распознаваемому.
Алгоритм Виолы – Джонса позволяет обнаруживать объекты на изображениях в реальном времени. Был предложен в 2001 году Полом Виолой и Майклом Джонсом. Хотя алгоритм может распознавать различные классы изображений, все же основной задачей при его создании было обнаружение лиц. Он находит лица с очень высокой точностью и низким количеством ложных срабатываний.
В основе алгоритма Виолы-Джонса лежат вычисление интегрального представления изображений для быстрого нахождения суммарной яркости необходимых объектов и использование признаков Хаара, с помощью которых происходит поиск нужного объекта (в нашем случае, лица и его черт). Также используются каскады признаков для быстрого отбрасывания окон, где не найдено лицо. Все признаки подаются на вход классификатора, который возвращает булево значение, принадлежат ли эти признаки к искомому образу или нет.
Алгоритмы реализованы на языке C++, для тестирования используется база лиц CBCL Face Data. В результате анализа полученных результатов можно сделать вывод, что как обучение классификаторов алгоритма Виолы-Джонса, так и СНС происходит достаточно долго, при этом обучение СНС, в зависимости от выбранной архитектуры внутренних слоев, обучается дольше классификаторов Виолы-Джонса в несколько раз. Однако, несмотря на то, что алгоритм Виолы-Джонса обладает крайне низкой вероятностью ложного обнаружения лиц, он очень плохо работает в том случае, если исходное изображение повернуто более чем на 35 градусов. Сверточная нейронная сеть наоборот лишена это недостатка, за счет использования сверточных и субдискретизирующих слоев. Поэтому применение каждого из этих алгоритмов в отдельности невозможно в современных производственных системах с учетом их растущих потребностей. В связи с этим не исключается возможность создания системы распознавания, состоящей из совокупности алгоритма Виолы-Джонса и сверточной нейронной сети.
Литература
- Макаренко А.А. Сверточные нейронные сети в задаче классификации изображений // Информационные системы. Вып. 4.: Тр. постоянно действующего научно- техн. семинара. — Томск: Изд-во Том. гос. ун-та систем управления и радиоэлектроники. — 2006. — С. 3‑ 9.
- LeCun Y. Generalization and network design strategies // Proc. Of the Intern. Conf. Connectionism in Perspective. — University of Zurich, 10–13 October 1988
- Саймон Хайкин. Нейронные сети: полный курс // Москва: Изд-во Вильямс – 2006
References
- Makarenko A.A. Svertochnye nejronnye seti v zadache klassifikacii izobrazhenij // Informacionnye sistemy. Vyp. 4.: Tr. postojanno dejstvujushhego nauchno- tehn. seminara. — Tomsk: Izd-vo Tom. gos. un-ta sistem upravlenija i radiojelektroniki. — 2006. — S. 3‑ 9.
- LeCun Y. Generalization and network design strategies // Proc. Of the Intern. Conf. Connectionism in Perspective. — University of Zurich, 10–13 October 1988
- Sajmon Hajkin. Nejronnye seti: polnyj kurs // Moskva: Izd-vo Vil'jams – 2006