РЕШЕНИЕ ЗАДАЧ ИДЕНТИФИКАЦИИ НЕОДНОРОДНОСТЕЙ НА ИЗОБРАЖЕНИЯХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННОЙ СЕТИ
Старожилова О.В.
Кандидат технических наук, доцент, Поволжский государственный университет телекоммуникаций и информатики
РЕШЕНИЕ ЗАДАЧ ИДЕНТИФИКАЦИИ НЕОДНОРОДНОСТЕЙ НА ИЗОБРАЖЕНИЯХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННОЙ СЕТИ
Аннотация
В статье рассмативаются задачи идентификации неоднородностей на изображениях, математическая модель построена на основе нейронного подхода, в качестве алгоритма обучения использовался алгоритм обратного распространения ошибки.
Ключевые слова: нейронная сеть, модель, идентификация неоднородностей, свертка.
Starozhilova O.V.
Candidate of technical Sciences, associate Professor, Polistirolbetonny University of telecommunications and Informatics
THE SOLUTION OF THE PROBLEMS OF IDENTIFICATION OF INHOMOGENEITIES IN THE IMAGES USING NEURAL NETWORK
Abstract
In the article it discusses the problem of identifying discontinuities in images, a mathematical model based on neural approach, as the learning algorithm was used back-propagation algorithm errors.
Keywords: neural network, model, identification of discontinuities convolution.
На современном этапе развитие технической и медицинской диагностики неразрывно связано с визуализацией внутренних структур объекта. Существует много различных видов визуализации, например компьютерная томография, ангиография, урография, рентгенография, сцинтиграфия.
Нейронные сети представляют собой мощный математический инструмент, показавший свою состоятельность при решении широкого класса задач, таких как распознавание образов, аппроксимация, классификация, прогнозирование.
Рассматривается математическая модель изображений, в которых значительную часть поля яркости занимает пространственно-протяженный объект. К ним можно отнести ткань почек, особенно при рассмотрении фаций и снимков УЗИ [1]. Тогда область изображения можно разбить на две, соответствующие объекту Do и фону .
Области D можно поставить в соответствие эталонное изображение, каждый элемент которого определяется в зависимости от его принадлежности области D0 или Db:
Используя данное представление, можно получить модель нормализуемого изображения в виде следующего соотношения:
где -центрированные однородные случайные поля с заданными автоковариационными функциями, ν(n1, n2) - шумовая составляющая наблюдаемого изображения, A и A0 — параметры яркостного преобразования изображения относительно эталона. Величина A0 является контрастом между объектом и фоном (разность между их средними значениями), а величина A — средней яркостью фона.
Использование классических нейронных сетей для распознавания изображений затруднено, как правило, большой размерностью вектора входных значений нейронной сети, большим количеством нейронов в промежуточных слоях и, как следствие, большими затратами вычислительных ресурсов на обучение и вычисление сети.
Входное изображение 25*25 пикселей имеет. 625 нейронов во входном слое. Кроме того задача распознавании ренгенографических образов часто требует классификации изображений, превышающих размер 250*250 пикселей, учет топологии входного изображения. Будем говорить, что задача идентификации решена успешно, если значение невязки выхода построенной модели с наблюдаемым выходом реального объекта не превосходит заранее заданной величины невязки .
Для идентификации векторной функции рассматриваем двухслойную нейронную сеть прямого распространения с сигмоидальным скрытым слоем нейронов и линейным выходным.
Сверточным нейронным сетям в меньшей степени присущи описанные выше недостатки. Часть нейронов некоторого рассматриваемого слоя нейронной сети может использовать одни и те же весовые коэффициенты. Нейроны, использующие одни и те же веса, объединяются в карты признаков, а каждый нейрон карты признаков связан с частью нейронов предыдущего слоя. При вычислении сети получается, что каждый нейрон выполняет свертку (операцию конволюции) некоторой области предыдущего слоя (определяемой множеством нейронов, связанных с данным нейроном).
Помимо, сверточных слоев в сверточной нейронной сети могут быть слои субдискретизации (выполняющие функции уменьшения размерности пространства карт признаков) и полносвязные слои. Все три вида слоев могут чередоваться в произвольном порядке, что позволяет составлять карты признаков из карт признаков, а это на практике означает способность распознавания сложных иерархий признаков [1].
Структура нейронной сети подбирается экспериментально. Расширенное на одну строку и один столбец входное изображение, содержащееся в первом слоев, подается на вход сверточному слою, состоящему из 20 карт признаков размером 4*7 каждая. Каждый нейрон выполняет операцию свертки части входного изображения. Так как каждый нейрон из некоторой произвольно выбранной карты признаков выполняет свертку с ядром 5*5 части изображения размером 5*5 пикселей, то все изображение разбивается на перекрывающиеся области 5*5 пикселей. Перекрытие составляет 3 пикселя, отсюда по вертикали имеем 7 областей 5*5 пикселей, по горизонтали 4 области 5*5 пикселей, отсюда, размерность карты признаков — 4*7 нейронов.
Выходные значения нейронов сверточного слоя подаются на вход полносвязному слою (каждой связи между нейронами соответствует уникальный весовой коэффициент). Выходной слой также является полносвязным. Обучение нейронной сети требует качественной и большой выборки. Если не удалось определить, что за символ включает изображение, это изображению выставлялся в соответствие произвольный класс. В итоге, подготовлено пары изображение/метка класса.
К изображениям были применены искажающие преобразования: операции масштабирования; обрезка границ изображения и приведение изображения с обрезанными границами к заданному размеру с билинейной интерполяцией; эрозия и дилатация случайных прямоугольных регионов всего изображения.
В качестве алгоритма обучения использовался алгоритм обратного распространения ошибки. Для ускорения обучения использовался стохастический вариант метода Левенберга-Марквардта.
Нейронная сеть достигла способности распознавать все изображения, ошибка составляет 2%. Тестирование нейронной сети проводилось на изображениях тестовой выборки: ошибка распознавания составила 6%.
После того, как было построено обучающее множество, выбраны метод оценки функционирования нейронной сети и метод обучения, необходимо определиться с количеством нейронов в скрытом слое. Было проведено исследование, выявляющее зависимость между точностью модели, полученной в результате идентификации, и количества нейронов на скрытом слое. Для этого нейронные сети с различным количеством нейронов были обучены на одном и том же множестве. Обученные нейронные сети были линеаризованы, а коэффициенты полученной линейной модели сравнивались с компонентами эталонных матриц.
Разработана методика, обеспечивающая выбор размера ячейки при сканировании «зон интереса» на цифровых рентгенограммах; предложен алгоритм обработки изображений с оптимальными параметрами, с использованием сверточных нейронных сетей [1]. Алгоритмы реализуется в построчно-столбцовой форме. С ростом количества сигмоидальных нейронов скрытого слоя увеличивается точность результатов идентификации. Простая «однородная» структура делает их привлекательными для практического использования и аппаратной реализации.
Литература
- Хлесткин А.Ю., Старожилова О.В. Модели слияния рентгеновских и сцинтиграфических изображений в распознавании артефактов //Инфокоммуникационные технологии. – 2010. – № 2. – С. 40–42.
References
- Hletkin A. Y., Starozhilova O. V. Model merge x and scintigraphic images in the recognition of artifacts //Iinfocommunication technologies. - 2010. N. 2. - S. 40-42.