ВЛИЯНИЕ ОБУЧАЮЩИХ ВЫБОРОК НА ПРОЦЕСС ОБУЧЕНИЯ АДАПТИВНЫХ НЕЙРО-НЕЧЕТКИХ СЕТЕЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИЙ ДЕТАЛЕЙ
Нгуен Данг Минь
Аспирант, Иркутский государственный технический университет
ВЛИЯНИЕ ОБУЧАЮЩИХ ВЫБОРОК НА ПРОЦЕСС ОБУЧЕНИЯ АДАПТИВНЫХ НЕЙРО-НЕЧЕТКИХ СЕТЕЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИЙ ДЕТАЛЕЙ
Аннотация
В работе рассматривается задача классификации с помощью системы нечеткого вывода, описываются возможности ANFIS для решения задачи, и обсуждается влияние экспериментальных данных на качество получаемых результатов. Приводятся результаты применения ANFIS для создания системы классификации втулок, анализируется зависимость точности работы системы от количеств обучающих выборок.
Ключевые слова: нейро-нечеткая сеть, обучающая выборка, классификация деталей, система нечеткого вывода.
Nguyen Dang Minh
Postgraduate student, Irkutsk State Technical University
THE EFFECTS OF TRAINING DATA IN THE LEARNING PROCESS OF ADAPTIVE NEURAL-FUZZY NETWORKS FOR SOLVING THE PROBLEM OF CLASSIFICATION OF DETAILS
Abstract
This work consider the problem of fuzzy inference system for classification, describes possible solutions to the problem of ANFIS and the impact of experimental data on the quality of results. The application of ANFIS to create a classification system of plugs, depending on system accuracy is analyzed on the amounts of training data.
Key word: neural-fuzzy network, training data, classification of details, fuzzy inference system.
Введение
Детали, изготавливаемые на машиностроительных предприятиях, обрабатываются с использованием различных технологических процессов. Успешное решение задач унификации и нормализации технологических процессов в большой степени зависит от решения вопросов классификации объектов производства. Для решения задачи классификации деталей можно использовать различные информационные технологии, в том числе адаптивные нейро-нечеткие сети, на основе которых генерируются системы нечеткого вывода [2, 3].
Адаптивные нейро-нечеткие сети или гибридные сети по замыслу их разработчиков призваны объединить в себе достоинства нейронных сетей и систем нечеткого вывода. С одной стороны, они позволяют разрабатывать и представлять модели систем в форме правил нечетких продукций, которые обладают наглядностью и простотой содержательной интерпретации. С другой стороны, для построения правил нечетких продукций используются методы нейронных сетей, что является более удобным и менее трудоемким процессом для системных аналитиков [4].
Вся информация, используемая сетью для построения системы нечеткого вывода, содержится в множестве обучающих выборок. Поэтому качество обучения сети напрямую зависит от количества примеров, а также от того, насколько полно эти примеры описывают данную задачу.
В работе рассматривается возможность использования системы нечеткого вывода для решения задачи классификации, формирование обучающих выборок для генерации системы классификации втулок с помощью ANFIS и анализируется точность системы.
Нечеткий логический вывод для задач классификации.
Классификация деталей дает возможность повысить технологичность конструкций деталей; решить вопросы выбора оптимального варианта производственной структуры участка, цеха, завода.
Нечеткая логика - обобщение традиционной Аристотелевой логики на случай, когда истинность рассматривается как лингвистическая переменная, принимающая значения «очень истинно», «более или менее истинно», «не очень ложно» и т.н. Эти лингвистические значения представляются «нечеткими множествами» [4].
Задача классификации состоит в отнесении объекта, заданного вектором информативных признаков , к одному из наперед описанных классов .
Классификация соответствует отображению вида:
Для классификации необходима нечеткая база знаний вида:
с некоторой степенью уверенности.
где - нечеткий терм, которым оценивается переменная xi в правиле с номером - количество правил, описывающих класс dj.
Степени принадлежности объекта классам рассчитывают по формуле: где -функция принадлежности входа xi нечеткому терму
В качестве решения выбирают класс с максимальной степенью принадлежности [4]:
Гибридная сеть как адаптивная система нейро-нечеткого вывода (ANFIS).
Гибридная сеть представляет собой многослойную нейронную сеть специальной структуры без обратных связей, в которой используются обычные (не нечеткие) сигналы, веса и функции активации.
Основная идея, положенная в основу модели гибридных сетей, заключается в том, чтобы использовать существующую выборку данных для определения параметров функций принадлежности, которые лучше всего соответствуют некоторой системе нечеткого вывода. При этом для нахождения параметров функций принадлежности используются известные процедуры обучения нейронных сетей.
С одной стороны, гибридная сеть ANFIS представляет собой нейронную сеть с единственным выходом и несколькими входами, которые представляют собой нечеткие лингвистические переменные. При этом термы входных лингвистических переменных описываются стандартными функциями принадлежности, а термы выходной переменной представляются линейной или константной функцией принадлежности.
С другой стороны, гибридная сеть ANFIS представляет собой систему нечеткого вывода FIS (fuzzy inference system) типа Сугено [4].
Решение задачи классификаций деталей с использованием ANFIS.
В вычислительную среду MATLAB интегрированы десятки пакетов прикладных инженерных и математических программ, одним из них является Fuzzy Logic Toolbox, который поддерживает все фазы разработки нечетких систем, включая синтез, исследование, проектирование, моделирование и внедрение в режиме реального времени [4]. Функции пакета реализуют большинство современных нечетких технологий, включая нечеткий логический вывод, нечеткую кластеризацию и адаптивную нейро-нечеткую настройку (ANFIS).
Рис.1 Окно редактора гибридных систем. |
Редактор нейро-нечеткой сети (ANFIS Editor) позволяет автоматически синтезировать из экспериментальных данных нейро-нечеткие сети и настраивать их. Графический интерфейс гибридных нейронных систем вызывается из командного окна функцией аnfisedit. Исполнение функции приводит к появлению окна редактора гибридных систем, вид которого приведен на рис.1.
С помощью редактора осуществляется создание или загрузка структуры гибридной сети, просмотр структуры, настройка ее параметров, проверка качества функционировании такой системы. Создание структуры, настройка параметров и проверка осуществляются по выборкам (наборам данных) - обучающей (Training data), проверочной (Checking data) и тестирующей (Testing data), которые предварительно должны быть представлены в виде текстовых файлов (с расширением .dat и разделителями табуляциями), первые колонки которых соответствуют входным переменным, а последняя - единственной выходной переменной. Вид обучающей выборки представлен в табл.1.
Табл.1 Фрагмент обучающей выборки |
||
Диаметр |
Высота |
Класс |
18.5 |
19.0 |
5 |
12.0 |
17.3 |
4 |
12.6 |
10.0 |
2 |
26.5 |
9.2 |
3 |
13 |
3 |
1 |
Обучающая выборка будет использоваться в процессе настройки системы нечеткого вывода для классификации.
Данные записаны в файл data_learn.dat.
В режиме Load data (загрузить данные) выбираем Training и file, нажав кнопку Load Data ... ,загрузим файл data_learn.dat.
Затем в режиме Generate FIS (создание нечеткой системы вывода) выбираем Grid partition, нажимаем кнопку Generate FIS ..., появится окно задания функции принадлежности. Для каждого входного параметра выбираем pimf - пи-подобную функцию принадлежности, а в качестве параметров функций задаем [6 6], чтобы создать по шесть термов для каждой входной переменной. Функция принадлежности выходной величины назначается как constant.
Далее зададим режим обучения (Train FIS). Не будем менять задаваемые по умолчанию метод настройки параметров (hybrid - гибридный) и уровень ошибки (0), но количество циклов обучения зададим достаточно большим. Получившийся результат в виде графика ошибки сети в зависимости от числа проведенных циклов обучения представлен на рис.2.
Влияние обучающих выборок на процесс обучения адаптивных нейро-нечетких сетей (НС).
При подготовке решения задачи на НС не всегда удается точно определить, сколько и каких входных данные нужно подавать на ее вход при обучении. В случае недостатка данных сеть не сможет обучиться решению задачи. Проблема усугубляется тем, что в большинстве плохо формализуемых областей человеческой деятельности эксперт часто не может точно сказать, какие именно данные являются важными. Поэтому обычно на вход сети подается избыточный набор данных. Для уменьшения времени обучения и повышения качества работы НС требуется определить, какие данные необходимы для решения конкретной задачи. Кроме того, в ходе решения этой задачи определяются значимости входных сигналов, что во многих предметных областях представляет самостоятельную ценность [1].
При отборе данных для НС необходимо учитывать следующие факты:
- при решении реальных задач с помощью НС довольно часто трудно установить связь выходного показателя с имеющимися данными, поэтому проводят сбор как можно большего числа данных;
- наличие корреляции между данными не позволяет произвести их ранжирование и, следовательно, невозможно использовать простой алгоритм отбраковки по степени важности.
- для того чтобы снизить действие фактора «очень большой размерности», часто просто удаляют некоторое число переменных; при этом возможно удаление таких, которые несут существенную информацию.
Чтобы гарантированно получить только полезные (информативные) данные, необходимо выполнить перебор большого количества наборов данных и архитектур НС. Однако практически это реализовать трудно даже при наличии мощных и эффективных нейроимитаторов [1, 5].
Экспериментальные результаты обучения ANFIS
В данной работе исследуется классификация втулок, которые имеют максимальные диаметры и высоты меньше 30 миллиметров, класс детали определен в соответствии с положениями, приведенными в [2, 3]: детали, характеризующиеся определенном соотношением высоты и максимального диаметра, попадут в определенный класс по технологии их обработки. Поэтому можно предположить наличие 5 классов для определенного соотношения высоты и диаметра, то есть 5 значений выходной величины в системе нечеткого вывода. Случайным образом были сгенерированы пять множеств обучающих примеров с разными размерами. В таблице 2 показан характер данных и ошибка обучения ANFIS при использовании этих данных.
Таблица 2. |
||||||
Количество обучающих примеров |
Количество экземпляров каждого класса в каждом множестве обучающих примеров |
Ошибка обучения ANFIS |
||||
Класс 1 |
Класс 2 |
Класс 3 |
Класс 4 |
Класс 5 |
||
30 |
5 |
1 |
3 |
5 |
16 |
0.00003837 |
50 |
7 |
3 |
6 |
7 |
27 |
0.00000539 |
100 |
11 |
12 |
11 |
15 |
51 |
0.00000227 |
150 |
15 |
17 |
16 |
25 |
77 |
0.00000150 |
200 |
20 |
26 |
23 |
32 |
99 |
0.00000080 |
Из таблицы 2 видно, что при использовании описанной структуры нейро-нечеткой сети при обучении на разных множествах данных получены разные величины ошибок обучения системы нечеткого вывода. Чем больше число примеров, тем лучше полученный результат, значит, тем точнее система нечеткого вывода для классификации втулок.
Был реализован проверочный режим, фактически классифицирующий 34 реальные втулки на основе системы нечеткого вывода, сгенерированной ANFIS. Результаты приведены в табл. 3; они соответствуют фактическому распределению втулок по классам технологии. Из таблицы видно, что при классификации втулки № 16 наблюдается ошибка из-за неточности в процессе обучения ANFIS. Однако эта ошибка незначительная, то есть можно считать, что эта втулка попадает в класс 1.
Табл.3 Результаты классификации втулок с помощью системы нечеткого вывода. |
||||
|
Признаки деталей |
Результаты классификации |
||
№ |
Макс. диаметр |
Высота |
Фактически |
Метод ANFIS |
1 |
28.0 |
15.0 |
4 |
4.0000 |
2 |
28.0 |
9.5 |
3 |
3.0000 |
3 |
28.0 |
8.5 |
3 |
3.0000 |
4 |
28.0 |
11.0 |
3 |
3.0000 |
5 |
28.0 |
10.0 |
3 |
3.0000 |
6 |
19.0 |
4.5 |
1 |
1.0000 |
7 |
19.0 |
4.5 |
1 |
1.0000 |
8 |
24.3 |
20.0 |
5 |
5.0000 |
9 |
24.3 |
20.0 |
5 |
5.0000 |
10 |
23.0 |
17.0 |
4 |
4.0000 |
11 |
28.0 |
18.5 |
5 |
5.0000 |
12 |
18.2 |
13.5 |
4 |
4.0000 |
13 |
18.2 |
22.5 |
5 |
5.0000 |
14 |
19.0 |
4.0 |
1 |
1.0000 |
15 |
18.0 |
4.2 |
1 |
1.0000 |
16 |
19.0 |
5.3 |
1 |
1.1286 |
17 |
19.0 |
4.3 |
1 |
1.0000 |
18 |
16.0 |
4.0 |
1 |
1.0000 |
19 |
23.0 |
6.5 |
3 |
3.0000 |
20 |
23.0 |
6.5 |
3 |
3.0000 |
21 |
23.0 |
7.0 |
3 |
3.0000 |
22 |
23.0 |
9.0 |
3 |
3.0000 |
23 |
23.0 |
8.2 |
3 |
3.0000 |
24 |
12.0 |
6.5 |
2 |
2.0000 |
25 |
23.0 |
10.5 |
3 |
3.0000 |
26 |
28.0 |
7.0 |
3 |
3.0000 |
27 |
23.0 |
10.5 |
3 |
3.0000 |
28 |
19.0 |
5.0 |
1 |
1.0000 |
29 |
17.0 |
9.5 |
2 |
2.0000 |
30 |
26.0 |
23.5 |
5 |
5.0000 |
31 |
16.0 |
18.5 |
5 |
5.0000 |
32 |
24.0 |
16.5 |
4 |
4.0000 |
33 |
28.0 |
7.3 |
3 |
3.0000 |
34 |
28.0 |
15.0 |
4 |
4.0000 |
Заключение
На основе проделанных экспериментов можно сделать вывод, что использование ANFIS для решения задачи классификации деталей является весьма перспективным. Недостатком является то, что качество результатов зависит от качества экспериментальных данных или обучающих выборок. Поэтому отбор обучающих выборок является важным процессом при использовании ANFIS.
Список литературы
Комарцова Л.Г., Максимов А.В. К 63 Нейрокомпьютеры. Учеб. пособие для вузов – 2ое изд, перерав. и доп – М.: изд-во МГГУ им. Н.Э.Баумана 2004. – 400.с
Митрофанов С.П. Научная организация серийного производства. - Изд-во «Машиностроение», 1970. 768 стр.
Митрофанов С.П. Групповая технология изготовления заготовок серийного производства. - Л.: Машиностроение, Лелингр. отд-ние, 1985.-240с., ил.
Леоненков А. В. Нечеткое моделирование в среде MATLAB и fuzzyTECH. – СПб.: БХВ – Перербург – 2005. – 736с.
Нейрокомпьютеры и интеллектуальные работы/ Н.М. Амосов, Т.М. Байдык, А.Д. Гольцев и др.; Под ред. Н.М. Амосова; АН УССР Ин – т кибернетики. Киев: Наукова дума 1991.