TRANSFER ALGORITHM FOR COMBINING TRAINED AND RETRAINED NEURAL NETWORK ARCHITECTURE FOR THE TASK OF NON-DESTRUCTIVE OF METALLURGICAL PRODUCTION

Research article
DOI:
https://doi.org/10.60797/IRJ.2025.156.60
Issue: № 6 (156), 2025
Suggested:
23.02.2025
Accepted:
22.05.2025
Published:
17.06.2025
96
2
XML
PDF

Abstract

The article examines the problem of improving the accuracy of non-destructive testing in metallurgical production using a transfer algorithm combining trained and retrained neural network architectures. Modern industrial non-destructive testing is faced with the necessity of fast and accurate detection of defects in materials, which is critical for ensuring the safety and quality of products. Traditional flaw detection methods are time, resource and skilled personnel intensive, while the proposed transfer algorithm is based on the combination of a retrained neural network followed by a retrained model specialised for the flaw detection task. This approach reduces the time and resource costs of developing new models, while improving the accuracy and reliability of the system. The paper presents the results of experimental verification of the proposed algorithm on real data. It is shown that the combined approach provides a significant improvement in accuracy compared to separate models and traditional flaw detection methods. The results of the study confirm the promising use of the proposed algorithm in industrial conditions to improve the quality of inspection and reduce the risks associated with defects in materials.

1. Введение

Современная промышленность, особенно металлургическая отрасль, сталкивается с необходимостью обеспечения высокого уровня качества выпускаемой продукции. Дефекты материалов могут привести к серьезным последствиям, таким как аварии, утрата имущества и даже человеческие жертвы, поэтому контроль качества и выявление дефектов являются критически важными этапами производственного процесса. Традиционно для этих целей используются различные методы дефектоскопии, такие как рентгенография, ультразвуковые и магнитопорошковые методы. Однако эти методы обладают рядом ограничений, включая высокую стоимость оборудования, необходимость высококвалифицированных специалистов и низкую скорость обработки больших объемов продукции. Современные технологии машинного обучения открывают новые перспективы для автоматизации процессов дефектоскопии. Нейронные сети демонстрируют высокую эффективность в решении задач распознавания образов и классификации, но создание новой модели с нуля требует значительных временных и вычислительных затрат. Трансферное обучение

,
предлагает возможность использовать уже обученные модели для решения новых задач путем дообучения на специализированных данных. Это позволяет сократить время и ресурсы, необходимые для разработки новых решений, однако одной из проблем, возникающих при использовании трансферного обучения, является то, что одна модель может не всегда обеспечивать необходимую точность для всех аспектов задачи
,
. Для преодоления этого недостатка предлагается комбинация нескольких моделей, каждая из которых специализируется на определенных характеристиках данных. Такой подход может значительно повысить общую точность и надежность системы.

Целью настоящего исследования является разработка эффективного трансферного алгоритма комбинирования обученной и дообученной архитектур нейронных сетей для задачи дефектоскопии в металлургическом производстве. Данный алгоритм должен обеспечить высокую точность обнаружения дефектов при минимальных затратах времени и ресурсов на обучение и адаптацию моделей. Для достижения этой цели были определены следующие задачи: проведение обзора современных методов дефектоскопии и технологий машинного обучения, определение оптимальной архитектуры нейронной сети для предобучения, разработка алгоритма дообучения и методика комбинирования предсказаний от различных моделей.

Актуальность темы. Дефектоскопия в металлургической промышленности играет ключевую роль в обеспечении безопасности и надежности производимой продукции. Традиционные методы контроля качества, такие как рентгенография, ультразвуковая диагностика и магнитопорошковый метод, имеют свои ограничения, включая высокую стоимость оборудования, необходимость квалифицированного персонала и ограниченную скорость обработки больших объемов продукции. Современные технологии машинного обучения предлагают новые возможности для автоматизации процессов дефектоскопии, однако существующие подходы часто требуют значительных ресурсов для создания новых моделей с нуля для каждой конкретной задачи. В этой связи актуальным становится использование трансферного обучения, которое позволяет эффективно применять уже обученные модели для решения новых задач путем дообучения на специализированных данных. Комбинирование нескольких моделей, каждая из которых специализируется на разных аспектах задачи, может значительно повысить точность и надежность выявления дефектов. Разработка и внедрение таких комбинированных подходов могут существенно улучшить качество контроля в металлургическом производстве, снизить затраты и ускорить процессы диагностики.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Провести обзор современных методов дефектоскопии и технологий машинного обучения, применяемых в этой области.

2. Определить наиболее подходящую архитектуру нейронной сети для базового предобучения.

3. Разработать эффективный алгоритм дообучения предобученной модели на данных, специфичных для задачи дефектоскопии.

4. Разработать методику комбинирования предсказаний от обученной и дообученной моделей для улучшения общей точности обнаружения дефектов.

5. Провести экспериментальную проверку предложенного алгоритма на реальных данных и сравнить его эффективность с традиционными методами и другими современными подходами.

6. Проанализировать ошибки и выявить возможные пути улучшения предложенного алгоритма.

2. Методы и принципы исследования

Математическое представление классификации дефектов изделий металлопроката с использованием обученной сети RESNET50

,
с введением нечеткого слоя.

Алгоритм включает глубокое обучение и нечеткую логику для классификации дефектов, разделения фона и маркировки изделий. RESNET50 используется для извлечения признаков, а нечеткий слой — для обработки неопределенности в изображениях (переходные зоны между дефектом и фоном).

Извлечение признаков формируется через среднее и стандартное отклонение набора данных:

img

где img — среднее и стандартное отклонение набора данных. img должно быть размером 224*224*3.

Тогда сверточный слой примет следующий вид:

img

Остаточные блоки:

img

Тензор признаков становится img

Формирование нечеткого слоя осуществляется для обработки неопределённости между фоном и дефектом и состоит из трех шагов:

1. Глобальный средний пуллинг:

img

2. Нечеткие функции принадлежности для класса  включая фон задается img, которая будет определять степень соответствия признаков треугольному распределению с параметрами img. Это упрощает вычисления и делает модель более интерпретируемой.

img

где a — левая граница (начало треугольника), b — вершина треугольника (максимум функция), c — правая граница (конец треугольника).

3. Нормализация нечетких оценок:

img

где K — число классов включая фон.

Этот подход позволяет более гибко настраивать зоны неопределенности между дефектами и фоном, что особенно полезно для задач классификации металлопроката с нечеткими границами дефектов, используя градиентно-взвешенную активационную карту (Grad-CAM)

,
для выделения областей дефекта. Изображение проходит через модель f и получается выход для класса img. Для обратного прохода вычисляются градиенты img для каждого канала k последнего сверточного слоя. Для каждого k вычисляются веса

img

Далее вычисляется взвешенная сумма активаций:

img

Нормализация тепловой карты img приводится к диапазону [0,1].

Выделение областей дефекта на основе Grad-CAM:

 img

где ak — веса важности каналов.

Следовательно, бинарная маска рассчитывается:

img

где img — порог задаваемы на основе нечеткой уверенности (при исследование установлен 0,35).

Функция потерь для обучения сформируется следующим образом:

img

где img – кросс энтропия, img — регуляризация для классификации, img — гиперпараметр.

Адаптация нечеткого слоя происходит через EMA (Exponential Moving Average)

,
— это метод сглаживания параметров модели, который уменьшает колебания их значений во время обучения, присваивая больший вес последним обновлениям. В контексте нечеткого слоя EMA можно использовать для стабилизации параметров функций принадлежности), что особенно полезно в условиях шума на изображениях. На каждом шаге обучения параметры нечеткого слоя img обновляется следующим образом:

img

где img — текущее значение параметра на шаге img,  — EMA-imgверсия параметра после шага img,  img — коэффициент сглаживания.

Границы функций принадлежности обновляются следующим образом:

img

Нечеткий слой обрабатывает размытые границы между дефектом и фоном. Оценка pc показывает степень уверенности модели, Grad-CAM визуализирует локализацию дефекта. Такой подход предобученной модели позволяет улучшить классификацию дефектов металлопроката, особенно когда граница между дефектом и фоном размыта.

3. Математическое описание слоев дообученной модели YOLOv10 с интеграцией нечеткой логики дефектов и кусочно-постоянной модели фона

Предлагаемая модификация переформулирует стандартную архитектуру через математическую модель нечеткой логики для моделирования поверхностного дефекта или маркировки металлургических изделий и кусочно-постоянной функции для фона.

Входной слой. Входное изображение представляется следующим образом: первая часть не

img

где: img — функция принадлежности дефекта к нечеткому множеству, img — интенсивность дефектов в точке img, img — константа img- той области фона img — индикаторная функция (1 внутри img, 0 иначе).

Сверточный слой представляет две свертки (нечеткая логика и кусочно-постоянный пулинг).

Для ядра img и входа I:

img

где img — функция активации Swish, усиливающая нечеткие границы.

Кусочно-постоянный пулинг.

img

где K — локальная область соединяет признаки разного масштаба, учитывая нечеткость дефектов.

Кусочно=линейная интерполяция фона определяется как:

img

Проектирование нечетких ограничивающих рамок для предсказания. Координаты центра img моделируются как треугольные нечеткие числа:

img

где img — центр, w — ширина области неопределенности.

Классификация дефекта.

Вероятность класса pc заменяется на степень принадлежности:

img

где img — признаки класса img.

Функция потерь с регуляризацией фона.

img

где: img  — стандартная потеря YOLO при классификации, img — дисперсия интенсивности фона в области img, img — коэффициент регуляризации, задающий гладкость фона.

Методика «Двухэтапное обучение» формируется из трансферного обучения и тонкой настройки:

- загрузка весов предобученной модели EfficientNet-B3;

- инициализация нечеткого сверточного слоя, где img инициализируется равномерно;

- обучение только верхних слоев на гибридных данных;

- происходит оптимизация img, а снижение веса=0,01

- функция потерь рассчитывается как: img, где img — бинарная маска дефекта.

- разморозка всех слоев;

- оптимизатор img, импульс 0,9;

- регуляризация: выпадение (p = 0,3) перед классификатором, штраф за вариативность фона: img.

Гибридное представление данных снижает шумы фона, нечеткие признаки улучшают детектирование частичных дефектов, а регуляризация фона предотвращает переобучение модели.

4. Методика трансферного обучения для детектирования и классификации дефектов металлопроката

1. Подготовка, сбор и аннотация данных:

Для YOLOv10

,
,
размечаются ограничивающие рамки вокруг дефектов в формате COCO и создаются метки классов для ResNet50 (0 — фон,1 — трещина, 2 — царапина).

2. Предобработка заключается в нормализации и аугментации, где изображения приводятся к стандартным размерам: YOLOv10 - 640×640, ResNet50 — 224×224, применяются повороты, отражения, изменение яркости/контраста, добавление шума.

3. Разделение данных: обучающая выбор — 70%, валидационная — 15% и тестовая — 15%.

4. Обучение ResNet50 с нечетким слоем: происходит модификация архитектуры и заменяется последний полносвязный слой ResNet50 на нечеткий классификатор с заморозкой всех слоев ResNet50, кроме последнего блока и нечеткого слоя.

5. EMA  обновление: после каждого шага оптимизации вызывается функция обновления сглаживания параметров модели.

6. Интеграция YOLOv10 и ResNet50:

Шаг 1: YOLOv10 детектирует дефекты и возвращает ограничивающие рамки.

Шаг 2: для каждой рамки извлекается область изображения и приводится к размеру 224×224, затем пропускается через ResNet50 для классификации.

Шаг 3: объединяются результаты:

7. Оптимизация используется TensorRT

,
для ускорения YOLOv10 и ResNet50, реализуя асинхронную обработку для работы в реальном времени.

8. Валидация и тестирование вычисляют параметры достоверности для YOLOv10 — mAP@0.5, Recall, Precision и ResNet50 – Accuracy, F1-score, а общие параметры – IoU детекций и точность классификации.

9. Интерпретация и оценка визуализируют тепловые карты Grad-CAM для анализа важных областей, затем проверяется устойчивость к шуму и размытым границам дефектов.

10. Развертывание и экспорт моделей для YOLOv10 в ONNX

или TensorRT, а для ResNet50 сохраняются веса с EMA-параметрами.

11. Интеграция в производство реализуются REST API

для обработки изображений и настраивается мониторинг параметров достоверности.

Трансферный алгоритм комбинирования обученной и дообученной архитектуры нейронных сетей (рисунок 1) показывает взаимодействие архитектур разработанной методики и совмещение математического аппарата.

Трансферный алгоритм комбинирования обученной и дообученной архитектуры детектирования дефектов металлургических изделий

Рисунок 1 - Трансферный алгоритм комбинирования обученной и дообученной архитектуры детектирования дефектов металлургических изделий

Выбирается базовая архитектура, в которой все сверточные слои остаются замороженными для сохранения способности извлекать общие признаки дефектов, а исходные полносвязные слои удаляются. Добавленные новые слои адаптированы для детекции и веса инициализируются случайным образом. После прохода каждой эпохи вычисляется точность на валидационном наборе данных. Если точность больше 91% — обучение завершено, меньше — активируется цикл дообучения, размораживаются сверточные слои базовой модели и происходит перенастройка гиперпараметров.

5. Тестирование и сравнение результатов

В тестировании участвовал набор данных изделий металлургического производства, состоящий из 37000 изображений. На графиках представлены фрагменты процесса обучения нейронной сетью YOLOv10 и разработанным трансферным алгоритмом.

Процесс обучения с использованием модели YOLOv10

Рисунок 2 - Процесс обучения с использованием модели YOLOv10

Показатели качества, полученные моделью YOLOv10

Рисунок 3 - Показатели качества, полученные моделью YOLOv10

Тестирование детекции после обучения: а) ограничивающие рамки накладываются друг на друга, б) множества мнимых срабатываний интересующей области

Рисунок 4 - Тестирование детекции после обучения: а) ограничивающие рамки накладываются друг на друга, б) множества мнимых срабатываний интересующей области

Процесс обучения разработанного трансферного алгоритма

Рисунок 5 - Процесс обучения разработанного трансферного алгоритма

Показатели качества полученные трансферным алгоритмом

Рисунок 6 - Показатели качества полученные трансферным алгоритмом

Тестирование детекции после обучения:а) ограничивающие рамки не выдают ложных срабатываний, б) точность срабатывания ограничивающих рамок более 84%

Рисунок 7 - Тестирование детекции после обучения:

а) ограничивающие рамки не выдают ложных срабатываний, б) точность срабатывания ограничивающих рамок более 84%

Процесс обучения YOLOv10 (рисунок 2) показал невысокие показатели качества, полученные на исследуемом наборе данных изделий металлопроката. Причинами этого стала высокая составляющая сигнал-шум на изображениях и ложные всплески, как показано на рисунке 4. Модель пытается сдетектировать область, которая обучалась ранее как дефект на валидационном наборе.

Разработанный алгоритм апробирован также на данном наборе данных (рисунок 5). Графики показывают, что качество детектирования увеличилось на 20% от классической модели, а ограничивающие рамки четко выделяю результирующую область дефекта (рисунок 7) даже на тестовой выборке. Это дает гарантию, что ложное срабатывание будет минимально (<5%) во всех исследуемых данных в режиме реального времени.

6. Заключение

Нечеткая логика позволила смоделировать степень частичного дефекта, а кусочно-постоянный фон снизил ложные срабатывания на изображениях. Для обучения требуется совместная оптимизация параметров сети, функций img и областей img. Измененная архитектура YOLOv10 состоит из нечеткого слоя свертки.

Разработанная методика позволила достичь точности более 92% на тестовых данных металлургических дефектов, что на 15% выше классической архитектуры YOLOv10. Комбинация трансферного обучения и адаптивных архитектур с интеграцией нечеткой логики для детектирования дефектов и кусочно-постоянного фона снизила уровень ложных срабатываний на изображениях в 20%.

Описанный алгоритм подходит для задач применения машинного зрения, где критична высокая точность обнаружения поверхностных дефектов изделий металлопроката.

Предложенный подход демонстрирует, что комбинация трансферного обучения, нечеткой логики и CPU — оптимизация позволяет создать эффективное решение для промышленной дефектоскопии. Результаты исследования открывают путь к внедрению AI-инструментов в металлургическую отрасль, снижая затраты на контроль качества и минимизируя брак.

Article metrics

Views:96
Downloads:2
Views
Total:
Views:96