TRANSFER ALGORITHM FOR COMBINING TRAINED AND RETRAINED NEURAL NETWORK ARCHITECTURE FOR THE TASK OF NON-DESTRUCTIVE OF METALLURGICAL PRODUCTION
TRANSFER ALGORITHM FOR COMBINING TRAINED AND RETRAINED NEURAL NETWORK ARCHITECTURE FOR THE TASK OF NON-DESTRUCTIVE OF METALLURGICAL PRODUCTION
Abstract
The article examines the problem of improving the accuracy of non-destructive testing in metallurgical production using a transfer algorithm combining trained and retrained neural network architectures. Modern industrial non-destructive testing is faced with the necessity of fast and accurate detection of defects in materials, which is critical for ensuring the safety and quality of products. Traditional flaw detection methods are time, resource and skilled personnel intensive, while the proposed transfer algorithm is based on the combination of a retrained neural network followed by a retrained model specialised for the flaw detection task. This approach reduces the time and resource costs of developing new models, while improving the accuracy and reliability of the system. The paper presents the results of experimental verification of the proposed algorithm on real data. It is shown that the combined approach provides a significant improvement in accuracy compared to separate models and traditional flaw detection methods. The results of the study confirm the promising use of the proposed algorithm in industrial conditions to improve the quality of inspection and reduce the risks associated with defects in materials.
1. Введение
Современная промышленность, особенно металлургическая отрасль, сталкивается с необходимостью обеспечения высокого уровня качества выпускаемой продукции. Дефекты материалов могут привести к серьезным последствиям, таким как аварии, утрата имущества и даже человеческие жертвы, поэтому контроль качества и выявление дефектов являются критически важными этапами производственного процесса. Традиционно для этих целей используются различные методы дефектоскопии, такие как рентгенография, ультразвуковые и магнитопорошковые методы. Однако эти методы обладают рядом ограничений, включая высокую стоимость оборудования, необходимость высококвалифицированных специалистов и низкую скорость обработки больших объемов продукции. Современные технологии машинного обучения открывают новые перспективы для автоматизации процессов дефектоскопии. Нейронные сети демонстрируют высокую эффективность в решении задач распознавания образов и классификации, но создание новой модели с нуля требует значительных временных и вычислительных затрат. Трансферное обучение , предлагает возможность использовать уже обученные модели для решения новых задач путем дообучения на специализированных данных. Это позволяет сократить время и ресурсы, необходимые для разработки новых решений, однако одной из проблем, возникающих при использовании трансферного обучения, является то, что одна модель может не всегда обеспечивать необходимую точность для всех аспектов задачи , . Для преодоления этого недостатка предлагается комбинация нескольких моделей, каждая из которых специализируется на определенных характеристиках данных. Такой подход может значительно повысить общую точность и надежность системы.
Целью настоящего исследования является разработка эффективного трансферного алгоритма комбинирования обученной и дообученной архитектур нейронных сетей для задачи дефектоскопии в металлургическом производстве. Данный алгоритм должен обеспечить высокую точность обнаружения дефектов при минимальных затратах времени и ресурсов на обучение и адаптацию моделей. Для достижения этой цели были определены следующие задачи: проведение обзора современных методов дефектоскопии и технологий машинного обучения, определение оптимальной архитектуры нейронной сети для предобучения, разработка алгоритма дообучения и методика комбинирования предсказаний от различных моделей.
Актуальность темы. Дефектоскопия в металлургической промышленности играет ключевую роль в обеспечении безопасности и надежности производимой продукции. Традиционные методы контроля качества, такие как рентгенография, ультразвуковая диагностика и магнитопорошковый метод, имеют свои ограничения, включая высокую стоимость оборудования, необходимость квалифицированного персонала и ограниченную скорость обработки больших объемов продукции. Современные технологии машинного обучения предлагают новые возможности для автоматизации процессов дефектоскопии, однако существующие подходы часто требуют значительных ресурсов для создания новых моделей с нуля для каждой конкретной задачи. В этой связи актуальным становится использование трансферного обучения, которое позволяет эффективно применять уже обученные модели для решения новых задач путем дообучения на специализированных данных. Комбинирование нескольких моделей, каждая из которых специализируется на разных аспектах задачи, может значительно повысить точность и надежность выявления дефектов. Разработка и внедрение таких комбинированных подходов могут существенно улучшить качество контроля в металлургическом производстве, снизить затраты и ускорить процессы диагностики.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Провести обзор современных методов дефектоскопии и технологий машинного обучения, применяемых в этой области.
2. Определить наиболее подходящую архитектуру нейронной сети для базового предобучения.
3. Разработать эффективный алгоритм дообучения предобученной модели на данных, специфичных для задачи дефектоскопии.
4. Разработать методику комбинирования предсказаний от обученной и дообученной моделей для улучшения общей точности обнаружения дефектов.
5. Провести экспериментальную проверку предложенного алгоритма на реальных данных и сравнить его эффективность с традиционными методами и другими современными подходами.
6. Проанализировать ошибки и выявить возможные пути улучшения предложенного алгоритма.
2. Методы и принципы исследования
Математическое представление классификации дефектов изделий металлопроката с использованием обученной сети RESNET50 , с введением нечеткого слоя.
Алгоритм включает глубокое обучение и нечеткую логику для классификации дефектов, разделения фона и маркировки изделий. RESNET50 используется для извлечения признаков, а нечеткий слой — для обработки неопределенности в изображениях (переходные зоны между дефектом и фоном).
Извлечение признаков формируется через среднее и стандартное отклонение набора данных:
где — среднее и стандартное отклонение набора данных.
должно быть размером 224*224*3.
Тогда сверточный слой примет следующий вид:
Остаточные блоки:
Тензор признаков становится
Формирование нечеткого слоя осуществляется для обработки неопределённости между фоном и дефектом и состоит из трех шагов:
1. Глобальный средний пуллинг:
2. Нечеткие функции принадлежности для класса включая фон задается , которая будет определять степень соответствия признаков треугольному распределению с параметрами
. Это упрощает вычисления и делает модель более интерпретируемой.
где a — левая граница (начало треугольника), b — вершина треугольника (максимум функция), c — правая граница (конец треугольника).
3. Нормализация нечетких оценок:
где K — число классов включая фон.
Этот подход позволяет более гибко настраивать зоны неопределенности между дефектами и фоном, что особенно полезно для задач классификации металлопроката с нечеткими границами дефектов, используя градиентно-взвешенную активационную карту (Grad-CAM) , для выделения областей дефекта. Изображение проходит через модель f и получается выход для класса . Для обратного прохода вычисляются градиенты
для каждого канала k последнего сверточного слоя. Для каждого k вычисляются веса
Далее вычисляется взвешенная сумма активаций:
Нормализация тепловой карты приводится к диапазону [0,1].
Выделение областей дефекта на основе Grad-CAM:
где ak — веса важности каналов.
Следовательно, бинарная маска рассчитывается:
где — порог задаваемы на основе нечеткой уверенности (при исследование установлен 0,35).
Функция потерь для обучения сформируется следующим образом:
где – кросс энтропия,
— регуляризация для классификации,
— гиперпараметр.
Адаптация нечеткого слоя происходит через EMA (Exponential Moving Average) , — это метод сглаживания параметров модели, который уменьшает колебания их значений во время обучения, присваивая больший вес последним обновлениям. В контексте нечеткого слоя EMA можно использовать для стабилизации параметров функций принадлежности), что особенно полезно в условиях шума на изображениях. На каждом шаге обучения параметры нечеткого слоя обновляется следующим образом:
где — текущее значение параметра на шаге
, — EMA-
версия параметра после шага
,
— коэффициент сглаживания.
Границы функций принадлежности обновляются следующим образом:
Нечеткий слой обрабатывает размытые границы между дефектом и фоном. Оценка pc показывает степень уверенности модели, Grad-CAM визуализирует локализацию дефекта. Такой подход предобученной модели позволяет улучшить классификацию дефектов металлопроката, особенно когда граница между дефектом и фоном размыта.
3. Математическое описание слоев дообученной модели YOLOv10 с интеграцией нечеткой логики дефектов и кусочно-постоянной модели фона
Предлагаемая модификация переформулирует стандартную архитектуру через математическую модель нечеткой логики для моделирования поверхностного дефекта или маркировки металлургических изделий и кусочно-постоянной функции для фона.
Входной слой. Входное изображение представляется следующим образом: первая часть не
где: — функция принадлежности дефекта к нечеткому множеству,
— интенсивность дефектов в точке
,
— константа
- той области фона
— индикаторная функция (1 внутри
, 0 иначе).
Сверточный слой представляет две свертки (нечеткая логика и кусочно-постоянный пулинг).
Для ядра и входа I:
где — функция активации Swish, усиливающая нечеткие границы.
Кусочно-постоянный пулинг.
где K — локальная область соединяет признаки разного масштаба, учитывая нечеткость дефектов.
Кусочно=линейная интерполяция фона определяется как:
Проектирование нечетких ограничивающих рамок для предсказания. Координаты центра моделируются как треугольные нечеткие числа:
где — центр, w — ширина области неопределенности.
Классификация дефекта.
Вероятность класса pc заменяется на степень принадлежности:
где — признаки класса
.
Функция потерь с регуляризацией фона.
где: — стандартная потеря YOLO при классификации,
— дисперсия интенсивности фона в области
,
— коэффициент регуляризации, задающий гладкость фона.
Методика «Двухэтапное обучение» формируется из трансферного обучения и тонкой настройки:
- загрузка весов предобученной модели EfficientNet-B3;
- инициализация нечеткого сверточного слоя, где инициализируется равномерно;
- обучение только верхних слоев на гибридных данных;
- происходит оптимизация , а снижение веса=0,01
- функция потерь рассчитывается как: , где
— бинарная маска дефекта.
- разморозка всех слоев;
- оптимизатор , импульс 0,9;
- регуляризация: выпадение (p = 0,3) перед классификатором, штраф за вариативность фона: .
Гибридное представление данных снижает шумы фона, нечеткие признаки улучшают детектирование частичных дефектов, а регуляризация фона предотвращает переобучение модели.
4. Методика трансферного обучения для детектирования и классификации дефектов металлопроката
1. Подготовка, сбор и аннотация данных:
Для YOLOv10 , , размечаются ограничивающие рамки вокруг дефектов в формате COCO и создаются метки классов для ResNet50 (0 — фон,1 — трещина, 2 — царапина).
2. Предобработка заключается в нормализации и аугментации, где изображения приводятся к стандартным размерам: YOLOv10 - 640×640, ResNet50 — 224×224, применяются повороты, отражения, изменение яркости/контраста, добавление шума.
3. Разделение данных: обучающая выбор — 70%, валидационная — 15% и тестовая — 15%.
4. Обучение ResNet50 с нечетким слоем: происходит модификация архитектуры и заменяется последний полносвязный слой ResNet50 на нечеткий классификатор с заморозкой всех слоев ResNet50, кроме последнего блока и нечеткого слоя.
5. EMA – обновление: после каждого шага оптимизации вызывается функция обновления сглаживания параметров модели.
6. Интеграция YOLOv10 и ResNet50:
Шаг 1: YOLOv10 детектирует дефекты и возвращает ограничивающие рамки.
Шаг 2: для каждой рамки извлекается область изображения и приводится к размеру 224×224, затем пропускается через ResNet50 для классификации.
Шаг 3: объединяются результаты:
7. Оптимизация используется TensorRT
, для ускорения YOLOv10 и ResNet50, реализуя асинхронную обработку для работы в реальном времени.8. Валидация и тестирование вычисляют параметры достоверности для YOLOv10 — mAP@0.5, Recall, Precision и ResNet50 – Accuracy, F1-score, а общие параметры – IoU детекций и точность классификации.
9. Интерпретация и оценка визуализируют тепловые карты Grad-CAM для анализа важных областей, затем проверяется устойчивость к шуму и размытым границам дефектов.
10. Развертывание и экспорт моделей для YOLOv10 в ONNX
или TensorRT, а для ResNet50 сохраняются веса с EMA-параметрами.11. Интеграция в производство реализуются REST API
для обработки изображений и настраивается мониторинг параметров достоверности.Трансферный алгоритм комбинирования обученной и дообученной архитектуры нейронных сетей (рисунок 1) показывает взаимодействие архитектур разработанной методики и совмещение математического аппарата.

Рисунок 1 - Трансферный алгоритм комбинирования обученной и дообученной архитектуры детектирования дефектов металлургических изделий
5. Тестирование и сравнение результатов
В тестировании участвовал набор данных изделий металлургического производства, состоящий из 37000 изображений. На графиках представлены фрагменты процесса обучения нейронной сетью YOLOv10 и разработанным трансферным алгоритмом.

Рисунок 2 - Процесс обучения с использованием модели YOLOv10

Рисунок 3 - Показатели качества, полученные моделью YOLOv10

Рисунок 4 - Тестирование детекции после обучения: а) ограничивающие рамки накладываются друг на друга, б) множества мнимых срабатываний интересующей области

Рисунок 5 - Процесс обучения разработанного трансферного алгоритма

Рисунок 6 - Показатели качества полученные трансферным алгоритмом

Рисунок 7 - Тестирование детекции после обучения:
а) ограничивающие рамки не выдают ложных срабатываний, б) точность срабатывания ограничивающих рамок более 84%
Разработанный алгоритм апробирован также на данном наборе данных (рисунок 5). Графики показывают, что качество детектирования увеличилось на 20% от классической модели, а ограничивающие рамки четко выделяю результирующую область дефекта (рисунок 7) даже на тестовой выборке. Это дает гарантию, что ложное срабатывание будет минимально (<5%) во всех исследуемых данных в режиме реального времени.
6. Заключение
Нечеткая логика позволила смоделировать степень частичного дефекта, а кусочно-постоянный фон снизил ложные срабатывания на изображениях. Для обучения требуется совместная оптимизация параметров сети, функций и областей
. Измененная архитектура YOLOv10 состоит из нечеткого слоя свертки.
Разработанная методика позволила достичь точности более 92% на тестовых данных металлургических дефектов, что на 15% выше классической архитектуры YOLOv10. Комбинация трансферного обучения и адаптивных архитектур с интеграцией нечеткой логики для детектирования дефектов и кусочно-постоянного фона снизила уровень ложных срабатываний на изображениях в 20%.
Описанный алгоритм подходит для задач применения машинного зрения, где критична высокая точность обнаружения поверхностных дефектов изделий металлопроката.
Предложенный подход демонстрирует, что комбинация трансферного обучения, нечеткой логики и CPU — оптимизация позволяет создать эффективное решение для промышленной дефектоскопии. Результаты исследования открывают путь к внедрению AI-инструментов в металлургическую отрасль, снижая затраты на контроль качества и минимизируя брак.