TRANSFER ALGORITHM FOR COMBINING TRAINED AND RETRAINED NEURAL NETWORK ARCHITECTURE FOR THE TASK OF NON-DESTRUCTIVE OF METALLURGICAL PRODUCTION

Mortin K.V.

doi:10.60797/IRJ.2025.156.60

TRANSFER ALGORITHM FOR COMBINING TRAINED AND RETRAINED NEURAL NETWORK ARCHITECTURE FOR THE TASK OF NON-DESTRUCTIVE OF METALLURGICAL PRODUCTION

Research article

DOI:

https://doi.org/10.60797/IRJ.2025.156.60

Issue: № 6 (156), 2025

Suggested:

23.02.2025

Accepted:

22.05.2025

Published:

17.06.2025

441

6

XML

PDF

Abstract

The article examines the problem of improving the accuracy of non-destructive testing in metallurgical production using a transfer algorithm combining trained and retrained neural network architectures. Modern industrial non-destructive testing is faced with the necessity of fast and accurate detection of defects in materials, which is critical for ensuring the safety and quality of products. Traditional flaw detection methods are time, resource and skilled personnel intensive, while the proposed transfer algorithm is based on the combination of a retrained neural network followed by a retrained model specialised for the flaw detection task. This approach reduces the time and resource costs of developing new models, while improving the accuracy and reliability of the system. The paper presents the results of experimental verification of the proposed algorithm on real data. It is shown that the combined approach provides a significant improvement in accuracy compared to separate models and traditional flaw detection methods. The results of the study confirm the promising use of the proposed algorithm in industrial conditions to improve the quality of inspection and reduce the risks associated with defects in materials.

Keywords:

transfer learning, deep learning, non-destructive testing, metallurgical production, model combination, retraining, product quality, inspection automation.

1. Введение

Современная промышленность, особенно металлургическая отрасль, сталкивается с необходимостью обеспечения высокого уровня качества выпускаемой продукции. Дефекты материалов могут привести к серьезным последствиям, таким как аварии, утрата имущества и даже человеческие жертвы, поэтому контроль качества и выявление дефектов являются критически важными этапами производственного процесса. Традиционно для этих целей используются различные методы дефектоскопии, такие как рентгенография, ультразвуковые и магнитопорошковые методы. Однако эти методы обладают рядом ограничений, включая высокую стоимость оборудования, необходимость высококвалифицированных специалистов и низкую скорость обработки больших объемов продукции. Современные технологии машинного обучения открывают новые перспективы для автоматизации процессов дефектоскопии. Нейронные сети демонстрируют высокую эффективность в решении задач распознавания образов и классификации, но создание новой модели с нуля требует значительных временных и вычислительных затрат. Трансферное обучение

, предлагает возможность использовать уже обученные модели для решения новых задач путем дообучения на специализированных данных. Это позволяет сократить время и ресурсы, необходимые для разработки новых решений, однако одной из проблем, возникающих при использовании трансферного обучения, является то, что одна модель может не всегда обеспечивать необходимую точность для всех аспектов задачи , . Для преодоления этого недостатка предлагается комбинация нескольких моделей, каждая из которых специализируется на определенных характеристиках данных. Такой подход может значительно повысить общую точность и надежность системы.

Целью настоящего исследования является разработка эффективного трансферного алгоритма комбинирования обученной и дообученной архитектур нейронных сетей для задачи дефектоскопии в металлургическом производстве. Данный алгоритм должен обеспечить высокую точность обнаружения дефектов при минимальных затратах времени и ресурсов на обучение и адаптацию моделей. Для достижения этой цели были определены следующие задачи: проведение обзора современных методов дефектоскопии и технологий машинного обучения, определение оптимальной архитектуры нейронной сети для предобучения, разработка алгоритма дообучения и методика комбинирования предсказаний от различных моделей.

Актуальность темы. Дефектоскопия в металлургической промышленности играет ключевую роль в обеспечении безопасности и надежности производимой продукции. Традиционные методы контроля качества, такие как рентгенография, ультразвуковая диагностика и магнитопорошковый метод, имеют свои ограничения, включая высокую стоимость оборудования, необходимость квалифицированного персонала и ограниченную скорость обработки больших объемов продукции. Современные технологии машинного обучения предлагают новые возможности для автоматизации процессов дефектоскопии, однако существующие подходы часто требуют значительных ресурсов для создания новых моделей с нуля для каждой конкретной задачи. В этой связи актуальным становится использование трансферного обучения, которое позволяет эффективно применять уже обученные модели для решения новых задач путем дообучения на специализированных данных. Комбинирование нескольких моделей, каждая из которых специализируется на разных аспектах задачи, может значительно повысить точность и надежность выявления дефектов. Разработка и внедрение таких комбинированных подходов могут существенно улучшить качество контроля в металлургическом производстве, снизить затраты и ускорить процессы диагностики.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Провести обзор современных методов дефектоскопии и технологий машинного обучения, применяемых в этой области.

2. Определить наиболее подходящую архитектуру нейронной сети для базового предобучения.

3. Разработать эффективный алгоритм дообучения предобученной модели на данных, специфичных для задачи дефектоскопии.

4. Разработать методику комбинирования предсказаний от обученной и дообученной моделей для улучшения общей точности обнаружения дефектов.

5. Провести экспериментальную проверку предложенного алгоритма на реальных данных и сравнить его эффективность с традиционными методами и другими современными подходами.

6. Проанализировать ошибки и выявить возможные пути улучшения предложенного алгоритма.

2. Методы и принципы исследования

Математическое представление классификации дефектов изделий металлопроката с использованием обученной сети RESNET50

, с введением нечеткого слоя.

Алгоритм включает глубокое обучение и нечеткую логику для классификации дефектов, разделения фона и маркировки изделий. RESNET50 используется для извлечения признаков, а нечеткий слой — для обработки неопределенности в изображениях (переходные зоны между дефектом и фоном).

Извлечение признаков формируется через среднее и стандартное отклонение набора данных:

где

— среднее и стандартное отклонение набора данных.

должно быть размером 224*224*3.

Тогда сверточный слой примет следующий вид:

Остаточные блоки:

Тензор признаков становится

Формирование нечеткого слоя осуществляется для обработки неопределённости между фоном и дефектом и состоит из трех шагов:

1. Глобальный средний пуллинг:

2. Нечеткие функции принадлежности для класса включая фон задается

, которая будет определять степень соответствия признаков треугольному распределению с параметрами

. Это упрощает вычисления и делает модель более интерпретируемой.

где a — левая граница (начало треугольника), b — вершина треугольника (максимум функция), c — правая граница (конец треугольника).

3. Нормализация нечетких оценок:

где K — число классов включая фон.

Этот подход позволяет более гибко настраивать зоны неопределенности между дефектами и фоном, что особенно полезно для задач классификации металлопроката с нечеткими границами дефектов, используя градиентно-взвешенную активационную карту (Grad-CAM)

, для выделения областей дефекта. Изображение проходит через модель f и получается выход для класса

. Для обратного прохода вычисляются градиенты

для каждого канала k последнего сверточного слоя. Для каждого k вычисляются веса

Далее вычисляется взвешенная сумма активаций:

Нормализация тепловой карты

приводится к диапазону [0,1].

Выделение областей дефекта на основе Grad-CAM:

где ak — веса важности каналов.

Следовательно, бинарная маска рассчитывается:

где

— порог задаваемы на основе нечеткой уверенности (при исследование установлен 0,35).

Функция потерь для обучения сформируется следующим образом:

где

– кросс энтропия,

— регуляризация для классификации,

— гиперпараметр.

Адаптация нечеткого слоя происходит через EMA (Exponential Moving Average)

, — это метод сглаживания параметров модели, который уменьшает колебания их значений во время обучения, присваивая больший вес последним обновлениям. В контексте нечеткого слоя EMA можно использовать для стабилизации параметров функций принадлежности), что особенно полезно в условиях шума на изображениях. На каждом шаге обучения параметры нечеткого слоя

обновляется следующим образом:

где

— текущее значение параметра на шаге

, — EMA-

версия параметра после шага

,

— коэффициент сглаживания.

Границы функций принадлежности обновляются следующим образом:

Нечеткий слой обрабатывает размытые границы между дефектом и фоном. Оценка pc показывает степень уверенности модели, Grad-CAM визуализирует локализацию дефекта. Такой подход предобученной модели позволяет улучшить классификацию дефектов металлопроката, особенно когда граница между дефектом и фоном размыта.

3. Математическое описание слоев дообученной модели YOLOv10 с интеграцией нечеткой логики дефектов и кусочно-постоянной модели фона

Предлагаемая модификация переформулирует стандартную архитектуру через математическую модель нечеткой логики для моделирования поверхностного дефекта или маркировки металлургических изделий и кусочно-постоянной функции для фона.

Входной слой. Входное изображение представляется следующим образом: первая часть не

где:

— функция принадлежности дефекта к нечеткому множеству,

— интенсивность дефектов в точке

,

— константа

- той области фона

— индикаторная функция (1 внутри

, 0 иначе).

Сверточный слой представляет две свертки (нечеткая логика и кусочно-постоянный пулинг).

Для ядра

и входа I:

где

— функция активации Swish, усиливающая нечеткие границы.

Кусочно-постоянный пулинг.

где K — локальная область соединяет признаки разного масштаба, учитывая нечеткость дефектов.

Кусочно=линейная интерполяция фона определяется как:

Проектирование нечетких ограничивающих рамок для предсказания. Координаты центра

моделируются как треугольные нечеткие числа:

где

— центр, w — ширина области неопределенности.

Классификация дефекта.

Вероятность класса pc заменяется на степень принадлежности:

где

— признаки класса

.

Функция потерь с регуляризацией фона.

где:

— стандартная потеря YOLO при классификации,

— дисперсия интенсивности фона в области

,

— коэффициент регуляризации, задающий гладкость фона.

Методика «Двухэтапное обучение» формируется из трансферного обучения и тонкой настройки:

- загрузка весов предобученной модели EfficientNet-B3;

- инициализация нечеткого сверточного слоя, где

инициализируется равномерно;

- обучение только верхних слоев на гибридных данных;

- происходит оптимизация

, а снижение веса=0,01

- функция потерь рассчитывается как:

, где

— бинарная маска дефекта.

- разморозка всех слоев;

- оптимизатор

, импульс 0,9;

- регуляризация: выпадение (p = 0,3) перед классификатором, штраф за вариативность фона:

.

Гибридное представление данных снижает шумы фона, нечеткие признаки улучшают детектирование частичных дефектов, а регуляризация фона предотвращает переобучение модели.

4. Методика трансферного обучения для детектирования и классификации дефектов металлопроката

1. Подготовка, сбор и аннотация данных:

Для YOLOv10

, , размечаются ограничивающие рамки вокруг дефектов в формате COCO и создаются метки классов для ResNet50 (0 — фон,1 — трещина, 2 — царапина).

2. Предобработка заключается в нормализации и аугментации, где изображения приводятся к стандартным размерам: YOLOv10 - 640×640, ResNet50 — 224×224, применяются повороты, отражения, изменение яркости/контраста, добавление шума.

3. Разделение данных: обучающая выбор — 70%, валидационная — 15% и тестовая — 15%.

4. Обучение ResNet50 с нечетким слоем: происходит модификация архитектуры и заменяется последний полносвязный слой ResNet50 на нечеткий классификатор с заморозкой всех слоев ResNet50, кроме последнего блока и нечеткого слоя.

5. EMA – обновление: после каждого шага оптимизации вызывается функция обновления сглаживания параметров модели.

6. Интеграция YOLOv10 и ResNet50:

Шаг 1: YOLOv10 детектирует дефекты и возвращает ограничивающие рамки.

Шаг 2: для каждой рамки извлекается область изображения и приводится к размеру 224×224, затем пропускается через ResNet50 для классификации.

Шаг 3: объединяются результаты:

7. Оптимизация используется TensorRT

, для ускорения YOLOv10 и ResNet50, реализуя асинхронную обработку для работы в реальном времени.

8. Валидация и тестирование вычисляют параметры достоверности для YOLOv10 — mAP@0.5, Recall, Precision и ResNet50 – Accuracy, F1-score, а общие параметры – IoU детекций и точность классификации.

9. Интерпретация и оценка визуализируют тепловые карты Grad-CAM для анализа важных областей, затем проверяется устойчивость к шуму и размытым границам дефектов.

10. Развертывание и экспорт моделей для YOLOv10 в ONNX

или TensorRT, а для ResNet50 сохраняются веса с EMA-параметрами.

11. Интеграция в производство реализуются REST API

для обработки изображений и настраивается мониторинг параметров достоверности.

Трансферный алгоритм комбинирования обученной и дообученной архитектуры нейронных сетей (рисунок 1) показывает взаимодействие архитектур разработанной методики и совмещение математического аппарата.

Рисунок 1 - Трансферный алгоритм комбинирования обученной и дообученной архитектуры детектирования дефектов металлургических изделий

Выбирается базовая архитектура, в которой все сверточные слои остаются замороженными для сохранения способности извлекать общие признаки дефектов, а исходные полносвязные слои удаляются. Добавленные новые слои адаптированы для детекции и веса инициализируются случайным образом. После прохода каждой эпохи вычисляется точность на валидационном наборе данных. Если точность больше 91% — обучение завершено, меньше — активируется цикл дообучения, размораживаются сверточные слои базовой модели и происходит перенастройка гиперпараметров.

5. Тестирование и сравнение результатов

В тестировании участвовал набор данных изделий металлургического производства, состоящий из 37000 изображений. На графиках представлены фрагменты процесса обучения нейронной сетью YOLOv10 и разработанным трансферным алгоритмом.

Рисунок 2 - Процесс обучения с использованием модели YOLOv10

Рисунок 3 - Показатели качества, полученные моделью YOLOv10

Тестирование детекции после обучения: а) ограничивающие рамки накладываются друг на друга, б) множества мнимых срабатываний интересующей области

Рисунок 4 - Тестирование детекции после обучения: а) ограничивающие рамки накладываются друг на друга, б) множества мнимых срабатываний интересующей области

Рисунок 5 - Процесс обучения разработанного трансферного алгоритма

Рисунок 6 - Показатели качества полученные трансферным алгоритмом

Тестирование детекции после обучения:а) ограничивающие рамки не выдают ложных срабатываний, б) точность срабатывания ограничивающих рамок более 84%

Рисунок 7 - Тестирование детекции после обучения:

а) ограничивающие рамки не выдают ложных срабатываний, б) точность срабатывания ограничивающих рамок более 84%

Процесс обучения YOLOv10 (рисунок 2) показал невысокие показатели качества, полученные на исследуемом наборе данных изделий металлопроката. Причинами этого стала высокая составляющая сигнал-шум на изображениях и ложные всплески, как показано на рисунке 4. Модель пытается сдетектировать область, которая обучалась ранее как дефект на валидационном наборе.

Разработанный алгоритм апробирован также на данном наборе данных (рисунок 5). Графики показывают, что качество детектирования увеличилось на 20% от классической модели, а ограничивающие рамки четко выделяю результирующую область дефекта (рисунок 7) даже на тестовой выборке. Это дает гарантию, что ложное срабатывание будет минимально (<5%) во всех исследуемых данных в режиме реального времени.

6. Заключение

Нечеткая логика позволила смоделировать степень частичного дефекта, а кусочно-постоянный фон снизил ложные срабатывания на изображениях. Для обучения требуется совместная оптимизация параметров сети, функций

и областей

. Измененная архитектура YOLOv10 состоит из нечеткого слоя свертки.

Разработанная методика позволила достичь точности более 92% на тестовых данных металлургических дефектов, что на 15% выше классической архитектуры YOLOv10. Комбинация трансферного обучения и адаптивных архитектур с интеграцией нечеткой логики для детектирования дефектов и кусочно-постоянного фона снизила уровень ложных срабатываний на изображениях в 20%.

Описанный алгоритм подходит для задач применения машинного зрения, где критична высокая точность обнаружения поверхностных дефектов изделий металлопроката.

Предложенный подход демонстрирует, что комбинация трансферного обучения, нечеткой логики и CPU — оптимизация позволяет создать эффективное решение для промышленной дефектоскопии. Результаты исследования открывают путь к внедрению AI-инструментов в металлургическую отрасль, снижая затраты на контроль качества и минимизируя брак.

Additional materials

Not specified

Financing

Авторы не получали финансовой поддержки для проведения исследования, написания и публикации статьи

Acknowledgements

Not specified

Conflicts of interests

Not specified

References

Minoofam S.A.H. TRCLA: A Transfer Learning Approach to Reduce Negative Transfer for Cellular Learning Automata / S.A.H. Minoofam, A. Bastanfard, M.R. Keyvanpour // IEEE Transactions on Neural Networks and Learning Systems. — 2023. — Vol. 34, № 5. — P. 2480–2489. — DOI: 10.1109/TNNLS.2021.3106705
Hao J. Deep learning-based medical image analysis with explainable transfer learning / J. Hao // 2023 International Conference on Computer Engineering and Distance Learning (CEDL). — Shanghai, 2023. — P. 106–109. — DOI: 10.1109/CEDL60560.2023.00029
Singh G. Advanced Fruit Sorting: Pre-trained ResNet50 Model for Rotten and Fresh Fruit Classification / G. Singh, K. Guleria, S. Sharma // 2024 4th Asian Conference on Innovation in Technology (ASIANCON). — Pimari Chinchwad, 2024. — P. 1–5. — DOI: 10.1109/ASIANCON62057.2024.10837782
Dasari S. Transfer Learning Approach for Classification of Diabetic Retinopathy using Fine-Tuned ResNet50 Deep Learning Model / S. Dasari, B. Poonguzhali, M. Rayudu // 2023 International Conference on Sustainable Communication Networks and Application (ICSCNA). — Theni, 2023. — P. 1361–1367. — DOI: 10.1109/ICSCNA58489.2023.10370255
Ahad T. MultiClass Classification of Chest Diseases using CXR Images with DenseNet201+CNN and Grad CAM Visualization / T. Ahad, H.B. Kibria, M.Y. Mehemud // 2024 IEEE International Conference on Power, Electrical, Electronics and Industrial Applications (PEEIACON). — Rajshahi, 2024. — P. 368–372. — DOI: 10.1109/PEEIACON63629.2024.10800227
Alam M.U. Exploring LRP and Grad-CAM visualization to interpret multi-label-multi-class pathology prediction using chest radiography / M.U. Alam, J.R. Baldvinsson, Y. Wang // 2022 IEEE 35th International Symposium on Computer-Based Medical Systems (CBMS). — Shenzhen, 2022. — P. 258–263. — DOI: 10.1109/CBMS55023.2022.00052
Al Kindhi B. Moving Average Filter for Optimizing Optical Character Recognition (OCR) on Perfume-Filling Machines / B. Al Kindhi, G.L.W. Agustya, L.P. Rahayu // 2023 International Conference on Modeling & E-Information Research, Artificial Learning and Digital Applications (ICMERALDA). — Karawang, 2023. — P. 318–323. — DOI: 10.1109/ICMERALDA60125.2023.10458163
Fikri M. On the Performance Similarity Between Exponential Moving Average and Discrete Linear Kalman Filter / M. Fikri, S. Herdjunanto, A. Cahyadi // 2019 Asia Pacific Conference on Research in Industrial and Systems Engineering (APCoRISE). — Depok, 2019. — P. 1–5. — DOI: 10.1109/APCoRISE46197.2019.9318810
Xie X. HATSC-YOLOv10: Improved YOLOv10 for Satellite Remote Sensing Images of Small Object Detection / X. Xie, J. Ren, Y. Zeng [et al.] // 2024 China Automation Congress (CAC). — Qingdao, 2024. — P. 3795–3799. — DOI: 10.1109/CAC63892.2024.10865623
Liu R. Improved LKM-YOLOv10 Vehicle Licence Plate Recognition Detection System Based on YOLOv10 / R. Liu // 2024 4th International Conference on Electronic Information Engineering and Computer Science (EIECS). — Yanji, 2024. — P. 622–626. — DOI: 10.1109/EIECS63941.2024.10800394
Sun H. SOD-YOLOv10: Small Object Detection in Remote Sensing Images Based on YOLOv10 / H. Sun, G. Yao, S. Zhu [et al.] // IEEE Geoscience and Remote Sensing Letters. — 2025. — Vol. 22. — Art no. 8000705. — DOI: 10.1109/LGRS.2025.3534786
Hong H.-K. An Optimized Multi-Object Tracking with TensorRT / H.-K. Hong, J.-W. Jeon // 2023 International Technical Conference on Circuits/Systems, Computers, and Communications (ITC-CSCC). — Jeju, 2023. — P. 1–4. — DOI: 10.1109/ITC-CSCC58803.2023.10212493
Aguilera J. Experimental Evaluation of Neural Networks Optimized for GPU Inference Using TensorRT / J. Aguilera, G. Carvajal // 2024 IEEE International Conference on Automation/XXVI Congress of the Chilean Association of Automatic Control (ICA-ACCA). — Santiago, 2024. — P. 1–6. — DOI: 10.1109/ICA-ACCA62622.2024.10766807
Lee S. NPU-aware Parameter Generation in Quantization ONNX Model / S. Lee, M. Sung, J. Park [et al.] // 2021 IEEE International Conference on Consumer Electronics-Asia (ICCE-Asia). — Gangwon, 2021. — P. 1–3. — DOI: 10.1109/ICCE-Asia53811.2021.9641905
Park S. Design of REST API Client for Conversational Agent using Large Language Model with Open API System / S. Park, A. Kim, S. Lee [et al.] // 2024 IEEE/ACIS 22nd International Conference on Software Engineering Research, Management and Applications (SERA). — Honolulu, 2024. — P. 55–58. — DOI: 10.1109/SERA61261.2024.10685639
Zhuro D.V. Analiz sostojanija voprosa v oblasti primenenija tehnicheskogo zrenija dlja defektoskopii [Analysis of the State of Technical Vision Application for Defectoscopy] / D.V. Zhuro, M.V. Zaharov // Mezhdunarodnyj zhurnal prikladnyh nauk i tehnologij Integral [International Journal of Applied Science and Technology Integral]. — 2020. — № 4. — P. 31. [in Russian]
Gibadullin R.F. Analiz parametrov promyshlennyh setej s primeneniem nejrosetevoj obrabotki [Analysis of Industrial Network Parameters Using Neural Network Processing] / R.F. Gibadullin, D.V. Lekomcev, M.Ju. Peruhin // Iskusstvennyj intellekt i prinjatie reshenij [Artificial intelligence and decision-making]. — 2020. — № 1. — P. 80–87. — DOI: 10.14357/20718594200108 [in Russian]

Review

All articles are peer-reviewed. But the reviewer or the author of the article chose not to publish a review of this article in the public domain. The review can be provided to the competent authorities upon request.

Author information

AffiliationDigital Steel JSC, Murom, Russian Federation

Role:Author

ORCID:0000-0002-0324-6757

ELIBRARY AUTHOR ID:646693

RESEARCHER ID:L-2741-2016

Article metrics

Downloads:6

ViewsDownloads

Views

Total: