АВТОМАТИЗИРОВАННАЯ ГЕНЕРАЦИЯ ТРЁХМЕРНОЙ МОДЕЛИ БРОНХИАЛЬНОГО ДЕРЕВА ПО КТ-ИЗОБРАЖЕНИЮ

Смирнов А.А.; Аристова Е.В.

doi:10.60797/IRJ.2025.160s.12

АВТОМАТИЗИРОВАННАЯ ГЕНЕРАЦИЯ ТРЁХМЕРНОЙ МОДЕЛИ БРОНХИАЛЬНОГО ДЕРЕВА ПО КТ-ИЗОБРАЖЕНИЮ

Научная статья

Аристова Е. В.

DOI:

https://doi.org/10.60797/IRJ.2025.160s.12

Выпуск: № 10 (160) S, 2025

Предложена:

22.07.2025

Принята:

23.07.2025

Опубликована:

24.10.2025

108

0

XML

PDF

Аннотация

В статье представлена разработка алгоритма автоматической сегментации бронхиального дерева на КТ-изображениях и построения его трёхмерной модели. Описан подход, основанный на текстурном анализе и использовании референсных сегментов, а также обучение различных алгоритмов машинного обучения, включая Decision Tree и Random Forest. Проведён анализ эффективности на выборке из 15 КТ-снимков, включающей более 300 сегментов. Представлены метрики качества (Accuracy, Recall, Precision, F1, IoU), результаты показали преимущество Random Forest для данной задачи. Предложены направления дальнейшего усовершенствования алгоритма. Разработка может быть полезна для клинической практики при планировании бронхопластики, а также в качестве инструмента диагностики и визуализации сложных структур дыхательной системы.

Ключевые слова:

бронхиальное дерево, КТ, сегментация, машинное обучение, текстурный анализ.

1. Введение

Заболевания органов дыхания являются распространенной проблемой здоровья, ухудшающей качество жизни и часто устойчивой к самолечению. Влияние экологических факторов на здоровье дыхательной системы приводит к увеличению числа пациентов с такими заболеваниями.

Бронхопластика — это сложная хирургическая процедура, направленная на исправление аномалий бронхов. Она включает удаление пораженных участков и восстановление анатомической целостности бронхов, что позволяет нормализовать воздушный поток и функцию легких. Решение о проведении бронхопластики требует глубокого анализа клинических факторов, таких как степень опухолевого процесса и общее состояние пациента

.

На данный момент не существуют стандартизированных протоколов для бронхопластики, что делает каждый случай уникальным. Хирурги должны учитывать индивидуальные особенности заболевания и пациента для разработки оптимального плана лечения. Понимание анатомии бронхиального дерева критически важно для успешного вмешательства, и для этого часто используются КТ. Однако интерпретация КТ-изображений может быть сложной, что подчеркивает необходимость разработки более эффективных методов визуализации.

Сложности анализа КТ-данных ограничивают точность хирургического вмешательства, а низкая контрастность изображений затрудняет различение мелких деталей. Это особенно критично для операций на бронхах, где точность измерений важна для предотвращения повреждения окружающих тканей. Недостаточная контрастность может привести к ошибкам в диагностике и игнорированию серьезных проблем, что недопустимо в медицине

.

На основании анализа проблематики и литературы целью данной работы была определена разработка алгоритма автоматической сегментации бронхиального дерева на снимках КТ и построения его трехмерной модели.

2. Набор данных

Для данной работы был использован датасет из открытого источника Kaggle Finding and Measuring Lungs in CT Data

. Данный датасет включает в себя 4 КТ изображения грудной клетки. Также дополнительно были использованы изображения из других источников. В результате был собран комбинированный датасет из 15 снимков, основные параметры которых представлены в Таблице 1.

Таблица 1 - Параметры использованных снимков

DOI:10.60797/IRJ.2025.160s.12.1

№	Ширина (в вокселях)	Высота (в вокселях)	Число срезов
1	312	512	512
2	456	512	512
3	301	512	512
4	117	512	512
5	312	512	512
6	420	512	512
7	456	512	512
8	305	512	512
9	305	512	512
10	305	512	512
11	305	512	512
12	305	512	512
13	184	512	512
14	184	512	512
15	326	512	512

Разрабатываемый алгоритм предназначен для создания двоичной маски, которая будет классифицировать пиксели изображения на две категории: «бронхи» и «фон». В этой маске пиксели, соответствующие бронхам, будут обозначены как «1», что условно указывает на их принадлежность к классу «бронхи». В то же время пиксели, которые не относятся к бронхам и представляют собой фоновую ткань или пустое пространство, будут обозначены как «0», что соответствует классу «фон».

Для удобства визуализации и анализа, предполагается, что маска будет доступна не только в виде отдельного слоя, но и может быть наложена на исходное изображение. Это позволит пользователям легко сравнивать маску с исходными данными и оценивать точность алгоритма.

Чтобы оптимизировать использование памяти устройства и упростить обработку данных, предлагается представить маску в форме трехмерной бинарной матрицы или массива. Это сократит объем занимаемой памяти, поскольку для хранения каждого пикселя будет использоваться только один бит информации. Кроме того, такое представление упрощает интеграцию маски в различные системы обработки изображений и анализа данных, обеспечивая эффективную работу с большими объемами информации.

3. Описание используемых алгоритмов

Для выполнения данной работы был составлен алгоритм, состоящий из 2 основных элементов. В первую часть входят считывание и подготовка изображения, выделение референсных сегментов и проведение текстурного анализа. Ко второй части относятся калибровка алгоритмов машинного обучения на основе референсных сегментов и сканирование изображения для получения полной маски.

4. Референсные сегменты

Референсные сегменты играют ключевую роль в процессе текстурного анализа изображений, поскольку они служат эталонными образцами для определения границ параметров анализа. В контексте данного проекта, эти сегменты выбираются вручную в момент загрузки изображения для последующей разметки, что позволяет точно настроить параметры алгоритма под конкретные задачи.

Каждый такой сегмент представляет собой выделенную область на матрице изображения, которой присваивается определённый класс. В вашем случае, класс «1» соответствует бронхам — объектам, которые представляют интерес для исследования, в то время как класс «0» обозначает фоновые элементы, не несущие информации о бронхах. Для достоверности анализа и обучения алгоритма, необходимо выделить минимум по 10 сегментов для каждого класса на каждом изображении.

Дополнительно, для оценки точности и качества работы разрабатываемого алгоритма, было решено включить в анализ ещё 20 дополнительных сегментов, которые также разделяются на классы «1» и «0». Это позволит провести более глубокий анализ работы алгоритма и его способность корректно классифицировать интересующие объекты.

В итоге, для обучения и последующего тестирования алгоритма был сформирован датасет, включающий в себя 300 референсных сегментов для каждой из фаз. Такой подход обеспечивает алгоритм достаточным количеством данных для обучения и позволяет провести всестороннее тестирование его эффективности в реальных условиях.

5. Текстурный анализ

Текстурный анализ — это метод структурного анализа для определения расположения элементов в исследуемом объекте. В рентгенологии это подразумевает распределение пикселей или вокселей различной интенсивности по снимку.

Алгоритм текстурного анализа основан на определении параметров элемента на основе окружающих его других элементов. Для данной работы был использован алгоритм для двумерной матрицы из 9 элементов для определения параметров центрального элемента. Его упрощенная схема представлена на рисунке 1.

Рисунок 1 - Пример упрощенного алгоритма текстурного анализа

Для каждого элемента вокруг исследуемого определяется пороговое значение. При его превышении элемент определяется маркером «1» в бинарном паттерне. В противном случае, он получает маркер «0». Как результат формируется последовательность 8 маркеров, описывающих конкретный элемент матрицы — локальный бинарный паттерн (Local Binary Pattern или LBP). Все возможные варианты данного типа паттернов представлены на рисунке 2. Черные точки обозначают маркеры «0», а белые — маркеры «1» , , .

Рисунок 2 - Примеры локального бинарного паттерна

6. Использованные алгоритмы машинного обучения

Для обработки полученных данных были использованы различные алгоритмы машинного обучения для выбора наилучшего результата: метод опорных векторов (Support Vector Machine), дерево решений (Decision Tree), логистическая регрессия (Logistic Regression), а также алгоритмы адаптивного бустинга (Аdaboost) и случайный лес (Random Forest)

, , , .

Все применяемые методы подразумевают обучение с учителем. При таком подходе сначала происходит калибровка алгоритма на заранее подготовленном наборе данных с уже известными метками классов, после чего алгоритм на основании откалиброванных параметров проводит анализ новых данных, определяя их метки классов.

Также для улучшения результатов на небольшом наборе данных был применён метод кросс-валидации. Он основан на разделении данных на приблизительно равные части (чаще всего 3 или 5 частей, но возможно использовать любое количество) и использовании одной части в качестве тестового набора данных, а остальных — в качестве тренировочного. В ходе каждой итерации происходит смена используемого тестового набора, что позволяет оптимизировать выходные параметры практически любого алгоритма. В данной работе было принято решение использовать деление на 5 частей.

7. Анализ результатов работы алгоритмов

Для анализа результатов были использованы несколько способов. Первый способ заключается в использовании тестовых референсных сегментов для изображения. Данные о результатах представлены в таблице 2. Для определения наиболее подходящего фрагмента были выбраны метрики Accuracy, Precision, Recall и F1 score.

Таблица 2 - Результаты сравнения качества алгоритмов на тестовых сегментах

DOI:10.60797/IRJ.2025.160s.12.4

Название алгоритма	Accuracy, %	Precision, %	Recall, %	F1 score, %
SVM	50	0	0	0
Decision Tree	70	63	100	77
Logistic Regression	50	80	10	10
Adaboost	50	50	60	55
Random Forest	80	71	100	83

На основании полученных данных можно уже сделать вывод, что такие алгоритмы как Logistic Regression и Support Vector Machine (SVM) плохо справляются с данной задачей и, скорее всего, не будут использованы в дальнейших разработках. Тогда как наилучшим образом показали себя алгоритмы Decision Tree и Random Forest.

Вторым способом проверки было выбрано создание маски для сегмента изображения размерами 100х100х1 вокселей. Данные размеры были выбраны для упрощения визуализации и анализа. Результаты анализа представлены в таблице 3. В качестве характеристических значений полученных результатов были использованы метрики Accuracy, Recall и IoU (Intersection over Union).

Таблица 3 - Результаты формирования маски для сегмента 100х100х1 вокселей

DOI:10.60797/IRJ.2025.160s.12.5

Название алгоритма	Accuracy, %	Recall, %	IoU, %
SVM	50	0	0
Decision Tree	62	100	37
Logistic regression	26	8	8
Adaboost	34	43	5
Random Forest	74	100	44

На рисунках 3–7 представлены результаты формирования маски различными алгоритмами в сравнении размеченной вручную маской.

Рисунок 3 - Маски выбранного референсного сегмента, созданные вручную (слева) и алгоритмом SVM (справа)

Рисунок 4 - Маски выбранного референсного сегмента, созданные вручную (слева) и алгоритмом Adaboost (справа)

Рисунок 5 - Маски выбранного референсного сегмента, созданные вручную (слева) и алгоритмом Logistic Regression (справа)

Рисунок 6 - Маски выбранного референсного сегмента, созданные вручную (слева) и алгоритмом Decision Tree (справа)

Рисунок 7 - Маски выбранного референсного сегмента, созданные вручную (слева) и алгоритмом Random Forest (справа)

На основании второго эксперимента опять же можно признать значительное превосходство качества результатов алгоритмов Decision Tree и Random Forest. Именно эти алгоритмы планируется использовать в дальнейших разработках данного метода. Результаты обоих экспериментов дают основу для дальнейшей работы по улучшению качества алгоритма.

8. Заключение

В результате работы был достигнут значительный прогресс в выполнении заранее определенных задач. Был проведён тщательный анализ научных источников, включая академические журналы, конференционные материалы и другие публикации, что позволило сформировать достаточную базу данных для последующего сравнения и выбора аналогов. В результате этого анализа были выработаны ключевые критерии и условия, которые должен был удовлетворять разрабатываемый алгоритм, чтобы соответствовать поставленным целям.

Далее был создан универсальный алгоритм, способный удовлетворить эти условия. Этот алгоритм был спроектирован таким образом, чтобы быть гибким и адаптивным, обладая возможностью интеграции с различными типами данных и сценариями использования. В ходе разработки было уделено особое внимание анализу основных типов алгоритмов машинного обучения, что позволило идентифицировать и выбрать наиболее эффективный и подходящий вариант для решения конкретной задачи. Выбранный алгоритм демонстрирует высокую степень точности и надежности, что подтверждается результатами тестирования и валидации.

В рамках текущего исследования был проведен глубокий анализ потенциальных направлений для дальнейшего усовершенствования и модификации разработанного алгоритма. Одним из ключевых аспектов, который был выделен как приоритетный, является создание механизма для систематического накопления референсных сегментов бронхиального дерева. Это позволит значительно расширить и обогатить используемый датасет, что, в свою очередь, улучшит качество и точность алгоритма за счет обучения на более разнообразной и представительной выборке данных.

Дополнительные модификации, которые были предложены для внедрения, включают в себя улучшенную визуализацию исходных изображений с применением наложенной маски сегментации. Это не только облегчит визуальный анализ результатов работы алгоритма, но и позволит пользователям более интуитивно оценивать точность сегментации. Также была предложена фильтрация входных изображений для подавления шумов, что улучшит четкость изображений и повысит общую точность сегментации.

Предложенные улучшения и модификации открывают новые возможности для повышения эффективности алгоритма и его применения в клинической практике, что может оказать значительное влияние на диагностику и лечение респираторных заболеваний.

Дополнительные материалы

Не указаны

Финансирование

Авторы не получали финансовой поддержки для проведения исследования, написания и публикации статьи

Благодарности

Не указаны

Конфликт интересов

Не указаны

Список литературы

Хвастунов Р.А.
Возможности бронхопластических операций при раке легких
/ Р.А. Хвастунов, А.А. Усачев //
Евразийский союз ученых
. — 2015. — 1–2 (18). — C. 43–46.
Litjens G.
A survey on deep learning in medical image analysis
/ G. Litjens, T. Kooi, B.E. Bejnordi //
Medical Image Analysis
. — 2017. — 42. — P. 60–88. — DOI: 10.1016/j.media.2017.07.005
Mader S.
Finding and Measuring Lungs in CT Data
/ S. Mader //
Kaggle
. — 2007. — URL: https://www.kaggle.com/datasets/kmader/finding-lungs-in-ct-data?resource=download&select=3d_images.zip (accessed: 03.11.23)
Scikit learn Userguide // Scikit learn. — URL: https://scikit-learn.org/stable/modules/model_evaluation.html (accessed: 16.02.24)
Texture classification
//
Machine learning for engineers
. — 2023. — URL: https://apmonitor.com/pds/index.php/Main/TextureClassification (accessed: 12.12.23)
Witten I.H.
Data Mining: Practical machine learning tools and techniques
/ I.H. Witten. — San Francisco: Burlington, 2016. — 630 p.
Zhu Y.
Logistic Regression–Based Trichotomous Classification Tree and Its Application in Medical Diagnosis
/ Y. Zhu, J. Fang //
Medical Decision Making
. — 2016. — 8. — P. 973–989.
Batra M.
Comparative analysis of decision tree algorithms
. / M. Batra, R. Agrawal //
Nature Inspired Computing
; — Singapore: Springer, 2018. — P. 31–36.
Criminisi A.
Decision forests for computer vision and medical image analysis
/ A. Criminisi, J. Shotton. — London: Springer, 2013. — 387 p.
Khan S.A.
Lungs nodule detection framework from computed tomography images using support vector machine
/ S.A. Khan, M. Nazir, M.A. Khan //
Microscopy Research and Technique
. — 2019. — 82. — P. 1256–1266. — DOI: 10.1002/jemt.23275

Рецензия

Все статьи проходят рецензирование. Но рецензент или автор статьи предпочли не публиковать рецензию к этой статье в открытом доступе. Рецензия может быть предоставлена компетентным органам по запросу.

Информация об авторах

АффилиацияУральский федеральный университет имени первого Президента России Б. Н. Ельцина, Екатеринбург, Российская Федерация

Роль:Автор, Визуализация, Написание, проверка и редактирование, Написание черновика статьи и её подготовка, Анализ данных исследования

АффилиацияУральский Федеральный Университет имени первого Президента России Б. Н. Ельцина, Екатеринбург, Российская Федерация

Роль:Автор, Концептуализация, Методология, Руководство, Написание, проверка и редактирование

ORCID:0000-0002-7312-7219

ELIBRARY AUTHOR ID:7403688309

RESEARCHER ID:GWC-4301-2022

Метрика статьи

Скачиваний:0

ПросмотрыСкачивания

Просмотры

Всего: