CNN с комплексным знаком для шумоподавления медицинских изображений

Новый подход к шумоподавлению медицинских изображений

Глубокое обучение, особенно сверточные нейронные сети (CNN), формируют будущее решения проблем на основе данных. От проблем, связанных с текстом, таких как генерация речи, написание контента и т. Д., До задач зрения, таких как классификация изображений, обнаружение объектов, CNN широко используются. За последние несколько лет было предложено множество передовых архитектур CNN, таких как графовые CNN, CNN на основе внимания, комплексные CNN и т. д. Для шумоподавления медицинских изображений предлагается модель глубокого обучения.

ВВЕДЕНИЕ

Медицинская визуализация произвела революцию в секторе здравоохранения, помогая медицинским работникам несколькими способами, включая диагностику заболеваний, лечение и прогнозирование рисков. Однако медицинские изображения, такие как рентген, компьютерная томография (КТ), ультразвук и магнитно-резонансная томография (МРТ), чувствительны к различным видам шума. Например, изображения рентгена грудной клетки (CXR) часто искажаются гауссовским шумом, который возникает во время получения, хранения, передачи и обработки. Шум на медицинских изображениях ухудшает качество изображений и даже делает их непригодными для диагностики. Это может препятствовать дальнейшему принятию решений, приводя к плохой диагностике, лечению или анализу заболевания. Поэтому всегда существует острая необходимость уменьшить шум от медицинских изображений, не нанося вреда потенциальной информации, поскольку полученная диагностика напрямую влияет на здоровье и жизнь людей.

Некоторые из традиционных методов шумоподавления медицинских изображений (MID) включают базовые цифровые фильтры изображений, адаптивные фильтры, алгоритм нелокальных средних и многомасштабные методы. Однако сложный шум в медицинских изображениях приводит к неудовлетворительной работе этих методов. «Затем идут сверточные нейронные сети (CNN)». Без сомнения, CNN доминировали в качестве решения для множества задач, связанных с данными, особенно для обработки изображений. Для MID сообщалось о различных архитектурах на основе CNN, таких как сверточные автокодировщики и генеративно-состязательные сети (GAN). Эти методы CNN включают две архитектуры CNN, например, в GAN у нас есть генератор и дискриминатор, а в автоэнкодерах у нас есть кодировщик и декодер. Однако существует множество методов, использующих только одну архитектуру CNN, такую как DnCNN.

Учитывая подходы на основе CNN для MID, можно сделать вывод, что все эти методы включают действительные CNN, т. Е. Архитектуры CNN, работающие с действительными числами. Это побудило меня разработать CVCNN для MID, и, как вы могли догадаться, это первая исследовательская работа, реализующая CVCNN для MID (также это моя первая исследовательская работа).

В последнее время CNN с комплексными значениями (CVCNN) приобрели популярность, поскольку они обеспечивают лучшие результаты, чем их аналоги с действительными значениями, и благодаря достижениям в области аппаратного обеспечения реализация этих моделей стала возможной. Теперь возникают следующие вопросы:

Чем CVCNN лучше, чем их реальные аналоги
Как можно использовать CVCNN для MID

Я не буду в основном сосредотачиваться на первом вопросе, поскольку он выходит за рамки этой статьи, однако я могу написать еще одну статью, в которой будут изложены преимущества CVCNN по сравнению с их реальными аналогами, так что следите за обновлениями :)

ПРЕДЛАГАЕМЫЙ ПОДХОД

Предлагаемая модель CVCNN для MID называется CVMIDNet. Структура модели показана на рис. 1, где Conv, BN и ReLU представляют сверточный слой, пакетную нормализацию и выпрямленную линейную единичную функцию.

Ниже приведены основные компоненты модели:

Комплекснозначный сверточный слой (CVCL)

В CVCL операция свертки с действительным знаком обобщается на комплексную область. В сверточном слое с действительным знаком операция свертки выполняется между входной матрицей I и ядром с действительным знаком K, т. е. I*K. В комплекснозначном сверточном слое и I, и K являются комплексными матрицами, такими что:

I = Ir + iIc
K = Kr + iKc

где Ir, Ic, Kr и Kc — вещественные матрицы. Теперь комплексная операция свертки становится:

I*K = (Ir*Kr − Ic*Kc) + i(Ic*Kr + Ir*Kc)

Пакетная нормализация комплексных значений (CVBN)

Подобно CVCL, в CVBN операция BN с действительным знаком обобщается на комплексную область следующим образом:

CNB(Z) = BN(A) + i(BN(B))

где BN() и CNB() представляют операцию BN с действительным и комплексным знаком соответственно. Z — комплексный параметр, рассматриваемый как Z = A + iB

Комплекснозначный ReLU (CVReLU)

Когда дело доходит до обобщения функции активации с действительным знаком (в данном случае ReLU), у нас есть множество способов сделать это, и поэтому у нас есть разные версии CVReLU. Наиболее распространенные из них включают ModReLU, zReLU и CReLU. В литературе имеется достаточно свидетельств, указывающих на превосходную производительность CReLU по сравнению с другими потенциальными аналогами, особенно для задач, связанных с изображениями, и поэтому он был рассмотрен для CVMIDNet. CReLU получают следующим образом:

CReLU(z) = ReLU(R(z)) + i(ReLU(I(z)))

Где z, R(z) и I(z) представляют параметр с комплексным знаком, действительную часть z и мнимую часть z.

НАБОР ДАННЫХ И ДЕТАЛИ ЭКСПЕРИМЕНТА

В этом исследовании рассматривался общедоступный набор данных CXR-изображений (ссылка), в котором на изображения влиял гауссовский шум. Изображения CXR были рассмотрены для шумоподавления, поскольку они являются одним из наиболее важных типов методов медицинской визуализации из-за их экономической эффективности и неинвазивного метода. Было отобрано 400 изображений для обучения и 100 (не перекрывающихся с обучающей выборкой) изображений для тестовой выборки.

Коды для всей работы были разработаны на Python с использованием Tensorflow. Там, где это было необходимо, также разрабатывались пользовательские слои и генераторы данных.

ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ

Для оценки CVMIDNet учитывались пиковое отношение сигнал-шум (PSNR) и мера индекса структурного сходства (SSIM). Кроме того, модель сравнивалась с другими современными методами MID, такими как BM3D, DnCNN, FDCNN и т. д. Реальный аналог CVMIDNet (разработанный путем замены комплексных операций в CVMIDNet их вещественными аналогами) ), именуемый RVMIDNet, также рассматривался для оценки производительности.

Были рассмотрены многочисленные уровни гауссовского шума, а именно сигма = 15, 25, 40, 50 и 60 (сигма представляет собой уровень шума в гауссовском шуме, подробнее здесь). Результаты представлены в таблицах и рисунках ниже.

При сравнении с другими современными методами было обнаружено, что CVMIDNet превосходит все другие методы шумоподавления изображений CXR с гауссовым шумом для различных уровней шума.

ЗАКЛЮЧЕНИЕ

Впервые была предложена и реализована CVMIDNet, новая комплекснозначная модель глубокого обучения на основе CNN с остаточным обучением для шумоподавления медицинских изображений. CVMIDNet была реализована с использованием комплексного сверточного слоя, пакетной нормализации комплексных значений и активации CReLU для удаления гауссова шума из рентгеновских изображений грудной клетки. Эффективность шумоподавления CVMIDNet сравнивалась с четырьмя потенциальными современными методами шумоподавления, а именно: блочное сопоставление и трехмерная фильтрация, DnCNN, сверточная нейронная сеть с шумоподавлением и глубокая модель CNN с остаточным обучением в дополнение к RVMIDNet, где RVMIDNet имел ту же архитектуру, что и CVMIDNet, но все операции были действительными. Было замечено, что CVMIDNet превосходит все остальные модели со значительным отрывом на всех пяти исследованных уровнях шума. Кроме того, визуальная оценка также ясно показала, что CVMIDNet снижает уровень шума и восстанавливает изображения более эффективно, чем другие сравниваемые модели.

ЗАКЛЮЧИТЕЛЬНЫЕ ПРИМЕЧАНИЯ

Итак, это был краткий рассказ о моем исследовании нового подхода, который был принят в журнале: Обработка и управление биомедицинскими сигналами.

Если эта статья была для вас полезной, то другие мои статьи могут быть вам не менее интересны. Далее, если вы хотите или ищете разработку таких моделей, вы можете связаться со мной на FIVERR: https://www.fiverr.com/shubhankarrawat

ПРИЯТНОГО ОБУЧЕНИЯ!!