Wykorzystanie technologii deep learning w neuroobrazowaniu: nowa metoda 3D-to-2D uczenia wiedzy

Technologie deep learning nieustannie rewolucjonizują analizę obrazów medycznych, w tym neuroobrazowanie. Jednym z najnowszych odkryć w tej dziedzinie jest wykorzystanie sieci neuronowych 3D CNN (Convolutional Neural Networks), które charakteryzują się wysoką skutecznością w analizie obrazów wolumetrycznych. Jednakże wymagają one dużych zbiorów danych, których pozyskanie w medycynie może być kosztowne i czasochłonne. Alternatywą stają się sieci 2D CNN, które przetwarzają obrazy 3D na dwuwymiarowe projekcje. Choć metoda ta pozwala ominąć problem obszernych zbiorów danych, ogranicza dostęp do pełnego kontekstu wolumetrycznego, co może wpływać na dokładność diagnozy.

W takiej sytuacji rozwiązaniem są techniki transferu wiedzy (transfer learning) oraz destylacji wiedzy (knowledge distillation, KD). Pozwalają one korzystać z pretrenowanych modeli, przenosząc zdobytą wiedzę z bardziej złożonych sieci (nauczycieli) do prostszych modeli (uczniów). Dzięki takim metodom, modele mogą utrzymać wysoką skuteczność, jednocześnie ograniczając zapotrzebowanie na duże zbiory danych. Stanowią one odpowiedź na wyzwania, jakie niesie analiza obrazów medycznych w warunkach ograniczonych zasobów.

Przejście z obrazowania 3D do 2D – ewolucja podejścia

W tradycyjnym podejściu do analizy neuroobrazów techniki projekcji 2D opierają się na wycinaniu pojedynczych, reprezentatywnych przekrojów z obrazów 3D. Dla lepszego ujęcia informacji diagnostycznych stosuje się m.in. metody oparte na entropii Shannona, wybierając najbardziej znaczące przekroje. Popularne rozwiązanie 2D+e łączy różne przekroje, aby wzbogacić analizę. Destylacja wiedzy, wprowadzona przez Hinton’a, umożliwia przenoszenie informacji z bardziej złożonych modeli (np. 3D) do prostszych (np. 2D). Co więcej, rozwijane są nowoczesne warianty destylacji, m.in. oparte na danych multimodalnych (cross-modal KD) oraz na analizie relacji między próbkami (relation-based KD).

Pomimo tych innowacji, dotychczasowe badania rzadko uwzględniały relacje wolumetryczne w obrazach 3D podczas destylacji wiedzy do sieci 2D, choć potencjał tej techniki w poprawie precyzji przy ograniczonych danych jest ogromny.

Nowatorska koncepcja 3D-to-2D KD od naukowców z Dong-A University

Nowe podejście, zaproponowane przez badaczy z Dong-A University, wykorzystuje metodę destylacji wiedzy 3D-to-2D w celu poprawy zdolności sieci 2D CNN do asymilacji informacji wolumetrycznej z niewielkich zbiorów danych. Proponowane rozwiązanie opiera się na trzech kluczowych komponentach:

1. Sieć nauczyciela (3D): Uczy się ona reprezentacji wolumetrycznych obrazów, wykorzystując zmodyfikowaną architekturę ResNet18.
2. Sieć ucznia (2D): Skupia się na analizie wybranych części obrazu 3D, przetworzonych w 2D.
3. Strata destylacji wiedzy (distillation loss): Służy do dopasowania cech między siecią nauczyciela a ucznia, umożliwiając przekazanie istotnych informacji.

Metodę tę zastosowano do analizy choroby Parkinsona na podstawie dwóch zestawów danych: obrazów SPECT (123I-DaTscan) oraz PET (18F-AV133). Wyniki okazały się imponujące – uzyskano wynik F1 na poziomie 98,3%. Co istotne, metoda nie zależy od konkretnego rodzaju projekcji, skutecznie łącząc dane 3D i 2D.

Wyższa jakość analizy dzięki innowacji

Badanie podkreśla wyjątkowe możliwości algorytmu w porównaniu do wcześniejszych podejść, które opierały się głównie na prostych wycinkach 2D lub podstawowych kombinacjach cech. Wprowadzenie tzw. strategii „częściowego ograniczenia danych wejściowych” (partial input restriction) pozwoliło na bardziej precyzyjne odwzorowanie danych wolumetrycznych. W ramach tej strategii zastosowano różnorodne metody przetwarzania obrazów 3D na 2D, w tym:

– pojedyncze przekroje,
– fuzję na poziomie kanałów (early fusion),
– fuzję na poziomie cech pośrednich (joint fusion),
– dynamiczne obrazy na bazie rank-poolingu.

Wyniki analizy wskazują, że metoda joint fusion w połączeniu z destylacją wiedzy osiągnęła najlepszą skuteczność, porównywalną z pełnym modelem 3D. Ciekawostką okazało się, że w analizie zewnętrznego zbioru danych PET sieć 2D uczona dzięki KD przewyższyła swojego nauczyciela 3D. W przeprowadzonych badaniach wykazano także, że funkcja straty oparta na cechach (Lfg) ma większy wpływ na jakość modelu niż klasyczna strata oparta na logitach (Llg).

Podsumowanie

Propozycja naukowców z Dong-A University wyróżnia się na tle tradycyjnych systemów opartych na sieciach 2D CNN. Kluczowym elementem sukcesu jest integracja danych wolumetrycznych 3D z analizą 2D dzięki procesowi destylacji wiedzy. Nowatorski algorytm znacząco zmniejsza zapotrzebowanie na zasoby obliczeniowe, jednocześnie korzystając z wglądu wolumetrycznego w celu poprawy dokładności. Metoda sprawdziła się w różnych modalnościach danych, takich jak obrazowanie SPECT i PET, co czyni ją wszechstronnym narzędziem do zastosowania w medycynie. Wyniki dowodzą, że zastosowanie tego podejścia pozwala osiągnąć wysoką jakość analizy nawet przy ograniczonych zbiorach danych, czyniąc to rozwiązanie przyszłością w diagnostyce medycznej.