Efekt tunelowania kwantowego (QT), odkryty w latach 20. XX wieku, stanowił przełomowe osiągnięcie w dziedzinie mechaniki kwantowej. Pomimo tego, że sztuczna inteligencja (AI) potrafi naśladować ludzkie zachowania w wielu obszarach, nadal boryka się z trudnościami w replikowaniu ludzkiej percepcji, zwłaszcza w przypadku złożonych iluzji optycznych, takich jak sześcian Neckera czy wazon Rubina. Ludzki mózg, w przeciwieństwie do systemów opartych na sztucznej inteligencji, bez trudu przełącza się pomiędzy różnymi interpretacjami tego typu wizualnych złudzeń. Sztuczna inteligencja nie jest w stanie tego dokonać z uwagi na fundamentalne różnice neurologiczne oraz psychologiczne między neuronami biologicznymi a sztucznymi.

Ograniczenia obecnych systemów wizji maszynowej

Obecne podejścia do wizji maszynowej, które opierają się na konwencjonalnych głębokich sieciach neuronowych (DNN) z popularnymi funkcjami aktywacji, takimi jak ReLU, mają poważne ograniczenia w odtwarzaniu ludzkiej percepcji iluzji optycznych. Głębokie sieci neuronowe często nie są w stanie uchwycić fizycznych, fizjologicznych i psychologicznych czynników, które kierują ludzkim postrzeganiem, co sprawia, że imitowanie ludzkich zachowań staje się niezwykle trudne. Głębokie sieci neuronowe to systemy uczenia maszynowego, inspirowane strukturą i funkcjonowaniem ludzkiego mózgu, które składają się z wielu warstw węzłów – od warstwy wejściowej, przez ukryte warstwy, aż do warstwy wyjściowej.

Ludzki mózg, który z łatwością przełącza się między różnymi interpretacjami jednego bodźca wizualnego, wykazuje pewne cechy zbliżone do zachowań kwantowych, które tradycyjne sieci neuronowe nie są w stanie naśladować. W odpowiedzi na te ograniczenia, naukowcy z Uniwersytetu Charles Sturt w Australii zaproponowali nowy model głębokiej sieci neuronowej, oparty na zasadach tunelowania kwantowego, nazwany QT-DNN (Quantum Tunneling Deep Neural Network).

Innowacyjny model QT-DNN

Model QT-DNN został przetestowany na przykładach iluzji optycznych, takich jak sześcian Neckera i wazon Rubina. Kluczowa innowacja zespołu badawczego polega na zastosowaniu równań prawdopodobieństwa tunelowania kwantowego jako funkcji aktywacji dla węzłów w ukrytych warstwach sieci, zastępując klasyczne funkcje aktywacji, takie jak sigmoid czy ReLU. W odróżnieniu od tradycyjnych sieci neuronowych, QT-DNN wykorzystuje fizyczny kwantowy generator liczb losowych, co zapewnia nieobciążone przetwarzanie informacji wizualnych.

Architektura QT-DNN składa się z warstwy wejściowej zawierającej 100 węzłów, trzech ukrytych warstw z 20 węzłami każda oraz warstwy wyjściowej z dwoma węzłami, które odpowiadają za klasyfikację. Model ten potrafi nie tylko przełączać się między różnymi interpretacjami iluzji, ale również inicjować stany pośrednie, które reprezentują superpozycję wielu percepcji – zjawisko łatwo zauważalne u ludzi, ale trudne do zreplikowania w klasycznych sieciach neuronowych. W porównaniu z tradycyjnymi sieciami neuronowymi, QT-DNN wykazała lepszą zgodność z przewidywaniami teoretycznymi modeli kwantowych oraz z obserwacjami ludzkiej percepcji w eksperymentach.

Zastosowanie w praktyce

QT-DNN, zaprojektowana na podstawie zasad mechaniki kwantowej, stanowi unikalne podejście do zmniejszenia różnicy między percepcją maszynową a ludzką. Model ten może znaleźć swoje zastosowanie w dziedzinach, które wymagają przetwarzania wizualnego zbliżonego do ludzkiego, takich jak bezpieczeństwo lotnictwa, systemy rozszerzonej rzeczywistości oraz diagnostyka medyczna.

Badania te otwierają nowe możliwości rozwoju bardziej zaawansowanych systemów sztucznej inteligencji, które będą lepiej interpretować informacje wizualne w sposób zbliżony do ludzkiej percepcji.