Innowacyjne podejście do śledzenia wiedzy uczniów: model DKT2

Śledzenie wiedzy uczniów (Knowledge Tracing, KT) odgrywa kluczową rolę w inteligentnych systemach nauczania (Intelligent Tutoring Systems, ITS). Jego głównym celem jest modelowanie stanu wiedzy uczniów oraz przewidywanie ich przyszłych wyników. Dotychczasowe podejścia, takie jak Bayesian Knowledge Tracing (BKT) czy Deep Knowledge Tracing (DKT) bazujące na głębokich sieciach neuronowych, pozwalały na analizowanie interakcji uczniów w procesie nauczania. Jednak współczesne modele, takie jak Attentive Knowledge Tracing (AKT), coraz bardziej skupiają się na precyzji przewidywań, często kosztem praktycznego zastosowania i kompleksowego modelowania wiedzy. Modele te borykają się z wieloma wyzwaniami, takimi jak ograniczona zdolność do równoległego przetwarzania danych, trudności w modyfikacji zapisanej wiedzy oraz niewystarczająca pojemność pamięci. Co więcej, wiele z nich uzależnia swoje działanie od przyszłych interakcji, które w rzeczywistości są często niedostępne, co ogranicza ich użyteczność. Kluczowym wyzwaniem pozostaje zatem stworzenie modelu, który będzie jednocześnie skalowalny, interpretowalny i efektywny w rzeczywistych zastosowaniach edukacyjnych.

Problemy współczesnych modeli KT

Obecne modele KT korzystają z architektur opartych na głębokim uczeniu, takich jak sieci LSTM (Long Short-Term Memory), które umożliwiają analizę dynamiki procesu uczenia się. Modele wykorzystujące mechanizmy uwagi, np. AKT, poprawiają zdolność do odczytu zależności długozasięgowych, jednak opierają się na danych przyszłych odpowiedzi uczniów, co wyklucza ich zastosowanie w praktyce. Ponadto, głębokie modele sekwencyjne miewają problemy z równoległym przetwarzaniem danych i wydajnością pamięciową, co utrudnia ich wykorzystanie w przypadku dużych zbiorów danych. Alternatywne podejścia, takie jak modele oparte na grafach czy pamięci rozszerzonej, są często słabo interpretowalne, ponieważ nie dostarczają jasnych wniosków na temat procesu uczenia się ucznia. W efekcie istnieje luka między teorią a praktyką, która wymaga opracowania bardziej zaawansowanego modelu KT.

Przełomowy model DKT2

Zespół badaczy z Uniwersytetu Zhejiang zaproponował nowe rozwiązanie – model DKT2, który wykorzystuje architekturę xLSTM w celu przezwyciężenia ograniczeń dotychczasowych metod. Model ten wyróżnia się zastosowaniem modelu Rascha do ulepszenia reprezentacji danych wejściowych oraz włączeniem teorii odpowiedzi na pytania (Item Response Theory, IRT) w celu zwiększenia interpretowalności wyników. Dzięki identyfikacji znanych i nieznanych obszarów wiedzy, DKT2 oferuje dokładniejszy obraz procesu uczenia się uczniów. Wykorzystanie xLSTM umożliwia dynamiczne podejmowanie decyzji o przechowywaniu danych, zwiększoną pojemność pamięci i pełną równoległość, co znacząco poprawia skalowalność oraz wydajność. Innowacja ta pozwala na uzyskanie lepszej dokładności przewidywań w porównaniu do wcześniejszych modeli, jednocześnie zachowując szerokie możliwości zastosowań.

Systematyczna analiza modelu

Model DKT2 posiada złożony proces analizy, który obejmuje różnorodne elementy wspierające lepsze zrozumienie interakcji uczeń-pytanie. Dzięki implementacji wbudowanych bloków xLSTM (sLSTM oraz mLSTM), model pozwala na lepsze zarządzanie pamięcią, optymalizację równoległego przetwarzania oraz dynamiczne aktualizowanie wiedzy. Moduł predykcji w oparciu o IRT oraz dekompozycja wiedzy umożliwiają oddzielenie znanych i nieznanych obszarów wiedzy, co czyni model bardziej interpretowalnym. Dodatkowo, mechanizm fuzji wiedzy integruje historyczne stany wiedzy z przewidywaniami na temat przyszłych pytań, tworząc kompleksowy obraz postępów ucznia. Model został przetestowany na trzech dużych zestawach danych – Assist17, EdNet i Comp – co potwierdza jego skuteczność w zastosowaniach praktycznych.

Wyniki badań i zastosowania praktyczne

Eksperymenty przeprowadzone na wspomnianych dużych zbiorach danych udowodniły, że DKT2 konsekwentnie przewyższa 17 innych modeli w różnych zadaniach predykcyjnych, takich jak przewidywanie jedno- i wieloetapowe czy analiza historii o zmiennym zakresie. Model osiąga wyższą dokładność, wyższe wartości AUC oraz niższy błąd średniokwadratowy (RMSE) w porównaniu z głębokimi modelami sekwencyjnymi, takimi jak DKT, oraz modelami opartymi na uwadze, np. AKT. Integracja xLSTM znacząco zwiększa zdolność do równoległego przetwarzania danych oraz pojemność pamięci, skutecznie eliminując błędy w wieloetapowych przewidywaniach. Z kolei zastosowanie modelu Rascha i IRT zapewnia większą interpretowalność wyników, efektywnie wyróżniając znane i nieznane obszary wiedzy ucznia. Badania ablacjyjne dowodzą, że każdy element DKT2 odgrywa istotną rolę w jego doskonałej wydajności, szczególnie moduł mLSTM, który okazuje się kluczowy dla skalowalności w dużych zbiorach danych.

Przyszłość modelu DKT2

Model DKT2 stanowi przełom w dziedzinie śledzenia wiedzy uczniów, łącząc innowacyjną architekturę xLSTM, model Rascha oraz teorię IRT w celu osiągnięcia równowagi między precyzją przewidywań a praktycznym zastosowaniem. Jego zdolność do generowania interpretowalnych stanów wiedzy oraz równoległego, pamięciooszczędnego uczenia czyni go skalowalnym i przydatnym narzędziem w systemach edukacji adaptacyjnej. Dalsze prace nad modelem mogą skoncentrować się na rozszerzeniu jego zastosowań do ultra-dużych zbiorów danych oraz poprawie zdolności przewidywania wielokonceptowego, co pozwoli na jeszcze lepsze wsparcie spersonalizowanych systemów nauczania.