Systemy rekomendacji są powszechnie stosowane do badania preferencji użytkowników, jednak napotykają na istotne wyzwania związane z dokładnym uchwyceniem tych preferencji, szczególnie w kontekście neural graph collaborative filtering (neuralne współdzielone filtrowanie grafowe). Systemy te wykorzystują historię interakcji między użytkownikami a przedmiotami za pomocą sieci neuronowych grafów (GNN), aby wydobywać ukryte informacje i uchwycić interakcje wyższego rzędu. Jednak jakość zebranych danych pozostaje poważnym problemem. Dodatkowo ataki, które wprowadzają fałszywe interakcje, jeszcze bardziej pogarszają jakość rekomendacji. Problem staje się szczególnie palący w przypadku neural graph collaborative filtering, gdzie mechanizm przekazywania wiadomości w GNN wzmacnia wpływ tych szumów, co prowadzi do niedopasowanych rekomendacji, które nie odzwierciedlają rzeczywistych zainteresowań użytkowników.

Podejścia do rozwiązania problemu

Obecne próby rozwiązania tych problemów koncentrują się głównie na dwóch podejściach: systemach rekomendacji redukujących szum oraz systemach uwzględniających czas. Metody redukcji szumów wykorzystują różnorodne strategie, takie jak identyfikowanie i obniżanie wagi interakcji między niepodobnymi użytkownikami i przedmiotami, odrzucanie próbek o większych stratach w trakcie treningu oraz korzystanie z pamięciowych technik do identyfikowania czystych próbek. Z kolei systemy uwzględniające czas są szeroko stosowane w rekomendacjach sekwencyjnych, ale mają ograniczone zastosowanie w kontekście współdzielonego filtrowania. Większość podejść temporalnych skupia się na integracji znaczników czasowych w modele sekwencyjne lub konstruowaniu grafów przedmiotów w oparciu o porządek czasowy, ale nie radzą sobie złożonymi interakcjami między wzorcami czasowymi a szumem w interakcjach użytkowników.

Nowa metoda DeBaTeR

Naukowcy z University of Illinois w Urbana-Champaign oraz Amazon USA zaproponowali innowacyjne podejście do redukcji szumów w systemach rekomendacji oparte na dwudzielnych grafach temporalnych, nazwane DeBaTeR. Metoda ta wprowadza dwie unikalne strategie: DeBaTeR-A oraz DeBaTeR-L.

DeBaTeR-A koncentruje się na ponownej wyważeniu macierzy sąsiedztwa za pomocą wyniku wiarygodności, który pochodzi z czasowo-świadomych osadzeń użytkowników i przedmiotów. Implementowane są tu zarówno miękkie, jak i twarde mechanizmy przypisywania, aby radzić sobie z szumami w interakcjach.
DeBaTeR-L z kolei wykorzystuje generator wag, który bazując na czasowo-świadomych osadzeniach, identyfikuje i obniża wagę potencjalnie szumowych interakcji w funkcji straty.

Proces ewaluacji i wyniki

Aby dokładnie ocenić wydajność DeBaTeR w zakresie przewidywania oraz redukcji szumów, opracowano wszechstronny proces ewaluacji, który obejmuje zarówno czyste, jak i sztucznie zaszumione zestawy danych. W przypadku czystych zestawów, zastosowano specyficzne kryteria filtrowania, aby zachować jedynie interakcje wysokiej jakości (oceny ≥ 4 dla Yelp i ≥ 4,5 dla Amazon Movies and TV) od użytkowników i przedmiotów z dużą liczbą interakcji (ponad 50 recenzji). Dane zostały podzielone w proporcji 7:3 na zestawy treningowe i testowe, a szumowe warianty stworzono, wprowadzając 20% losowych interakcji do zestawów treningowych. Ewaluacja uwzględniała również aspekty temporalne, wykorzystując najwcześniejszą sygnaturę czasową z zestawu testowego jako czas zapytania dla każdego użytkownika, a wyniki uśredniono na przestrzeni czterech rund eksperymentalnych.

Wyniki eksperymentów odpowiedziały na pytanie: „Jak proponowane podejście wypada w porównaniu z najnowocześniejszymi metodami redukcji szumów oraz ogólnymi metodami neural graph collaborative filtering?”. Obie wersje DeBaTeR wykazały przewagę nad istniejącymi metodami na wielu różnych zestawach danych oraz miarach. DeBaTeR-L osiągnął wyższe wyniki NDCG, co czyni go bardziej odpowiednim do zadań związanych z rankingami, podczas gdy DeBaTeR-A uzyskał lepsze wyniki w zakresie precyzji i czułości, co wskazuje na jego skuteczność w zadaniach dotyczących wyszukiwania. Co więcej, DeBaTeR-L wykazał większą odporność na szumowe zestawy danych, przewyższając DeBaTeR-A na większej liczbie miar w porównaniu do ich wydajności na czystych zestawach.

Przyszłe kierunki rozwoju

W przedstawionej pracy naukowcy zaprezentowali DeBaTeR jako innowacyjne podejście do redukcji szumów w systemach rekomendacji, wykorzystujące generowanie czasowo-świadomych osadzeń. Dualne strategie – ponowne wyważanie macierzy sąsiedztwa (DeBaTeR-A) oraz ponowne wyważanie funkcji straty (DeBaTeR-L) – oferują elastyczne rozwiązania dla różnych scenariuszy rekomendacyjnych. Sukces metody tkwi w integracji informacji temporalnych z osadzeniami użytkowników i przedmiotów, co zostało potwierdzone wynikami z eksperymentów na rzeczywistych zestawach danych. Przyszłe badania mogą skupić się na eksploracji dodatkowych algorytmów neural graph collaborative filtering, które uwzględniają czas, oraz na rozszerzeniu możliwości redukcji szumów o profile użytkowników i atrybuty przedmiotów.

Podsumowanie

DeBaTeR to nowoczesne rozwiązanie w dziedzinie systemów rekomendacyjnych, które skutecznie radzi sobie z problemem szumów w interakcjach użytkowników, oferując elastyczność i wydajność w różnych scenariuszach rekomendacyjnych. Wprowadzając element temporalny, metoda ta otwiera nowe drzwi do bardziej precyzyjnych i trafnych rekomendacji, co może mieć ogromny wpływ na przyszłość technologii rekomendacyjnych.