Wykorzystanie grafów wiedzy w finansach, a zwłaszcza w zadaniach związanych z analizą konkurencji, staje się coraz bardziej popularne. Grafy te pozwalają na organizację i analizowanie skomplikowanych danych, co umożliwia wyciąganie wniosków na temat konkurencji i odkrywanie powiązań między firmami. Dzięki swojej elastyczności, grafy wiedzy mogą zastąpić tradycyjne, manualne metody zbierania i analizy danych, oferując większą skalowalność oraz szersze zastosowanie. Aby jeszcze bardziej zwiększyć efektywność takiego rozwiązania, grafy wiedzy można połączyć z technikami osadzania grafów. Jednak w kontekście finansowym, istnieje wiele wyzwań związanych z tym podejściem, takich jak relacje skierowane i nieskierowane, atrybuty węzłów oraz ograniczona liczba oznaczonych połączeń konkurencji. Obecne metody osadzania grafów są ograniczone przez złożoną strukturę tych sieci, co sprawia, że ich skuteczność w dziedzinie finansów jest mniejsza. Właśnie dlatego badania nad wykorzystaniem sieci neuronowych dla grafów mogą przynieść znaczące ulepszenia w zakresie analizy konkurencji.

Badacze z JPMorgan Chase zaproponowali nowatorskie rozwiązanie o nazwie JPMorgan Proximity Embedding for Competitor Detection (JPEC). Jest to grafowa sieć neuronowa, która ma na celu poprawę identyfikacji konkurencji w grafach wiedzy finansowej. JPEC wykorzystuje sieci neuronowe do analizy i nauki relacji pomiędzy węzłami na podstawie ich sąsiedztwa pierwszego i drugiego stopnia, co pozwala na bardziej efektywne wychwytywanie wzorców konkurencji. W grafach finansowych, krawędzie wskazujące na konkurencyjność są zazwyczaj rzadkością, ale stanowią klucz do zrozumienia relacji pomiędzy firmami. Proximity pierwszego stopnia jest kluczowy w opisie lokalnych połączeń i wykorzystywany jako nadzorowana informacja, która ogranicza podobieństwo ukrytych reprezentacji między parami konkurentów. Natomiast proximity drugiego stopnia umożliwia jednoczesne uczenie się struktury grafu i atrybutów węzłów przy użyciu autoenkoderów grafowych (GCN). Co ciekawe, tradycyjnie sieci neuronowe oparte o grafy były projektowane do pracy na grafach nieskierowanych, jednak autorzy badania wykorzystali funkcję propagacji w GCN, aby zastosować ją również do grafów skierowanych.

Model JPEC dodatkowo wykorzystuje dekoder, który kompensuje rzadkość krawędzi konkurencji, co pozwala na lepsze wydobywanie informacji z grafów opisujących łańcuchy dostaw. Funkcja straty dla proximity drugiego stopnia minimalizuje różnicę między oryginalnymi wektorami cech węzłów a ich odtworzonymi odpowiednikami.

W badaniu, model ten został przetestowany na zestawie danych z dużego grafu wiedzy finansowej, który zawierał różne podmioty finansowe, takie jak firmy, inwestorzy i bankierzy, oraz ich wzajemne powiązania. Badacze stworzyli dwa zestawy danych testowych: Regularny Zestaw Testowy oraz Zero-Shot Test Data. W przypadku zestawu Zero-Shot, wybrano podzestaw węzłów z grafu i usunięto wszystkie połączenia COMPETEWITH (wskazujące na konkurencję) pomiędzy tymi węzłami a resztą grafu, aby te węzły nie były widoczne w danych szkoleniowych. Drugi zestaw testowy, Regularny Zestaw Testowy, pozostawił wszystkie węzły, ale losowo zachował niektóre połączenia COMPETEWITH.

Podczas oceny efektywności, wyniki modeli były porównywane przy użyciu trzech metryk rankingowych: Hits, MRR (Mean Reciprocal Rank) oraz MAP (Mean Average Precision). Wyniki pokazały, że większość metod opartych na uczeniu maszynowym przewyższała ludzi w zadaniach wykrywania konkurencji na danych testowych. W przypadku zestawu Zero-Shot, metody osadzania oparte na strukturze grafu nie radziły sobie tak dobrze z tzw. problemem „zimnego startu”, natomiast metody osadzania wykorzystujące atrybuty węzłów sprawdzały się lepiej.

Podsumowując, model JPEC wykorzystuje dwie warstwy sąsiedztwa węzłów, aby poprawić jakość grafów wiedzy finansowej. Metoda ta przewyższa większość obecnych technik, w tym także ekspertów finansowych, którzy ręcznie przewidują konkurencję pomiędzy podmiotami. JPEC stanowi istotny krok naprzód, ukazując potencjał grafów wiedzy do odkrywania cennych wzorców w złożonych sieciach, zwłaszcza w zastosowaniach biznesowych.