Odkrywanie nowych leków jest kosztownym i czasochłonnym procesem o wysokim wskaźniku niepowodzeń. Statystyki sugerują, że tylko jeden obiecujący lek zostaje wyłoniony spośród miliona badanych związków chemicznych. Nowoczesne technologie, takie jak wysokowydajne (HTS) i ultra-wysokowydajne (uHTS) przeszukiwanie związków chemicznych, umożliwiają szybkie testowanie ogromnych bibliotek związków, co pozwala firmom farmaceutycznym i biotechnologicznym na eksplorowanie większej liczby związków chemicznych oraz nowych biologicznych celów molekularnych. Mimo tych technologii, ciągle istnieją wyzwania, takie jak ograniczone postępy w identyfikacji nowych celów farmakologicznych oraz problemy z jakością danych. Jednakże, wykorzystanie uczenia maszynowego (ML) i głębokiego uczenia (DL) oferuje obiecujące rozwiązania, które mogą znacząco przyspieszyć odkrywanie leków, dostarczając wglądów opartych na danych, automatycznie wyodrębniając istotne cechy i przewidując skuteczność związków chemicznych.

VirtuDockDL – Nowoczesne narzędzie do odkrywania leków

VirtuDockDL to platforma opracowana przez zespół badaczy z Instytutu Biologii Molekularnej i Biotechnologii Uniwersytetu w Lahore, Laboratorium Integracyjnej Omiki i Modelowania Molekularnego na Government College University Faisalabad (GCUF), Uniwersytetu w Shenzhen oraz Uniwersytetu Taif. Jest to rozwiązanie oparte na języku Python, wykorzystujące głębokie uczenie do uproszczenia procesu odkrywania nowych leków. Platforma ta wykorzystuje Sieć Neuronową na Grafach (GNN) do przewidywania skuteczności związków chemicznych, co pozwala na uzyskanie imponującej 99% dokładności na zestawie danych HER2, co przewyższa narzędzia takie jak DeepChem oraz AutoDock Vina. Automatyzacja tego narzędzia obejmuje konstrukcję molekularnych grafów, wirtualne przeszukiwanie oraz klasteryzację związków, co znacznie przyspiesza proces identyfikacji potencjalnych leków i przyczynia się do rozwoju badań farmaceutycznych opartych na sztucznej inteligencji.

Techniczne aspekty działania VirtuDockDL

VirtuDockDL to kompleksowa ścieżka, która automatyzuje proces przewidywania i selekcji biologicznie aktywnych związków, korzystając z Sieci Neuronowej na Grafach (GNN). Proces ten rozpoczyna się od kodowania danych molekularnych w formie SMILES, które są następnie przekształcane w reprezentacje graficzne za pomocą narzędzia RDKit. Te grafy są dalej przetwarzane przez architekturę GNN opartą na PyTorch Geometric. Dzięki temu system GNN uczy się złożonych relacji strukturalnych obecnych w cząsteczkach, co pozwala na przewidywanie właściwości, takich jak aktywność molekularna czy zdolność wiązania z białkami.

Architektura GNN zawiera wiele warstw konwolucji grafowej, które wychwytują cechy molekularne na różnych poziomach hierarchicznych, a także mechanizmy takie jak normalizacja wsadowa (batch normalization), dropout i połączenia resztkowe (residual connections), które stabilizują trening modelu i zwiększają dokładność prognoz. W efekcie, połączenie reprezentacji grafowych z deskryptorami chemioinformatycznymi i odciskami palców (fingerprints) molekuł zapewnia solidną bazę do precyzyjnego przewidywania aktywności molekularnej.

Narzędzia do wirtualnego przeszukiwania i klasteryzacji

VirtuDockDL oferuje również narzędzia do wirtualnego przeszukiwania i klasteryzacji, pozwalając użytkownikom na analizę dużych bibliotek związków chemicznych w odniesieniu do wybranych celów białkowych. Klasteryzacja przetestowanych molekuł opiera się na przewidywanej aktywności i jest realizowana za pomocą modelu mieszanek Gaussowskich (GMM). Jakość klasteryzacji jest oceniana za pomocą wskaźników Silhouette oraz Davies-Bouldin. Platforma wspiera również proces udoskonalania struktury białek za pomocą OpenMM oraz dokowanie ligandów przy użyciu AutoDock Vina, co umożliwia przewidywanie zdolności wiązania cząsteczek.

Przykładem zastosowania VirtuDockDL jest badanie nad wirusem Marburg, w którym badano interakcje z białkiem VP35. W ramach tego badania stworzono zarówno zestawy pozytywnych, jak i negatywnych przykładów, a model GNN skutecznie klasyfikował związki chemiczne, używając miary straty krzyżowo-entropijnej oraz optymalizacji RMSprop. Wyniki wirtualnego przeszukiwania oraz dokowania, obejmujące kluczowe wskaźniki takie jak AUC, dokładność oraz F1-score, są automatycznie wizualizowane, dostarczając cennych informacji na temat potencjalnych inhibitorów VP35 w kontekście odkrywania leków.

Intuicyjny interfejs użytkownika

VirtuDockDL został zaprojektowany z myślą o użytkowniku. Posiada przyjazny i intuicyjny graficzny interfejs użytkownika (GUI), który opiera się na frameworku Flask. Użytkownicy mogą w łatwy sposób przesyłać molekuły, inicjować zadania oraz pobierać wyniki. Funkcje platformy są podzielone na różne zakładki, co ułatwia nawigację i obsługę. Przykładem efektywności platformy jest trening modelu GNN przy użyciu aktywnych i nieaktywnych białek VP35, który osiągnął wysoki poziom dokładności – 97,79%, a wskaźnik AUC wyniósł 0,9972. VirtuDockDL zidentyfikował również 146 potencjalnych inhibitorów z bazy danych ZINC i PubChem, co dodatkowo potwierdza jego efektywność.

VirtuDockDL wykazało także swoją wyższość w przewidywaniu zdolności wiązania związków w innych badaniach, takich jak HER2 (rak), beta-laktamaza TEM-1 (infekcje bakteryjne) oraz CYP51 (kandydoza), przewyższając narzędzia takie jak PyRMD, RosettaVS, MzDOCK, AutoDock Vina oraz Glide.

Zakończenie

VirtuDockDL to innowacyjna platforma internetowa oparta na Pythonie, która znacząco usprawnia proces odkrywania leków za pomocą głębokiego uczenia. Dzięki wykorzystaniu Sieci Neuronowej na Grafach do przetwarzania i selekcji związków chemicznych, platforma ta wykazuje imponującą dokładność przewidywań oraz praktyczne zastosowanie w licznych badaniach. VirtuDockDL osiągnęło znakomite wyniki, przewyższając konkurencyjne narzędzia, takie jak DeepChem oraz AutoDock Vina, w benchmarkach dotyczących HER2, beta-laktamazy oraz CYP51. Dzięki pełnej automatyzacji oraz przyjaznemu interfejsowi, VirtuDockDL staje się efektywnym i opłacalnym narzędziem wspierającym badania farmaceutyczne oraz odkrywanie nowych leków, szczególnie w kontekście zwalczania pilnych wyzwań zdrowotnych.