Symulacje dynamiki biomolekularnej odgrywają kluczową rolę w naukach przyrodniczych, dostarczając cennych informacji na temat interakcji molekularnych. Choć klasyczne symulacje dynamiki molekularnej (MD) są wydajne, brak im precyzji chemicznej. Z kolei metody takie jak teoria funkcjonału gęstości (DFT) oferują wysoką dokładność, jednak są zbyt zasobożerne, aby mogły być stosowane w badaniach dużych biomolekuł. Symulacje MD pozwalają na obserwację zachowań molekularnych, przy czym klasyczne MD korzystają z potencjału międzyatomowego, a ab initio MD (AIMD) oblicza siły na podstawie struktur elektronowych. AIMD jednak napotyka na problemy z skalowalnością, co ogranicza jej zastosowanie w badaniach biomolekularnych. Pole sił wygenerowane przez algorytmy uczenia maszynowego (MLFF), trenowane na danych z poziomu DFT, oferują obietnicę dokładności przy niższych kosztach, choć generalizacja w różnych konformacjach molekularnych wciąż pozostaje wyzwaniem.
Nowe podejście AI2BMD
Naukowcy z Microsoft Research w Pekinie wprowadzili AI2BMD, system oparty na sztucznej inteligencji, który umożliwia symulację dużych biomolekuł z dokładnością ab initio. AI2BMD wykorzystuje technikę fragmentacji białek oraz pole sił oparte na uczeniu maszynowym, co pozwala na dokładne obliczenia energii i sił dla białek zawierających ponad 10 000 atomów. System ten jest znacznie bardziej wydajny niż tradycyjne podejścia DFT, skracając czas symulacji o rzędy wielkości. Dzięki AI2BMD możliwe jest przeprowadzenie setek nanosekund symulacji, co pozwala na uchwycenie procesu fałdowania, rozwijania i dynamiki konformacyjnej białek. Wyniki te są zgodne z danymi eksperymentalnymi, co czyni AI2BMD cennym narzędziem wspierającym badania laboratoryjne oraz rozwój nauk biomedycznych.
Technika fragmentacji białek
Podejście fragmentacji białek opiera się na strukturze aminokwasów, z których każdy zawiera główny łańcuch atomów (Cα, C, O, N, H) oraz specyficzny łańcuch boczny. W celu stworzenia modelu, który można zastosować do różnych białek, każdy aminokwas jest traktowany jako dipeptyd, zakończony grupami Ace i Nme na swoich końcach. Ta metoda, oparta na nakładających się fragmentach dipeptydów, gwarantuje kompleksowe pokrycie białek. Z pomocą przesuwającego się okna, łańcuchy białek są dzielone na te dipeptydy, gdzie każdy fragment zawiera zarówno główne atomy łańcucha, jak i częściowe atomy sąsiednich aminokwasów. Dodając atomy wodoru tam, gdzie wymaga tego wiązanie Cα, oraz optymalizując ich położenie za pomocą algorytmu quasi-Newtona, metoda ta umożliwia precyzyjne obliczenia energii i sił atomowych. Dzięki temu system aplikacji fragmentów staje się uniwersalny dla wszystkich białek, minimalizując złożoność i jednocześnie maksymalizując dokładność modelu.
Uczenie maszynowe w symulacjach
Zbiór danych szkoleniowych dla potencjału AI2BMD obejmuje miliony konformacji dipeptydów, co umożliwia uchwycenie różnorodności struktur białkowych. Model głębokiego uczenia o nazwie ViSNet został przeszkolony na podstawie tych danych, aby przewidywać energię i siły atomowe w oparciu o liczby atomowe i ich współrzędne. Do szkolenia modelu zastosowano konkretne hiperparametry, optymalizujące jego dokładność, oraz techniki wczesnego zatrzymywania procesu uczenia. Symulacje bazujące na potencjale AI2BMD są przetwarzane za pomocą programu symulacyjnego, kompatybilnego z chmurą, co pozwala na elastyczne wdrażanie w różnych środowiskach obliczeniowych. Ten system wspiera procesy symulacji równoległych oraz automatycznie zapisuje postępy w chmurze, co zapewnia solidne i wydajne zarządzanie modelowaniem dynamiki białek.
Precyzyjne oszacowania termodynamiczne i efektywność AI2BMD
AI2BMD wykazuje znaczny potencjał w oszacowaniu właściwości białek, zwłaszcza podczas analizy termodynamicznej szybko fałdujących się białek. System ten może klasyfikować struktury na części zwinięte i rozwinięte poprzez symulację różnych typów białek oraz precyzyjne przewidywanie wartości energii potencjalnej. Wartości temperatury topnienia (Tm) dla białek, takich jak domena WW i NTL9, były zbliżone do danych eksperymentalnych, a często przewyższały tradycyjne metody mechaniki molekularnej (MM). Dodatkowo, obliczenia AI2BMD dotyczące energii swobodnej (ΔG), entalpii oraz pojemności cieplnej były wysoce zgodne z wynikami eksperymentalnymi, co potwierdza jego dokładność. Ta solidność w oszacowaniach termodynamicznych podkreśla wartość AI2BMD jako zaawansowanego narzędzia do analizy białek.
Nowe możliwości w badaniach biochemicznych
Poza analizą termodynamiczną, AI2BMD okazał się skuteczny w obliczeniach swobodnej energii alchemicznej, takich jak przewidywanie wartości pKa, co czyni go cennym narzędziem w badaniach biochemicznych. W przeciwieństwie do tradycyjnych metod QM-MM, które ograniczają obliczenia do wybranych regionów, podejście ab initio AI2BMD umożliwia modelowanie całych białek bez niespójności na granicach, co sprawia, że jest wszechstronny w przypadku złożonych białek i dynamicznych stanów. Choć prędkość AI2BMD jest wciąż wolniejsza od klasycznych symulacji MD, przyszłe optymalizacje oraz zastosowania do innych systemów biomolekularnych mogą zwiększyć jego efektywność. Elastyczność AI2BMD sprawia, że jest to obiecujące narzędzie do odkrywania leków, projektowania białek oraz inżynierii enzymów, oferujące wysoce precyzyjne symulacje w różnych zastosowaniach biomolekularnych.
Podsumowując, AI2BMD otwiera nowe perspektywy w badaniach nad dynamiką biomolekuł, oferując przełomowe możliwości modelowania złożonych procesów biologicznych w sposób bardziej wydajny i dokładny niż dotychczas dostępne metody.