Devvret Rishi: CEO i Współzałożyciel Predibase
Devvret Rishi to CEO i współzałożyciel firmy Predibase, której misją jest demokratyzacja uczenia głębokiego (deep learning). Zanim założył Predibase, był liderem produktów związanych z uczeniem maszynowym (ML) w Google, pracując nad takimi projektami jak Firebase, Google Research, Asystent Google oraz Vertex AI. W swojej karierze Devvret był również pierwszym liderem produktu na Kaggle – platformie dla społeczności naukowców danych i specjalistów od uczenia maszynowego, która zgromadziła ponad 8 milionów użytkowników na całym świecie. Jego akademickie doświadczenie obejmuje informatykę i statystykę, a tytuł magistra zdobył na Uniwersytecie Harvarda, gdzie specjalizował się w ML.
Początki Predibase: Demokratyzacja Uczenia Głębokiego
Devvret Rishi i jego współzałożyciele założyli Predibase w 2021 roku, aby zapewnić szeroki dostęp do zaawansowanych modeli uczenia głębokiego. W czasie, gdy największe firmy technologiczne, takie jak Google, Apple czy Uber (gdzie współzałożyciele Predibase wcześniej pracowali), korzystały z modeli sieci neuronowych do tworzenia lepszych systemów rekomendacji i pracy z nieustrukturyzowanymi danymi, większość firm nadal polegała na przestarzałych metodach, takich jak regresja liniowa czy modele drzew decyzyjnych. Cel Predibase był prosty: wprowadzić te zaawansowane technologie do szerszego grona odbiorców.
Co ciekawe, Predibase powstało na bazie otwartego projektu, który jeden z współzałożycieli, Piero, rozpoczął w Uberze. Początkowo platforma miała na celu dostarczenie narzędzi do dostrajania modeli takich jak BERT, ale z biegiem czasu, dzięki rozwojowi generatywnej sztucznej inteligencji (generative AI), zdano sobie sprawę, że inżynierowie potrzebują nie tylko modeli wstępnie wytrenowanych, ale również możliwości ich dostosowywania do specyficznych potrzeb.
Sukces Predibase: Kluczowe Innowacje
Predibase wyróżnia się na rynku dzięki kluczowym innowacjom w zakresie efektywnego dostrajania parametrów modeli ML. Dzięki wprowadzeniu takich technologii jak Low-Rank Adaptation (LoRA), można modyfikować jedynie niewielką część parametrów modelu (mniej niż 1%), zachowując przy tym wysoką jakość wyników. To podejście, znacznie bardziej efektywne obliczeniowo, pozwala na szybkie i tanie dostrajanie dużych modeli, co drastycznie zmniejsza koszt i czas tego procesu.
Typowa firma może zakładać, że dostrajanie modeli zajmie dni i będzie kosztować dziesiątki tysięcy dolarów. Jednak z pomocą Predibase czas ten można skrócić do 30 minut lub godziny, a koszt zamknąć w przedziale 20-200 złotych, co pozwala zespołom na większą swobodę w eksperymentowaniu i budowaniu własnych, dostosowanych modeli.
Wydajność i Optymalizacja Kosztów
Efektywność Predibase opiera się nie tylko na dostrajaniu modeli, ale również na efektywnej ich obsłudze (serving). Dzięki LoRAX, otwartemu frameworkowi stworzonemu przez Predibase, możliwe jest obsługiwanie wielu dostrojonych modeli na pojedynczej instancji GPU, co znacząco obniża koszty infrastruktury. Technologie takie jak Turbo LoRA pozwalają na czterokrotne zwiększenie wydajności przetwarzania, a kwantyzacja FP8 zmniejsza zużycie pamięci o połowę.
Dzięki tym technologiom Predibase może zapewnić szybkie odpowiedzi w czasie rzeczywistym przy minimalnych kosztach, co jest kluczowe w przypadku obciążeń produkcyjnych i zastosowań AI o dużym natężeniu pracy.
Bezpieczeństwo Danych i Prostota Użytkowania
Predibase doskonale rozumie, jak ważne są kwestie bezpieczeństwa danych i ochrony własności intelektualnej dla dużych przedsiębiorstw. Dlatego oferuje możliwość wdrażania swojej platformy w chmurze prywatnej klienta (VPC) lub w swojej własnej chmurze, zapewniając przy tym pełną zgodność z regulacjami takimi jak SOC II Type II. Takie rozwiązanie idealnie pasuje do branż, w których ochrona danych jest kluczowa, jak np. finanse czy opieka zdrowotna.
Korzystanie z Predibase jest niezwykle proste – wystarczy zaledwie kilka linii kodu, aby zacząć dostrajanie modeli. Platforma została zaprojektowana w taki sposób, aby abstrahować skomplikowane procesy związane z infrastrukturą, dając zespołom możliwość łatwego i szybkiego wdrażania rozwiązań AI.
Wydajność Operacyjna i Szybki Zwrot z Inwestycji
Dzięki efektywności LoRA, dostrajanie modeli przy użyciu Predibase jest niezwykle tanie. Koszt zazwyczaj wynosi od 20 do 200 złotych, co w porównaniu z tradycyjnymi metodami oznacza znaczne oszczędności. Dzięki tej niskiej barierze kosztowej, firmy mogą szybko osiągnąć zwrot z inwestycji, bez konieczności wielokrotnego i kosztownego eksperymentowania z modelami.
Przyszłość Generatywnej AI
Devvret jest przekonany, że przyszłość generatywnej AI będzie coraz bardziej skupiona na małych, dostrojonych modelach, które są bardziej opłacalne i wydajne w produkcji. Chociaż w 2023 roku rynek koncentrował się na jak największych modelach, to w miarę jak firmy będą wdrażać AI do produkcji, kluczowe staną się koszty, jakość i opóźnienia. Mniejsze, zadaniowo dostrojone modele będą rosły na znaczeniu, szczególnie w kontekście opłacalności.
Devvret przewiduje również, że udział oprogramowania open-source w AI będzie dynamicznie wzrastał, co jest zgodne z historycznym trendem w branży uczenia maszynowego. Większość firm, które wykorzystują AI na dużą skalę, stopniowo przechodzi na otwarte rozwiązania, co z kolei napędza dalszy rozwój tej technologii.
Podsumowanie: Wyjątkowość Predibase
Predibase wyróżnia się na rynku dzięki zaawansowanym optymalizacjom, które pozwalają na wydajne dostrajanie i obsługę modeli ML. Dzięki takim technologiom jak LoRA i LoRAX, firmy mogą wdrażać wiele dostrojonych modeli na jednej instancji GPU, co znacząco obniża koszty operacyjne. Dodatkowo, platforma jest prosta w użyciu, a wsparcie dla użytkowników zapewniają dedykowani inżynierowie ML. Predibase jest idealnym rozwiązaniem dla firm, które chcą skupić się na wynikach, a nie na zarządzaniu infrastrukturą AI.