Jak nauczyć sztuczną inteligencję wyobraźni?

Reklama

Biblioteka, o której farmakolodzy i biolodzy molekularni przez dziesięciolecia mogli tylko marzyć, stała się dostępna na wyciągnięcie ręki. Brytyjska firma stworzyła właśnie gigantyczną bazę danych zawierającą trójwymiarowe modele 350 tys. białek. To może być przełom w medycynie, pozwalający na precyzyjne, inżynierskie projektowanie cząsteczek leków. Może nawet pomóc w walce z plastikowymi śmieciami.

Białka to związki chemiczne stanowiące podstawę wszystkich żywych istot. Te niezwykle złożone cząsteczki mogą się zwijać i składać na różne sposoby. A kształt białka decyduje o tym, w jaki sposób inne cząsteczki mogą się z nim wiązać.

Reklama

Najnowsze wydanie Tygodnika co sobotę w Twojej skrzynce. Zapisz się do newslettera >>

Zrozumienie tego, jak wyglądają interakcje między cząsteczkami, może pomóc zrozumieć na przykład to, w jaki sposób bakterie opierają się działaniu antybiotyków i jak temu przeciwdziałać. Ustalenie kształtu białek występujących w odpornych na antybiotyki bakteriach może pomóc opracować nowe leki pozwalające z nimi skutecznie walczyć. Badacze chcą też tworzyć enzymy, które będą automatycznie rozbijać cząsteczki plastiku, neutralizując zanieczyszczenia. Trzeba tylko stworzyć cząsteczkę-klucz, która będzie precyzyjnie pasować do chemicznego zamka.

O ile określenie składu chemicznego białka jest stosunkowo proste, o tyle identyfikacja jego trójwymiarowego kształtu może wymagać lat eksperymentów. Właśnie dlatego udostępniona przez Brytyjczyków baza danych może, zdaniem części uczonych, okazać się przełomem większym niż Projekt Ludzkiego Genomu, który stworzył mapę naszego DNA.

Stworzenie tej mapy nie wymagało eksperymentów. Wymagało mocy obliczeniowej i algorytmów uczenia maszynowego. Sztucznej inteligencji AlphaFold.

Bariera dla komputerów

AlphaFold przewiduje struktury białkowe za pomocą tak zwanej sieci neuronowej, matematycznego systemu, który może uczyć się zadań, analizując ogromne ilości danych. To ta sama technologia, która dziś odpowiada w smartfonach za inteligentne tłumaczenia, rozpoznawanie twarzy na zdjęciach, czy wykonywanie wydawanych głosem poleceń. W tym przypadku sieć "nauczyła się" tysięcy znanych białek i ich fizycznych struktur i na podstawie tej wiedzy ekstrapolowała nieznane dotąd kształty.

Technologia nie jest stuprocentowo pewna i nie zastąpi całkowicie eksperymentów, ale biochemicy szacują, że może przyspieszyć ich prace o wiele lat. Według testów porównawczych, AlphaFold może przewidzieć kształt białka z dokładnością dorównującą fizycznym eksperymentom w około 63 proc. przypadków.

AlphaFold to dzieło firmy DeepMind, stworzonej przez komputerowego geniusza Demisa Hassabisa. Szachowego mistrza, badacza mózgu, współtwórcę legendarnych gier komputerowych, a dziś być może najsłynniejszego na świecie twórcę sztucznych inteligencji.

Hassabis, który jako nastolatek tworzył algorytmy sterujące zachowaniami postaci w najsłynniejszych grach komputerowych lat 90. takich jak "Syndicate", dziś tworzy programy, które demolują ludzkich arcymistrzów w o wiele starszych grach. Jego AlphaGo jako pierwszy pokonał najlepszych ludzkich zawodników w go.

To miał być dla sztucznej inteligencji cel nieosiągalny przez długie dziesięciolecia, bo go to gra o wyjątkowej złożoności. Liczba możliwych kombinacji kamieni na planszy ma 171 cyfr i jest o rzędy wielkości większa, od liczby atomów we Wszechświecie. Każda rozgrywka może toczyć się na 10 do 700 potęgi sposobów. Dla porównania, szachy dają tylko 10 do 60. potęgi możliwości. Tej gry nie da się wygrać, zapamiętując dotychczasowe rozgrywki i rozgrywając w pamięci do końca wszelkie możliwe scenariusze, bo tych scenariuszy jest po prostu zbyt wiele. A właśnie taką techniką posługiwały się komputery, które pokonywały w szachy ludzkich arcymistrzów. Gracze w go mówią, że tu liczy się intuicja czy wyobraźnia. Dlatego klęska, jaką w starciu z AlphaGo w 2019 r. poniósł Lee Sedol, jeden z najlepszych ludzkich graczy w historii, była szokiem. I dla graczy, i dla twórców sztucznych inteligencji.

Oczywiście gra w go nie jest dla DeepMind celem samym w sobie. Nie jest nim nawet składanie białek w komputerowej pamięci, choć tu wymierne korzyści są o wiele większe. Firma Hassabisa powstała, by zrealizować marzenie wielu pokoleń twórców komputerów i fantastyki naukowej: tak zwaną ogólną AI, czyli sztuczną inteligencję, która tak jak człowiek może próbować rozwiązywać dowolny problem, jaki się jej przedstawi, a nie tylko taki, do jakiego była przyuczana.

Tu jednak na razie komputery zatrzymują się na trudnej do ominięcia barierze. Nie mają wyobraźni.

Jak działa wyobraźnia? To zaskakująco trudne pytanie. Naukowcy wiedzą, że jest blisko powiązana ze zdolnościami percepcyjnymi naszego mózgu. Ale badania naukowców z Dartmouth College wykazały, że poza korą wzrokową, w wyobrażanie sobie nieistniejących kształtów zaangażowanych może być 12 różnych obszarów mózgu. Wyobraźnia to dla niego najwyraźniej ćwiczenie ogólnorozwojowe, wymagające pełnego zaangażowania i ścisłej współpracy różnych wyspecjalizowanych ośrodków.

Nauczenie tej sztuczki komputerów było jak dotąd ekstremalnie trudne. Choć być może właśnie zdecydowanie przybliżyliśmy się do celu. Zespół badaczy z Uniwersytetu Południowej Kalifornii opracował sztuczną inteligencję, która potrafi "wyobrazić sobie" nigdy wcześniej niewidziany obiekt o różnych atrybutach.

- Zainspirowały nas ludzkie możliwości wizualnego uogólniania. Chcieliśmy sprawdzić, czy da się symulować w maszynie działanie ludzkiej wyobraźni - powiedział główny autor badania, doktorant Yunhao Ge. - Ludzie mogą podzielić posiadaną wiedzę o obiekcie na atrybuty - na przykład kształt, pozę, pozycję, kolor - a następnie zmienić je i ponownie połączyć, aby wyobrazić sobie nowy obiekt. Nasz artykuł próbuje symulować ten proces za pomocą sieci neuronowych.

Słowem - my potrafimy wyobrazić sobie czarnego kota przechadzającego się po gzymsie zamku na Wawelu. Potrafimy następnie szybko zmienić w wyobraźni kolor kota na rudy, przenosząc go jednocześnie na dach Stadionu Narodowego. Ale dla komputera taka manipulacja atrybutami nieistniejącego obiektu była dotąd nieosiągalna.

Rozplątywanie

W nowym badaniu naukowcy próbują przezwyciężyć to ograniczenie za pomocą koncepcji zwanej "rozplątywaniem". Jest ona stosowana na przykład przy generowaniu nagrań deepfake, w których twarz jednej osoby jest zastępowana twarzą innej. W ramach rozplątania dochodzi do rozłączenia ruchów twarzy i jej zasadniczego kształtu. Stają się dwoma zupełnie osobnymi atrybutami obrazu. Dzięki temu mimika jednej osoby może zostać przypisana komuś zupełnie innemu. - W ten sposób ludzie mogą syntetyzować nowe obrazy i filmy, które zastępują tożsamość jednej osoby inną, ale zachowują pierwotny ruch - tłumaczy Ge.

Najnowsze wydanie Tygodnika co sobotę w Twojej skrzynce. Zapisz się do newslettera >>

Nowe, wypracowane przez Ge podejście do "sztucznej wyobraźni" wykorzystuje całe grupy przykładowych obrazów - a nie pojedyncze obiekty, jak robiły to tradycyjne algorytmy. Algorytm szuka podobieństw między nimi, wyodrębniając poszczególne atrybuty obiektów. Następnie ponownie łączy tę wiedzę i łączy pochodzące z różnych obrazów atrybuty, formując nowy obiekt. To właśnie coś, co uczeni przyrównują do wyobraźni, bo algorytm jest w stanie tworzyć kombinacje, jakich nie widział nigdy wcześniej.

- Weźmy na przykład film Transformers - powiedział Ge. - Możemy poprosić algorytm o wygenerowanie samochodu o kształcie Megatrona, kolorze i pozie żółtego Bumblebee na tle nowojorskiego Times Square. Powstanie obraz, jakiego maszyna nie mogła nigdzie zobaczyć.

Korzystając z tej techniki, grupa wygenerowała 1,56 miliona zupełnie nowych obrazów.

Naukowcy twierdzą, że zastosowania ich pomysłu wykraczają daleko poza tworzenie obrazków. Technika rozplątywania może być bowiem stosowana do niemal każdego rodzaju danych. Lekarze i biolodzy będą mogli wykorzystać ją w odkrywaniu bardziej użytecznych leków poprzez oddzielenie funkcji leku od innych właściwości, a następnie ponowne połączenie ich w celu zsyntetyzowania nowego specyfiku. Syntetyczna wyobraźnia może też pomóc tworzyć bezpieczniejsze autonomiczne pojazdy, pozwalając samochodom na wyobrażanie sobie i unikanie niebezpiecznych scenariuszy, których wcześniej nigdy nie doświadczyły.

- Głębokie uczenie już wykazało niezrównaną wydajność i przydatność w wielu dziedzinach, ale zbyt często polega ona na płytkim naśladownictwie bez zrozumienia tego, jakie atrybuty sprawiają, że dany obiekt jest wyjątkowy - mówi prof. Laurent Itti, informatyk z Uniwersytetu Południowej Kalifornii. - To nowe podejście zbliża sposób widzenia świata przez ludzką inteligencję do ludzkiego.

Do stworzenia ogólnej AI, która mogłaby dla nas być partnerem czy rywalem, jest jeszcze bardzo daleko. Ale przynajmniej wkrótce komputery będą ją sobie w stanie wyobrazić.