Naučnik u Japanu uspio spojiti ‘mozgove’ čovjeka i AI

Naučnik u Japanu razvio je tehniku koja koristi skeniranje mozga i vještačku inteligenciju (AI) kako bi mentalne slike osobe pretvorila u precizne, opisne rečenice.

Iako je postojao napredak u korištenju skenova moždane aktivnosti za prevođenje riječi koje mislimo u tekst, prevođenje naših složenih mentalnih slika u jezik dosad se pokazalo kao izazov, prema Tomoyasu Horikawi, autoru studije objavljene 5. novembra u časopisu Science Advances.

Međutim, Horikawina nova metoda, poznata kaomind-captioning” (titlovanje uma), funkcioniše tako što koristi AI za generisanje opisnog teksta koji odražava informacije u mozgu o vizuelnim detaljima kao što su objekti, mjesta, radnje i događaji, kao i odnose među njima.

Generisanje teksta iz misli

Horikawa, istraživač u Communication Science Laboratories telekomunikacione kompanije NTT, započeo je analizom moždane aktivnosti šest ispitanika (četiri muškarca i dvije žene, govornika japanskog jezika, u dobi od 22 do 37 godina), skenirajući njihove mozgove dok su gledali video klipove. Učesnici su gledali 2.180 videozapisa bez zvuka koji su trajali nekoliko sekundi i varirali u sadržaju: objekti, scene i radnje.

Veliki jezički modeli (LLM) — generativni AI sistemi obučeni na velikim skupovima podataka — uzeli su opise video klipova i pretvorili te opise u sekvence brojeva. Horikawa je obučio odvojene, jednostavnije AI modele, poznate kao “dekoderi“, da upare skeniranu moždanu aktivnost povezanu s video klipovima s numeričkim sekvencama.

Zatim je koristio dekodere za tumačenje moždane aktivnosti učesnika dok su gledali ili se prisjećali videozapisa s kojima se AI nije susreo tokom procesa obuke. Drugi algoritam je kreiran da progresivno generiše sekvence riječi koje najbolje odgovaraju dekodiranoj moždanoj aktivnosti. Kako je AI učio iz podataka, opisni alat postajao je sve bolji u korištenju skenova mozga za opisivanje videozapisa koje su učesnici gledali.

Zanimljivo je da je AI model generisao tekst na engleskom jeziku, iako učesnici nisu bili izvorni govornici engleskog.

Potencijal za “duboke” zdravstvene intervencije

Metoda može kreirati sveobuhvatne opise vizuelnog sadržaja, čak i bez korištenja aktivnosti u regijama mozga povezanim s jezikom, ili “jezičkoj mreži”, rekao je Horikawa, “što ukazuje da se ova metoda može koristiti čak i kada neko ima oštećenje oko te jezičke mreže.”

Tehnologija bi se potencijalno mogla koristiti za pomoć osobama s afazijom, koje se bore s jezičkim izražavanjem zbog oštećenja jezičke mreže; ili amiotrofičnom lateralnom sklerozom (ALS), progresivnom neurodegenerativnom bolešću koja utječe na govor.

“Mislim da ova studija utire put za neke duboke intervencije za ljude koji imaju poteškoće u komunikaciji, uključujući neverbalne autistične osobe,” rekao je psiholog Scott Barry Kaufman.

Ipak, “moramo je koristiti pažljivo i osigurati da nismo invazivni i da se svi slažu s tim,” naglasio je.

“Ultimativni izazov privatnosti”

Uspjeh ove metode — koja bi se mogla primijeniti za dekodiranje misli beba ili životinja, ili sadržaja snova — “pokreće etičke zabrinutosti” u vezi s privatnošću, s mogućnošću otkrivanja privatnih misli pojedinca prije nego što ih je verbalizovao, navodi studija.

Ako se u budućnosti ova tehnologija bude koristila od strane potrošača izvan biomedicinskih svrha, “Mislim da je ovo ultimativni izazov privatnosti,” rekao je Marcello Ienca, profesor etike AI i neuronauke.

Dodao je da mnoge kompanije, poput Neuralinka, startupa Elona Muska za moždane implantate, objavljuju tvrdnje o skorom razvoju neuralnih implantata za opštu populaciju.

“Ako dođemo do toga, onda moramo imati vrlo, vrlo stroga pravila kada je riječ o odobravanju pristupa umovima i mozgovima ljudi,” rekao je Ienca, ističući da naši mozgovi uključuju “osjetljive informacije” kao što su “potpisi rane demencije i psihijatrijskih poremećaja i depresije.”

Ipak, Horikawa je primijetio da metoda korištena u njegovoj studiji zahtijeva sakupljanje velike količine podataka, uz saradnju aktivnih učesnika. Dakle, dok je tehnologija korisna za neurološka istraživanja, “nije toliko tačna za praktičnu upotrebu,” rekao je. Također, videozapisi su uključivali tipične scene (npr., pas ujeda čovjeka), ali ne i neobičnije scene (recimo, čovjek ujeda psa). Stoga, još nije jasno može li se tehnika koristiti za hvatananje manje predvidljivih mentalnih slika.

“Dok se neki ljudi možda brinu da ova tehnologija predstavlja ozbiljan rizik za mentalnu privatnost,” u stvarnosti, “trenutni pristup ne može lako čitati privatne misli osobe,” zaključio je Horikawa.