Strojno učenje osvjetljava tamnu materiju tijela

Startap pronalazi obrasce za koje stručnjaci personalizirane medicine kažu da ih ranije nisu mogli vidjeti.

Larry Smarr kaže da je tehnologija otključala nove spoznaje o mikrobiomu. (Ilustracija Nick Vokey; foto ljubaznošću Rogdela / Wikipedije)

Kada je u pitanju korištenje računala za analizu medicinskih podataka, treba impresionirati Larryja Smarra.

Smarr, informatičar sa istraživačkog instituta UC San Diego / UC Irvine pod nazivom Calit2, pionir je pokreta kvantificiranog samoga sebe. Redovito analizira krv i stolicu na 150 biomarkera. Ako primijeti nešto neobično, prilagodit će svakodnevnu aktivnost, bilo da to znači napraviti nekoliko dodatnih krugova po kampusu kako biste sagorjeli više kalorija ili umiješali soj probiotika koji mu se nadopunjuje. Zahvaljujući svim tim podacima, prije nekoliko godina shvatio je da je imao Crohnovu bolest prije nego što ga je obavio liječnik - i kad mu je na kraju zatražio operativni zahvat, opskrbio je svog hirurga trodimenzionalnim modelom debelog crijeva kako bi se ona mogla upoznati s izgled prije operacije.

Budući da je Smarr tako dobro upućen u gomilanje i analizu medicinskih podataka, bilo je nevjerojatno čuti da novo pokretanje strojnog učenja, Pattern Computer, ima nešto novo što bi mu pokazalo.

Jedna od Smarrovih opsesija je međusobna interakcija bakterija u našem crijevu - naš mikrobiom - i koliko malo o tome znamo. ("Tamna tvar tijela", naziva on.) Smarr pokušava utvrditi koji su pomaci i fluktuacije mikrobioma normalni i koji bi mogli uzrokovati bolest. Da bi to postigli, on i kolege usporedili su bakterije crijeva zdravih ljudi s mikrobiomima ljudi s različitim fazama upalne bolesti crijeva. Čak i samo 62 osobe koje su pružile uzorke u ovoj studiji, ona je generirala ogromnu količinu podataka, jer bakterije u našim crijevima proizvode oko 10 000 različitih vrsta proteina koji svaki obavljaju različitu biološku funkciju. I relativno obilje ovih proteinskih obitelji variralo je kod svakog ljudskog ispitanika.

Poznato je da se određeni podskup tih proteinskih obitelji rjeđe javlja kod ljudi sa KVB nego u zdravih ljudi. Ali kad je Smarr dao uzorku Computer Computer te podatke, uspio je znatno suziti podskup. Pokazalo se da se čini da je devet od tih 10 000 obitelj proteina najviše povezano s upalnom bolesti crijeva. Odunavljanje tih devet i njihovih biokemijskih putova moglo bi ponuditi nove tragove o načinu na koji naš mikrobiom utječe na zdravlje i otvoriti nove intervencije.

"To je zaista bilo otkriće", kaže Smarr. Nakon što je godinama pregledavao te podatke raznim softverskim alatima, nije primijetio "obrazac koji je bio blokiran unutar ovog velikog nereda podataka".

To je obećanje računalnog uzorka: da njegov sustav strojnog učenja može pronaći korelacije koje drugi sustavi ne mogu, čak i kad mu nije rečeno što tražiti. Tvrtku vodi tehno prognozer Mark Anderson, a ovaj je tjedan pokrenuta s oko 6 milijuna dolara financiranja i klijentima koji se kreću u rasponu od "kompanija do zemalja", kaže on. S vremenom će se preseliti u različite industrije, dodaje Anderson, ali upravo sada usredotočuje se na biomedicinu.

Mark Anderson, lijevo, sa Smarrom pri pokretanju programa Computer Computer.

Ima veliku konkurenciju. Medicinski istraživači, farmaceutske kompanije, bolnice i liječnici pokušavaju pronaći širok spektar naprednih računalnih tehnika kako bi pokušali pronaći uvid u podatke. Ono što je posebno škakljivo je to što ti podaci dolaze u mnogim oblicima, od količine u krvnim pretragama do očitavanja genoma do teksta u časopisima i zapisima o pacijentima. Ni računalno računalo niti bilo koja druga pojedina kompanija ili algoritam vjerojatno neće svladati sve to. IBM je pokazao koliko. Unatoč puno previda o tome kako se njegove Watson-ove tehnologije - zasnovane na sustavu koji je pobijedio na Jeopardy-u - koriste u Memorial Sloan Kettering Centru za rak i drugim bolnicama, oni su učinili malo da promijene način na koji liječnici dijagnosticiraju i liječe bolest.

Napredak u korištenju strojnog učenja u medicini dolazi umjesto toga u manjim koracima. Ben Brown, računalni biolog iz Nacionalnog laboratorija Lawrence Berkeley, pokušava otkriti kako interakcije između gena dovode do raka dojke. Ali budući da postoji tako velika varijacija tumora karcinoma dojke, nemoguće je da proučimo sve relevantne interakcije gena "grubom silom", kaže Brown. Koristio je tehnologiju Pattern Computer da pronađe trosmjernu interakciju gena koja je u korelaciji s niska stopa preživljavanja raka.Sljedećim istraživanjem moglo bi se istražiti ciljane terapije za tu interakciju.

Viša rezolucija

2009. godine, Leroy Hood, jedan od razvijača tehnologije sekvenciranja gena i trailblazer za sveobuhvatni pogled na zdravlje nazvan "biologija sustava", napisao je članak za Newsweek pod nazivom "Doktorova vizija budućnosti medicine." Zamišljao je, ljudi testiraju vlastitu krv kućnim uređajima, omogućujući njihovim liječnicima da analiziraju nevjerojatne količine podataka o njihovom zdravlju sve do razine gena. Taj je članak postavljen… lipnja 2018. godine.

Nismo tamo gdje je Hood zamislio da bismo trenutno bili, jer je stigao samo dio jednadžbe. "Imamo ogromne količine podataka", kaže Hood. "Tek smo počeli ogrebati površinu onoga što možemo učiniti s tim."

Kroz uslugu zdravstvenog treniranja nazvanu Arivale i druga istraživanja, Hood je posvećen ostvarenju onoga što naziva P4 medicinom: prediktivnom, preventivnom, personaliziranom i participativnom. Kao što je rekao, izazov je analizirati podatke različitih tipova. Kao primjer, naveo je pilot-studiju P4 na 108 svojih prijatelja. Devet mjeseci je njegov tim prikupio informacije o njima sekvencirajući njihov genom, redovito uzimajući testove krvi i stolice i dajući im samotraga za san i fizičku aktivnost. Da bi u potpunosti imao smisla za podatke i izvukao nekoliko primjenjivih prijedloga iz njih, Hood kaže da će mu trebati više alata kao što su Pattern Computer's.

Smarr napominje da je probojni model Computer Computer koji je napravio u svom istraživanju samo jedan eksperiment. No, Hood kaže da je optimist da bi P4 mogao biti stvarnost prije dugo vremena. Konačno, kaže, istraživači mogu "pogledati podatke i bolesti rezolucijom kakvu nikada prije nismo imali."