• Suomi
  • English

Tekoäly auttaa arvioimaan rintasyövän riskitekijöitä

Rintasyövän geneettisiä riskitekijöitä on tähän mennessä yleensä tutkittu yksittäisinä tekijöinä. Professori Arto Mannermaan tutkimusryhmä haluaa tutkia laajempaa kokonaisuutta ja etsiä useampia tekijöitä, jotka yhdessä ja vuorovaikutuksessa toistensa kanssa vaikuttavat merkittävästi sairastumisriskiin. Avuksi tähän tulee tekoäly.

Mannermaan ryhmässä kehitetään genomidatan ja kliinisen datan perusteella oppivia algoritmeja, jotka tunnistavat ja ennustavat riskitekijöitä. Oppivia algoritmeja hyödynnetään myös mammografiakuvien tulkitsemisessa. Genomidata ja kliininen data yhdistetään tekoälymalliksi, joka auttaa paitsi sairastumisriskin määrittämisessä, myös yksilöllisten hoitosuunnitelmien tekemisessä.

Mitkä kaikki tekijät ovat vaikuttaneet siihen että henkilö on saanut rintasyövän, on se kysymys, johon Mannermaa haluaa vastauksen. Mannermaan ryhmä on luonut rintasyövän riskitekijöiden tekoälymallin, jota testataan suomalaisessa ja kansainvälisessä aineistossa.

”Käytössämme on myös biopankista saatua aineistoa. Vertaamme rintasyöpään sairastuneiden ja terveiden henkilöiden dataa ja yritämme saada vastauksen, mikä on se kaikkien muuttujien vuorovaikutteinen yhdistelmä, joka eniten vaikuttaa rintasyövän syntyyn” kertoo Mannermaa.

Yksi tutkimuksen kohteista ovat perimän normaalivaihteluun kuuluvat tekijät, snipit. DNA-sekvensointitekniikoiden nopea kehittyminen on mahdollistanut yhden nukleotidin polymorfismien (single nucleotide polymorphism, SNP) selvittämisen, joka antaa hyvin tarkan arvion yksilöiden välisistä eroista. SNP eli snippi on populaatiossa esiintyvä mutaation aiheuttama ero DNA-ketjussa.

Mannermaan ryhmä pyrkii tekoälyn ja oppivien algoritmien avulla tunnistamaan rintasyöpään liittyvät snipit. Tulokset ovat olleet lupaavia. Algoritmin avulla tunnistettiin geenit snippien lähellä ja nämä snipit todennäköisesti vaikuttavat geenien toimintaan. Löydettiin geeniverkosto, joka liittyy estrogeenin aineenvaihduntaan.

Mannermaan ryhmän tutkimuksissa käyttämän datan määrä on niin iso, että siihen tarvitaan ELIXIRin Suomen keskuksen CSC:n superlaskentakapasiteettia.

”Yhdestä laboratorionäytteestä saadaan määritettyä n. 200 000 snippiä. Jokaista snippiä verrataan toisiinsa. Lisäksi simuloidaan mitä geneettistä vaihtelua, eli määrittämättä jääneitä snippejä niiden välissä on. Näin laskennallisesti määriteltyjä snippejä saadaan riskiarviointiin lisää jopa 10 miljoonaa. Kun tähän tuodaan vielä kuvantamisesta ja biopankista saadut muuttujat, laskentateholle on tarvetta.”

Mannermaan tutkimusryhmän tekoälyn perusmalli perustuu geneettiseen dataan. Nyt malliin on tuotu kliinisiä muuttujia eli tunnettuja rintasyövän riskitekijöitä. Mannermaa uskoo, että malli tuo merkittäviä parannuksia diagnostiikkaan.

Lue lisää artikkelista