• Suomi
  • English

Syväoppimisalgoritmit auttavat rintasyövän seulonnassa

Tutkija Raju Gudhe on keskittynyt yhdistämään tietojenkäsittelytieteen älykkäisiin järjestelmiin. Hän kehittää syväoppimisalgoritmeja rintasyövän riskien analysoimiseen käyttämällä radiologista ja kliinistä dataa. Näitä algoritmeja on opetettu hyödyntämään massiivisia datajoukkoja, joita on saatu Kuopion yliopistollisesta sairaalasta, jotta ne ennustaisivat rintojen tiheyden mammografiakuvista.

 

”Yritämme paikallistaa kiinnostavia alueita mammografiakuvista ja luokitella kasvaintyypin saatujen tunnusmerkkien perusteella käyttämällä syväoppismisalgoritmeja, sanoo Gudhe, joka työskentelee data-analyytikkona Itä-Suomen yliopiston kliinisen lääketieteen yksikössä Kuopiossa.

Mammografia eli rintojen röntgenkuvantamistekniikka, on yksi yleisimmin käytettyjä menetelmiä varhaisen asteen rintasyövän havaitsemiseksi. Varhainen rintasyövän havaitseminen alentaa merkittäväsi kuolleisuuslukuja. Vuonna 1987 Suomi aloitti ensimmäisenä maana maailmassa maanlaajuisen syöpäseulontaohjelman. Silti mammografia ei ole täydellinen. Mammografiakuvat eivät ole erityisen tarkkoja eivätkä aina havaitse syöpätapauksia ja kuvat voivat näyttäytyä normaaleina, vaikka syöpä olisikin kyseessä.

Täysin automaattinen malli arvioimaan rinnan tiheyttä

Rinnoissa on vaihtelevia määriä rasvakudosta ja tiivistä kudosta. Tiiviimpi kudos näyttää mammogrammeissa vaaleana röntgensäteiden vaimentumisen takia. Suurin osa rintasyövistä esiintyy tiiviissä kudoksessa, jonka vaaleus peittää alleen noin 25% mammogrammeista havaituista syöpätapauksista.

“Vaaleus voi naamioida syöpien läsnäolon: se on kuin löytäisi lumimiehen sakeassa lumipilvessä”, sanoo Gudhe.

Tiiviin kudoksen kuvioiden ja jakautumisen perusteella radiologit luokittelevat rinnat joko “tiheisiin” tai “rasvaisiin”. Naisilla, joilla on erittäin tiheää rintakudosta, on suurempi riski saada rintasyöpä.

Rintasyöpä sijaitsee yleensä tiheässä kudoksessa. Koska kudos näkyy vaaleana mammografiakuvissa, noin 25% syövistä ei näy mammografiassa. Kuvien vaaleus voi peittää syöpätapaukset.

Tutkijat Itä-Suomen yliopistossa ja Kuopion yliopistollisessa sairaalassa ovat kiinnostuneita kehittämään täysin automaattisen mallin arvioimaan rinnan tiheyttä. Rinnan tiiviys, yksi vahvimpia riskitekijöitä rintasyövässä, on mittaustulos tiiviin kudoksen suhteellisesta osuudesta. Tarkka tiiviin kudoksen segmentointi mammografiakuvassa voi vähentää väärien diagnoosien todennäköisyyttä.

Itä-Suomen yliopistossa kehitetyt algoritmit voivat auttaa radiologisteja arvioimaan rinnantiheyden tarkasti. Merkittävin haaste syväoppimisen malleja käytettäessä on massiivinen datan määrä, jota ne tarvitsevat. Lisäksi lääketieteessä hankittuihin kuviin liittyvät tarkat kuvailutiedot, annotaatiot, lisäävät datan kompleksisuutta.

“Käytämme tuhansia mammografiakuvia, jotka kokeneet radiologit ovat manuaalisesti annotoineet, jotta saataisiin luotua tarkat opetusjoukon luokittelut (ns. ground truth label) syväoppimisen malleihimme. Olemme kehittäneet uudenlaisen arkkitehtuurin, joka perustuu U-Net -malliin, huippuluokan ratkaisuun lääketieteellisten tiiviin kudoksen kuvien segmentoimiseen,” sanoo Gudhe.

Algoritmit voivat tunnistaa kasvaimen mammogrammeista. Rinnan tiheys on yksi yleisemmistä riskitekijöistä. Mitä tiheämpi rinta, sitä suurempi riski. Syväoppimisalgoritmit voivat auttaa radiologeja ennustamaan tarkasti rinnan tiheyden prosenttimäärän.

Koska mammografiakuvat ovat korkearesoluutioisia, suurta laskentatehoa tarvitaan niihin yhdistettyjen syväoppimisen mallien opettamiseen. Suomen ELIXIR -keskuksen CSC:n palveluja käytetään sensitiivisen datan tehokkaaseen käsittelyyn ja mallien opettamiseen CSC:n grafiikkaprosessoreja.

Raju Gudhe korostaa, että kestävän mallin tekemiseksi kliinisille toimenpiteille tutkijoiden täytyy integroida erilaisia kuvantamismuotoja ja muita kliinisiä yksityiskohtia algoritmeihinsa. Näitä ovat – mammografiakuvien lisäksi – ultraääni ja magneettiresonanssikuvantaminen. Seuraava askel on integroida kuvantamisdata ja genomidata syöpäriskin analysoimiseen.

“Mammografiakuvia käyttämällä voimme tunnistaa rinnan tiheyden ja tiheysarvojen perusteella voimme saada aikaan seuraavan kuvantamistavan. Emme voi nojata yhteen kuvien kuvantamistapaan, mikä on syynä, että tietoa ei voi käyttää suoraan kliinisessä työssä. Jotta saisimme päästä-päähän mallin, joka pystyy tekemään hyvän luokittelun ja ennusteen, tarvitsemme myös genomidataa.”

 

Ari Turunen

Lue artikkeli PDF-muodossa

Lisätietoja:

Lääketieteen laitos, Itä-Suomen yliopisto

https://www.uef.fi/fi/web/laake

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
http://www.elixir-finland.org
http://www.elixir-europe.org