
Helmikuussa 2021 alkanut kuusivuotinen BIGPICTURE -projekti kerää kolme miljoonaa skannattua ja digitalisoitua patologian kuvaleikettä Euroopan eri sairaaloista, tutkimusorganisaatioista ja lääkealan yrityksistä. Yksi hankkeeseen osallistuva tutkija on Helsingin Biopankin (HUS) patologi Yossra HS Zidi-Mouaffak, joka on toinen koordinaattori BIGPICTURE -projektin Suomen solmupisteessä. Hän keskittyy siihen, miten tekoälyä voidaan käyttää patologiassa.
Hankkeeseen osallistuu 45 organisaatiota 15 maasta. Suomesta mukana on Helsingin yliopistollinen sairaala HUS ja erityisesti Helsingin Biopankki sekä CSC – Tieteen tietotekniikan keskus. BIGPICTURE -alustaa rakennetaan patologien, tutkijoiden, tekoälyn kehittäjien, potilaiden ja teollisuuden edustajien yhteistyönä. Tiedostot tallennetaan arkistoon tietokannaksi, joka mahdollistaa uudet ja tehokkaat tekoälysovellukset. Tämä edesauttaa patologian diagnostiikan digitalisaatiota ja tuo uusia menetelmiä kudosten analysoimiseen. Näytteitä voidaan analysoida tekoälyn avulla.
Yossra HS Zidi-Mouaffak on Helsingin Biopankin (HUS) patologi ja väitöskirjatutkija professori Olli Carpénin tutkimusryhmässä Helsingin yliopistossa. Yksi Zidi-Mouaffakin projekteista liittyy digitaaliseen patologiaan ja paksunsuolen syöpään.
”Paksunsuolen syöpä on toiseksi tappavin ja kolmanneksi yleisin diagnosoitu syöpä maailmassa. Se on myös toiseksi yleisin syöpätyyppi Suomessa. Syöpäpotilaita hoidetaan pääsääntöisesti kirurgisilla ja onkologisilla toimenpiteillä riippuen taudin asteesta,” sanoo Zidi-Mouaffak.
Onkologiset toimenpiteet voivat sisältää kemoterapiaa ja sädehoitoa.
”Projektissamme keskitymme erityisesti niihin potilaisiin, joilla on II asteen paksunsuolensyöpä ja joilla tehostetun kemoterapian riski-hyöty –suhde on usein marginaalinen. Tätä voidaan parantaa luokittelemalla potilaat korkeamman ja alhaisemman riskin ryhmiin.”

II asteen paksunsuolen syöpää pidetään sairauden varhaisena vaiheena, jolloin kasvaimen tunkeutuminen pysyy ”paikallisena” ilman, että etäpesäkkeet olisivat levinneet muualle kehoon. Kasvain voi myös ulottua rasvakudokseen tai viereiseen elimeen, mutta se ei ole levinnyt imusolmukkeisiin. Noin 75 prosentilla II asteen potilaista syöpä ei uusiudu, kun leikkauksesta on kulunut viisi vuotta.
”Valitettavasti 25 prosentilla potilaista syöpä uusiutuu, mutta nämä potilaat voisivat hyötyä operaation jälkeisestä kemoterapiasta. Kysymys onkin: kuinka arvioida, keillä potilaista on korkea riski saada syöpä uudestaan? Projektimme perimmäinen tavoite on tarjota paksunsuolen syövän ennustava työkalu. Luotettavien tulosten saamiseksi tarvitaan merkittävä määrä dataa ja kuvia. BIGPICTURE auttaa tarjoamalla tutkijoiden käyttöön suuret määrät dataa ja tekoälyyn liittyviä työkaluja. Tämä edistää luonnollisesti nopeammin tämän alan tutkimusta.”
Zidi-Mouaffak valitsee, annotoi ja analysoi skannattuja mikroskooppikuvia, jotka on saatu syöpäpotilaiden kirurgisista kudosnäytteistä. Kudosnäytteet on värjätty hematoksyliini-eosiini -tekniikalla, jolloin kudosten osat värjäytyvät pH:n mukaisesti.
Kaksi suomalaista biopankkia, Auria ja Helsingin Biopankki, toimittavat data-aineistoja, jotka sisältävät kokoleikekuvia varustettuna kuratoidulla metadatalla. Tällaisia tietoaineistoja käytetään koneoppimisen malleiksi konvoluuvio-neuroverkkojen avulla.
Auria Biopankista ja Helsingin Biopankista toimitetut kokoleikekuvat ovat dataa, jolla luodaan koneoppimisen. Tekoälymallit analysoivat kuvia, jotka on aiemmin valittu ja annotoitu.
“Patologina uskon, että koneoppimisella on potentiaalia patologien työn parantamisessa. Koneoppimisen algoritmeja voidaan käyttää diagnostiikan työkaluina rutiinitöissä, joissa ne olisivat ilmeisen nopeampia ja tarkempia kuin ihmissilmä.”

Zidi-Mouaffak antaa muutamia esimerkkejä tekoälyn mahdollistamasta diagnostiikasta: solunjakautumisen tunnistaminen ja laskeminen (mitoosi), tiettyjen immuunisolujen laskeminen tietyillä alueilla tai solujen leviämisindeksien tarkka arvioiminen.
“Kuvadataan perustuvia tekoälytyökaluja, joita voidaan käyttää päätöksenteossa ennustettaessa sairauden lopputulemaa, on kuitenkin erittäin haasteellisia kehittää. Ne edelleenkin vaativat pitkiä testausjaksoja ja validointia ennen kuin niitä voidaan varsinaisesti käyttää kliinisessä työssä.”

BIGPICTURE-projektissa luodaan ensimmäiseksi tallentamiseen tarkoitettu infrastruktuuri, joka mahdollistaa miljoonien erittäin isojen kuvatiedostojen käsittelyn, tallentamisen ja jakamisen. Patologiset kuvat voivat olla jopa gigatavujen suuruisia. Leikekuvat on varustettu metadatalla. Tämän materiaalin avulla voidaan kehittää tekoälytyökaluja, kuten algoritmeja. Syväoppimisen algoritmit opetetaan luokittelemaan morfologisesti samankaltaiset kohortit eli ne analysoivat näytteiden muotoja ja rakenteita. Tekoäly pystyy löytämään syöpään viittaavia piirteitä eli biomarkkereita ja ne voidaan todentaa.
“Viimeaikaisten tutkimusten perusteella uskomme, että tekoälyn soveltaminen etukäteen valittuihin digitaalisiin leikekuviin, jotka on saatu hyvin kuratoiduista kohorteista, voisi tarjota mielenkiintoisen vaihtoehdon käytössä oleville molekulaarisille ja morfologisille ennustaville markkereille.”
Tutkimusryhmän, jossa Zidi-Mouaffak on mukana, tavoitteena on kehittää ja todentaa uusi erilainen ja ennustava markkeri, joka voisi helpottaa II asteen paksunsuolen syöpää sairastavien potilaiden luokittelua.
Zidi-Mouaffakin mukaan syväoppimisen algoritmit voivat antaa yllättävän ja riittävän tarkkoja ennusteita tietyille syöpätyypeille, mutta monissa tapauksissa ei tiedetä, mihin algoritmi perustaa päätöksensä.
“Se on jonkinlainen musta laatikko. Tälle on selvästi lisätutkimuksen tarve ja säilytyspaikat, kuten BIGPICTURE-projektissa kehitetään, tulevat äärimmäisen relevanteiksi. Tämän tapainen tutkimus tarvitsee valtavia korkealaatuisia digitaalisia leikekuvia ja metadataa sisältäviä tietokantoja, mikä onkin BIGPICTURE-hankkeen tarkoitus.”
Ari Turunen
10.2.2022
Lue artikkeli PDF-muodossa
Sitaatti
Ari Turunen, Yossra HS Zidi-Mouaffak, & Tommi Nyrönen. (2022). BIGPICTURE helps pathology go digital. https://doi.org/10.5281/zenodo.8154477
Lisätietoja:
BIGPICTURE
HUS Helsingin yliopistollinen sairaala
Helsingin Biopankki
https://www.helsinginbiopankki.fi/
Auria Biopankki
https://www.auria.fi/biopankki/
CSC – Tieteen tietotekniikan keskus Oy
on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
ELIXIR
rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.