
Syövän tutkimuksessa käytetään entistä enemmän laajoja data-aineistoja ja tietokantoja. Helsingin yliopiston lääketieteellisen tiedekunnan systeemibiologian professorin Sampsa Hautaniemen tutkimusryhmässä kehitetään menetelmiä, joiden avulla voidaan integroida dataa eri lähteistä, kuten DNA:sta, geenien ilmentymisestä ja proteiinien toiminnasta. Kun analyysien tulokset yhdistetään biolääketieteellisiin tietokantoihin, voidaan tehdä kokeellisesti testattavia ennusteita. Tästä on hyötyä esimerkiksi diagnostiikassa ja hoitomenetelmien suunnittelussa.
Sampsa Hautaniemi työskenteli Massachusetts Institute of Technologyssa (MIT) ennen kuin perusti oman tutkimusryhmän Helsingin yliopistoon vuonna 2006. Hautaniemen laboratoriossa analysoidaan monimutkaisia, sairauksiin liittyviä biologisia järjestelmiä matemaattisin menetelmin. Ilman laskennallista apua tietomassojen analysointi ei onnistu.
”Biolääketieteellisessä tutkimuksessa, etenkin tulosten tulkintavaiheessa, tarvitaan tietokantoja ja laskennallisia menetelmiä”, toteaa Hautaniemi.
Biomedicumissa toimivan systeemibiologian ryhmän tavoitteena on soveltaa laskennallisia menetelmiä lääketieteellisiin tutkimuskysymyksiin. Esimerkiksi mitkä geneettiset profiilit vaikuttavat syövän riskiin tai millainen ennuste potilaalla on, jos hänellä on tietty geneettinen profiili? Tarkoituksena on löytää potilaalle yksilöllinen, genomisen profiilin mukainen hoito keino.
”Meidän tavoitteemme on ymmärtää syöpäsolun käyttäytymistä ja etsiä kohteita, joiden aktiivisuutta muokkaamalla syöpäsolut saadaan kuolemaan mahdollisimman pienillä sivuvaikutuksilla. Kun syöpäpotilasta halutaan hoitaa, niin pitää ymmärtää ensin, miten kasvaimen solut tekevät päätöksiä siitä, miten ne kasvavat, lisääntyvät ja liikkuvat. Pyrimme tähän genominlaajuisten mittausmenetelmien ja matemaattisten menetelmien avulla.”
Esimerkiksi rintasyövän hoidossa on tärkeää pystyä ennakoimaan etäpesäkkeiden syntymisen todennäköisyys. Vaikka hoitoennuste rintasyövälle paranee koko ajan, etäpesäkkeet lisäävät huomattavasti sairastumisriskiä.
”Ongelma on, että ei tiedetä miten ja mitkä solut kasvaimesta irtoavat, minne ne menevät ja kuinka ne siellä toimivat.”
Tutkimalla geenien aktiivisuutta ja yhdistelemällä tietoa pyritään päättelemään, kenellä on suuri todennäköisyys saada etäpesäkkeitä. Nykyiset mittausmenetelmät, kuten mikrosirut ja uuden sukupolven sekvenaattorit, tuottavat valtavat määrät dataa.
”Emme tällä hetkellä vielä tiedä solun sisäisiä päätekijöitä, jotka vaikuttavat syövän hoitovasteeseen. Siksi tutkimuksessa käytämme koko genomin mittaavia menetelmiä eri tasoilta.”
Tällaisia menetelmiä ovat DNA:n ja RNA:n sekvensointien lisäksi mm. epigenetiikka, jossa analysoidaan elintapojen vaikutusta geenien toimintaan. Tärkeää on myös proteomiikka, joka selvittää proteiinien ja niiden rakenteen toimintaa.
Yhdestä syöpäkasvaimesta voidaan mitata yli neljä miljardia havaintopistettä. Tästä havaintomassasta pitäisi pystyä löytämään syövän kehitykselle ja lääkevasteelle ominaisimmat tekijät. Hautaniemen mukaan muutos on melkoinen, kun sitä verrataan tilanteeseen 10–20 vuotta sitten, jolloin tavallisesti puhuttiin muutamien kymmenien tai satojen havaintojen käsittelystä.
”Lisäksi tietokannoista löytyy genominlaajuista tietoa tuhansista syöpäpotilaista. Näiden hyödyntäminen suomalaisen aineiston rinnalla on tärkeää, mutta haastavaa.”
Ennusteen lisäksi Hautaniemen ryhmä etsii laskennallisen analyysin perusteella myös sopivia hoitomenetelmiä. Hautaniemen ryhmä kartoittaa esimerkiksi geenimuunnosten vaikutusta lääkevasteeseen. Syövän hoidossa käytetään solunsalpaajia eli sytostaatteja, jotka tuhoavat syöpäsoluja. Tärkeää on löytää sopiva sytostaatti, sillä potilas ei aina reagoi hyvin annettuun lääkeaineeseen.
Hautaniemen laboratorio on yhteistyössä professori Olli Carpénin ryhmän kanssa käyttänyt tutkimuksessaan genominlaajuista tietoa sadoista munasarjasyöpäpotilaista. Tutkijat ovat etsineet potilaitten joukosta sellaisia alaryhmiä, jotka ovat kehittäneet resistanssin tavanomaiselle kemoterapiahoidolle, jossa käytetään solunsalpaajina platinajohdoksia ja taksoideja.
Tutkimushanke käyttää satojatuhansia prosessoritunteja supertietokoneen laskentaaikaa sekä kymmeniä teratavuja tallennuskapasiteettia.
”Tietynlaisen geneettisen profiilin omistavalle henkilölle jotkin lääkkeet voivat olla jopa haitallisia, toisesta taas on optimaalinen hyöty.”

Hautaniemi ryhmineen on kehittänyt menetelmiä käyttämällä lymfoomaan liittyvää dataa yhdessä professori Sirpa Lepän ryhmän kanssa. Haasteena on, miten geeneistä ja proteiineista kerätty data muutetaan tiedoksi.
“Kliinisistä näytteistä tehdyt havainnot ovat aina melkoisen kohinaisia ja moniulotteisia, eli geenejä, proteiineja tai potentiaalisesti kiinnostavia DNA-alueita on tuhansia. Siksi on olennaista vastata oikeisiin ja tarpeellisiin lääketieteellisiin kysymyksiin niin, että tulokset ovat hyödyllisiä. Tämän jälkeen tutkimuskysymykset pitäisi voida ratkaista matemaattisilla menetelmillä.”
Lymfooma- ja munasarjasyöpädataa analysoidessaan Hautaniemen ryhmä käytti niin sanottua syväsekvensointimenetelmää. Menetelmässä DNA tai RNA pilkotaan ja sekvensoidaan, minkä jälkeen molekyylien emäsjärjestys muutetaan tietokoneen ymmärtämään muotoon. Tietokonemuotoon muutettuja lyhyitä sekvenssipätkiä voi olla satoja miljoonia.
Hautaniemen mukaan suurin pullonkaula lääketieteellisen datan muuttamisessa tiedoksi on ehkä lääketieteellisten kysymysten ymmärtäminen niin, että ne voidaan muokata laskennallisiksi ongelmiksi.
Tämän ongelman ratkaisemiseksi Hautaniemi ryhmineen on kehittänyt tietokoneohjelmiston nimeltä GROK (Genomic Region Operation Kit). Sen avulla kysymykset saadaan käännettyä laskennallisiksi ongelmiksi ja pystytään ratkaisemaan datan perusteella. GROK-työkalu on yleiskäyttöinen ja sitä on käytetty eturauhassyövän etenemisen ymmärtämiseen. Tutkimus tehtiin yhteistyössä professori Olli Jänteen laboratorion kanssa. Yhteistyön tuloksena FoxA1proteiinin toimintaa yhdessä AR-proteiinin kanssa, joka on keskeisin eturauhasssyövässä vaikuttava proteiini, ymmärretään paremmin. Lisäksi tutkimuksessa huomattiin, että suuri määrä FoxA1proteiinia antaa huonon ennusteen, pieni määrä hyvän. Tulevaisuudessa tuloksia voidaan käyttää hoitoennusteen tekemisessä ja hoidon suunnittelussa. Hautaniemen mukaan kehitettyjä menetelmiä voidaan soveltaa mihin tahansa syöpään.
”Olemme esimerkiksi tutkineet rinta-, eturauhas- ja munasarjasyöpiä kehittämillämme menetelmillä. Vaikka kasvaimet löytyvät eri elimistä, niin niillä on huomattavan paljon samankaltaisuuksia molekyylitasolla. Siten tulevaisuudessa voisi olla mahdollista käyttää rintasyöpälääkettä esimerkiksi joissain munasarjansyöpien alatyypeissä. Tätä ennen pitää pystyä karakterisoimaan kunkin syövän alatyypit. Tämä tarkoittaa sitä, että pystymme tulevaisuudessa sekä löytämään luotettavasti samankaltaiset syövät riippumatta niiden sijainnista ja suosittelemaan niille sopivaa tehokasta lääkitystä.”
Hautaniemi uskoo, että tulevaisuudessa syöpäsolun sekvensointi on osa rutiinisyöpädiagnostiikkaa.
“Pyrimme löytämään tekijät kullekin kasvaintyypille ja yksittäiselle kasvaimelle, ja on vain ajan kysymys, kun ymmärrämme kasvaimien biologiaa niin hyvin, että pystymme laskemaan nopeasti ennusteen ja todennäköisesti toimivien lääkkeiden kombinaatiot niiden genomin perusteella. Tähän pääsemisessä ja teknologian hyödyntämisessä laskennalliset tieteet ovat avainasemassa.”
Biotieteellisten kokeiden tuottama data kaksinkertaistuu nykyään muutaman kuukauden välein, ja määrä on edelleen kasvussa. Lisäksi kokeet tuottavat aivan uudenlaista dataa. Tutkimusten tuottamien valtavien datamäärien kertyminen on synnyttänyt tarpeen hallita kaikkea tuota informaatiota systemaattisesti. ELIXIRin tavoitteena on harmonisoida datan tallennus, käsittely ja analysointi.
Tietokannat alkavat monessa suhteessa olla elintärkeitä biotieteiden tutkimukselle, mutta niitä on usein ylläpidetty ikään kuin muun tutkimustoiminnan ohella ja määräaikaisen tutkimusrahoituksen varassa. Yksi ELIXIRin merkittävimmistä tavoitteis ta onkin tärkeimpien biologista tutkimustietoa sisältävien tietokantojen rahoituksen turvaaminen. Kun tietoa kokoava ja jakeleva järjestelmä on kuitenkin pysyvä, tutkimusryhmät voivat rakentaa omaa toimintaansa sen varaan. ELIXIR infrastruktuuri tarjoaa myös järjestelmän ja rahoitusväylän Suomessa kehitetyille, koko Euroopassa merkittäville palveluille. Kaikkien ei tarvitse tehdä samaa tietokantaa itse, vaan kertaalleen luotua dataa voidaan käyttää tehokkaasti useammassa paikassa ja tehtäviä voidaan jakaa.
”Bioinformatiikan ala on niin laaja, ettei yksikään laboratorio pysty tarjoamaan kaikkia palveluita laidasta laitaan. Se, mitä Suomen ja ESFRI-hankkeiden infrastruktuurit tuovat tullessaan on tietty selkeys ja tiedonkulun parantuminen. Tiedämme, mitä muualla tehdään ja suunnitellaan”, Hautaniemi huomauttaa.
Ari Turunen
24.9.2015
Lue artikkeli PDF-muodossa
Sitaatti
Ari Turunen, Sampsa Hautaniemi, & Tommi Nyrönen. (2015). Fighting cancer with mathematics. https://doi.org/10.5281/zenodo.8068867
Lisätietoja:
Genomic region operation kit
http://csbi.ltdk.helsinki.fi/grok/
Ovaska, Lyly, Sahu, Jänne, Hautaniemi (2013): Genomic region operation kit for flexible processing of deep sequencing data
CSC – Tieteen tietotekniikan keskus Oy
on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keski- tettyä tietotekniikkainfrastruktuuria.
https://research.csc.fi/cloud-computing
ELIXIR
rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.