• Suomi
  • English

Syöpää vastaan matematiikalla

Syövän   tutkimuksessa   käytetään   entistä   enemmän laajoja data-aineistoja ja tietokantoja. Helsingin yliopiston lääketieteellisen tiedekunnan systeemibiologian professorin Sampsa Hautaniemen tutkimusryhmässä kehitetään menetelmiä, joiden avulla voidaan integroida dataa eri lähteistä, kuten DNA:sta, geenien   ilmentymisestä ja proteiinien toiminnasta. Kun analyysien tulokset yhdistetään biolääketieteellisiin tietokantoihin, voidaan tehdä kokeellisesti testattavia ennusteita. Tästä on hyötyä esimerkiksi diagnostiikassa ja hoitomenetelmien suunnittelussa.

 

Sampsa Hautaniemi työskenteli Massachusetts Institute of Technologyssa (MIT) ennen kuin perusti oman   tutkimusryhmän Helsingin yli­opistoon vuonna 2006. Hautaniemen laborato­riossa analysoidaan monimutkaisia, sairauksiin liittyviä   biologisia   järjestelmiä   matemaattisin   menetelmin. Ilman laskennallista apua tieto­massojen analysointi ei onnistu.

”Biolääketieteellisessä   tutkimuksessa,   eten­kin   tulosten   tulkintavaiheessa,   tarvitaan   tietokantoja ja laskennallisia menetelmiä”, toteaa Hautaniemi.

Biomedicumissa  toimivan systeemibiolo­gian ryhmän tavoitteena on soveltaa laskennal­lisia menetelmiä lääketieteellisiin tutkimuskysy­myksiin. Esimerkiksi mitkä geneettiset profiilit vaikuttavat syövän riskiin tai millainen ennuste potilaalla on, jos hänellä on tietty geneettinen profiili? Tarkoituksena on löytää potilaalle yksi­löllinen, genomisen profiilin mukainen hoito­ keino.

”Meidän   tavoitteemme   on   ymmärtää   syö­päsolun käyttäytymistä ja etsiä kohteita, joiden aktiivisuutta muokkaamalla syöpäsolut saadaan kuolemaan   mahdollisimman   pienillä   sivuvai­kutuksilla. Kun syöpäpotilasta halutaan hoitaa, niin pitää ymmärtää ensin, miten kasvaimen solut tekevät päätöksiä siitä, miten ne kasvavat, lisääntyvät ja liikkuvat. Pyrimme tähän geno­minlaajuisten mittausmenetelmien ja   mate­maattisten menetelmien avulla.”

Esimerkiksi rintasyövän hoidossa on tärkeää pystyä ennakoimaan etäpesäkkeiden syntymi­sen todennäköisyys. Vaikka hoitoennuste rinta­syövälle paranee koko ajan, etäpesäkkeet lisäävät huomattavasti sairastumisriskiä.

”Ongelma on, että ei tiedetä miten ja mitkä solut kasvaimesta irtoavat, minne ne menevät ja kuinka ne siellä toimivat.”

Tutkimalla geenien aktiivisuutta ja yhdistele­mällä tietoa pyritään päättelemään, kenellä on suuri todennäköisyys saada etäpesäkkeitä. Nykyiset mittausmenetelmät, kuten mikro­sirut ja uuden sukupolven sekvenaattorit, tuot­tavat valtavat määrät dataa.

”Emme tällä hetkellä vielä tiedä solun sisäi­siä päätekijöitä, jotka vaikuttavat syövän hoito­vasteeseen. Siksi tutkimuksessa käytämme koko genomin mittaavia menetelmiä eri tasoilta.”

Tällaisia menetelmiä ovat DNA:n ja RNA:n sekvensointien lisäksi mm. epigenetiikka, jossa analysoidaan elintapojen vaikutusta geenien toi­mintaan. Tärkeää on myös proteomiikka, joka selvittää proteiinien ja niiden rakenteen toimin­taa.

 

Sopiva lääke datan perusteella

 

Yhdestä syöpäkasvaimesta voidaan mitata yli neljä miljardia havaintopistettä. Tästä havainto­massasta pitäisi pystyä löytämään syövän kehi­tykselle ja lääkevasteelle ominaisimmat tekijät. Hautaniemen mukaan muutos on melkoinen, kun sitä verrataan tilanteeseen 10–20 vuotta sit­ten,   jolloin   tavallisesti   puhuttiin   muutamien   kymmenien tai satojen havaintojen käsittelystä.

”Lisäksi tietokannoista löytyy genominlaa­juista tietoa tuhansista syöpäpotilaista. Näiden hyödyntäminen suomalaisen aineiston rinnalla on tärkeää, mutta haastavaa.”

Ennusteen lisäksi Hautaniemen ryhmä etsii laskennallisen analyysin perusteella myös sopi­via hoitomenetelmiä. Hautaniemen ryhmä kartoittaa esimerkiksi geenimuunnosten vaikutus­ta lääkevasteeseen. Syövän hoidossa käytetään solunsalpaajia eli sytostaatteja, jotka tuhoavat syöpäsoluja. Tärkeää on löytää sopiva sytostaat­ti, sillä potilas ei aina reagoi hyvin annettuun lääkeaineeseen.

Hautaniemen   laboratorio   on  yhteistyössä  professori Olli Carpénin ryhmän   kanssa käyt­tänyt tutkimuksessaan genominlaajuista tietoa sadoista munasarjasyöpäpotilaista. Tutkijat ovat etsineet   potilaitten joukosta sellaisia alaryh­miä, jotka ovat kehittäneet resistanssin tavan­omaiselle kemoterapiahoidolle, jossa käytetään solunsalpaajina platinajohdoksia ja taksoideja.

Tutkimushanke käyttää satojatuhansia prosesso­ritunteja supertietokoneen laskenta­aikaa sekä kymmeniä teratavuja tallennuskapasiteettia.

”Tietynlaisen geneettisen profiilin omistaval­le henkilölle jotkin lääkkeet voivat olla jopa hai­tallisia, toisesta taas on optimaalinen hyöty.”

 

Miten data muutetaan tiedoksi?

 

Hautaniemi ryhmineen on kehit­tänyt menetelmiä käyttämällä lymfoomaan liit­tyvää dataa yhdessä professori Sirpa Lepän ryh­män kanssa. Haasteena on, miten geeneistä ja proteiineista kerätty data muutetaan tiedoksi.

“Kliinisistä näytteistä tehdyt havainnot ovat aina melkoisen kohinaisia ja moniulotteisia, eli gee­nejä, proteiineja tai potentiaalisesti kiinnostavia DNA-alueita on tuhansia.   Siksi on olennaista vastata oikeisiin ja tarpeellisiin lääketieteellisiin kysymyksiin niin, että tulokset ovat hyödyllisiä. Tämän jälkeen tutkimuskysymykset pitäisi voi­da ratkaista matemaattisilla menetelmillä.”

Lymfooma­-   ja   munasarjasyöpädataa   ana­lysoidessaan Hautaniemen ryhmä käytti niin sanottua syväsekvensointimenetelmää.   Mene­telmässä DNA tai RNA pilkotaan ja sekvensoi­daan, minkä jälkeen molekyylien emäsjärjestys muutetaan   tietokoneen   ymmärtämään   muo­toon.   Tietokonemuotoon   muutettuja   lyhyitä   sekvenssipätkiä voi olla satoja miljoonia.

Hautaniemen   mukaan   suurin   pullonkaula   lääketieteellisen datan muuttamisessa tiedoksi on ehkä lääketieteellisten kysymysten ymmärtäminen niin, että ne voidaan muokata lasken­nallisiksi ongelmiksi.

Tämän ongelman ratkai­semiseksi Hautaniemi ryhmineen on kehittänyt tietokoneohjelmiston nimeltä GROK (Genomic Region Operation Kit). Sen avulla kysymykset saadaan käännettyä laskennallisiksi ongelmiksi ja pystytään ratkaisemaan datan perusteella. GROK­-työkalu on yleiskäyttöinen ja sitä on käytetty eturauhassyövän etenemisen ymmärtä­miseen. Tutkimus tehtiin yhteistyössä professo­ri Olli Jänteen laboratorion kanssa. Yhteistyön tuloksena FoxA1­proteiinin toimintaa yhdessä AR-proteiinin kanssa, joka on keskeisin eturauhasssyö­vässä vaikuttava proteiini, ymmärretään parem­min.   Lisäksi   tutkimuksessa   huomattiin,   että   suuri   määrä   FoxA1­proteiinia   antaa   huonon   ennusteen, pieni määrä hyvän. Tulevaisuudessa tuloksia voidaan käyttää hoitoennusteen teke­misessä ja hoidon suunnittelussa. Hautaniemen mukaan kehitettyjä menetelmiä voidaan sovel­taa mihin tahansa syöpään.

”Olemme esimerkiksi tutkineet rinta­-, etu­rauhas-­   ja   munasarja­syöpiä   kehittämilläm­me   menetelmillä.   Vaikka kasvaimet   löytyvät   eri elimistä, niin niillä on huomattavan paljon samankaltaisuuksia molekyylitasolla. Siten tule­vaisuudessa voisi olla mahdollista käyttää rinta­syöpälääkettä esimerkiksi joissain munasarjan­syöpien alatyypeissä. Tätä ennen pitää pystyä karakterisoimaan kunkin syövän   alatyypit.   Tämä tarkoittaa sitä, että pystymme tulevaisuu­dessa sekä löytämään luotettavasti samankaltai­set syövät riippumatta niiden sijainnista ja suo­sittelemaan niille sopivaa tehokasta lääkitystä.”

Hautaniemi uskoo, että tulevaisuudessa syö­päsolun sekvensointi on osa   rutiinisyöpädiagnostiikkaa.

“Pyrimme löytämään tekijät kullekin kasvaintyypille ja yksittäiselle kasvai­melle, ja on vain ajan kysymys, kun ymmärrämme kasvaimien biologiaa niin hyvin, että pystymme   laskemaan   nopeasti   ennusteen   ja   todennäköisesti   toimivien   lääkkeiden   kombi­naatiot niiden genomin perusteella. Tähän pää­semisessä ja teknologian hyödyntämisessä las­kennalliset tieteet ovat avainasemassa.”

 

ELIXIR: eurooppalaista helpotusta biolääketieteellisen datan käsittelyyn

 

Biotieteellisten   kokeiden   tuottama   data   kak­sinkertaistuu   nykyään   muutaman   kuukauden   välein, ja määrä on edelleen kasvussa. Lisäksi kokeet tuottavat aivan uudenlaista dataa. Tutki­musten tuottamien valtavien datamäärien kertyminen on synnyttänyt tarpeen hallita kaikkea tuota informaatiota systemaattisesti. ELIXIRin tavoitteena on harmonisoida datan tallennus, käsittely ja analysointi.

Tietokannat alkavat monessa suhteessa olla elintärkeitä   biotieteiden   tutkimukselle,  mutta   niitä on usein ylläpidetty ikään kuin muun tut­kimustoiminnan ohella ja määräaikaisen tutki­musrahoituksen varassa. Yksi ELIXIRin merkittävimmistä tavoitteis­ ta onkin tärkeimpien biologista tutkimustietoa sisältävien tietokantojen rahoituksen turvaami­nen. Kun tietoa kokoava ja jakeleva järjestelmä on kuitenkin pysyvä, tutkimusryhmät voivat raken­taa omaa toimintaansa sen varaan. ELIXIR infra­struktuuri tarjoaa myös järjestelmän ja rahoitus­väylän Suomessa kehitetyille, koko Euroopassa merkittäville palveluille. Kaikkien ei tarvitse teh­dä samaa tietokantaa itse, vaan kertaalleen luotua dataa voidaan käyttää tehokkaasti useammassa paikassa ja tehtäviä voidaan jakaa.

”Bioinformatiikan   ala   on   niin   laaja,   ettei   yksikään laboratorio pysty tarjoamaan kaikkia palveluita laidasta laitaan. Se, mitä Suomen ja ESFRI­-hankkeiden infrastruktuurit tuovat tul­lessaan on tietty selkeys ja tiedonkulun paran­tuminen. Tiedämme, mitä muualla tehdään ja suunnitellaan”, Hautaniemi huomauttaa.

Ari Turunen

 

Artikkeli PDF-muodossa

 

Lisätietoja:

Genomic region operation kit

http://csbi.ltdk.helsinki.fi/grok/

Ovaska, Lyly, Sahu, Jänne, Hautaniemi (2013): Genomic region operation kit for flexible processing of deep sequencing data