Itä-Suomen yliopiston Bioinformatiikan keskuksessa kehitetään Virpi Aholan johdolla biolääketieteellisen ja multimodaalisen datan analysoimiseen uusia sovelluksia. Näitä voidaan hyödyntää syöpien, metabolisten, sydän- ja verisuonisairauksien sekä hermostoa rappeuttavien sairauksien tutkimisessa.
Aholalla on pitkä ura bioinformatiikasta. Hän oli mukana professori Ilkka Hanskin metapopulaatiobiologian tutkimusryhmässä, jossa sekvensointiin täpläverkkoperhosen koko genomi. Se oli ensimmäinen Suomessa tehty referenssigenomi. Karolinska Institutissa Hong Kongissa hän analysoi geenien toimintaa eri taudeilla yhden solun tasolla ja tutki sen avulla, miten kantasoluja käyttämällä voidaan kehittää uusia lääkkeitä ja hoitoja. Nyt hän johtaa Bioinformatiikkakeskusta.
Bioinformatiikakeskuksessa yhdistellään erilaisia omiikka-datoja (genomiiikka, proteomiikka, transkriptomiikka) kliiniseen dataan ja jatkossa mahdollisesti myös kuvantamisdataan.
”Tavallisten omiikka-analyysien lisäksi tehdään eri tutkimusryhmille multimodaalista data-analyysiä. Siinä yhdistetään erityyppisten datojen analyysi ja pyritään siihen, että saadaan enemmän tietoa kuin erikseen analysoimalla.”
Multimodaalisen datan analyysitapa vaihtelee sen mukaan, onko erityypiset datat kerätty samasta potilaasta vai ovat ne peräisin eri potilaista.
Omiikka on tutkimustapa, jolla pyritään analysoimaan tutkimuskohteen kaikkia geneettisesti määräytyviä muuttujia samanaikaisesti. Kun genomiikassa analysoidaan geneettistä muuntelua ja geenien toimintaa, proteomiikassa keskitytään proteiineihin ja epigenetiikassa geenien toiminnan säätelyyn ja perinnöllisen tiedon tallentumiseen ilman DNA-sekvenssin muutoksia. Metabolomiikassa analysoidaan sairauden, ruokavalion tai lääkityksen aiheuttamia muutoksia aineenvaihdunnassa.
”Kehitämme bioinformatiikkapalveluja yhteistyössä biolääketieteen asiantuntijoiden kanssa. Yksi painopiste Itä-Suomen yliopistossa on keskeisten kroonisten kansansairauksien molekulaarisen taustan selvittämisessä sekä niiden ehkäisyn ja hoidon kehittämisessä”, sanoo Ahola.
Translationaalinen eli niveltävä lääketiede hyödyntää perustutkimusta kliinisessä tutkimuksessa ja toisaalta potilasnäytteitä ja tautimalleja tautimekanismien ja lääkevaikutuskohteiden selvittämisessä. Lähtökohtana on poikkitieteellisyys, joka auttaa tutkimuksen ohella myös potilaita.
”Translationaalisen lääketieteen tulemista hidastaa se, että ei kerta kaikkiaan tiedetä tarpeeksi. Monen eri datalähteen yhdistämisen lähtökohta on, että saataisiin enemmän tietoa esille. Yhdistäminen on hyvin paljon laskennallista ja siihen tarvitaan CSC:n resursseja ja ELIXIRin tapaisia infrastruktuureja.”
Yhtenä esimerkkinä Ahola mainitsee yksisolutekniikat.
Transkriptiossa DNA:ssa olevaa geneettistä koodia kopioituu RNA:ksi. Transkriptio on proteiinisynteesin ensimmäinen vaihe. Transkriptomiikan avulla saadaan tarkkaa tietoa yksittäisen solun geenien ilmenemisestä juuri tietyllä hetkellä.
”Yksisolutranskriptomiikan käyttö on vielä kallista. Avoimen tieteen periaatteet ovat olemassa ja sen vuoksi kaikki data pitää jakaa, kun se julkaistaan. Tällöin dataa voi uudelleen käyttää ja eri datalähteitä yhdistellä.”
Haasteena on kuitenkin, että dataa on tuotettu erilaisilla teknologioilla.
”Eri datalähteissä voi solujen määrä vaihdella tai niissä voi olla eri solutyyppejä. Minkälaisia menetelmiä pitäisi tällöin käyttää erilaisten datojen yhdistämiseen? Jos tämä voitaisiin ratkaista, silloin voitaisiin tehokkaammin tutkia potilaan solujen kehitystä ja niiden erikoistumista.”
Aholan tavoitteena on avustaa enemmän laskennallisten menetelmien käytössä. Itä-Suomen yliopiston Bioinformatiikan keskus tarjoaa tutkijoille laskentakapasiteettia ja auttaa tutkijoita esikäsittelemään ja analysoimaan dataa sekä avustamaan erilaisten laskennallisten menetelmien ja ohjelmistojen käytössä ja asentamisessa.
”Jos samassa ryhmässä tai yhteistyökumppanina ei ole bioinformaatikkoja, tutkijoiden oletetaan hallitsevan myös laskennalliset menetelmät ja ison datan käsittelyn.”
Ahola myöntää, että vaatimukset ovat kovat esimerkiksi jatko-opiskelijoille.
Itä-Suomen yliopistossa on tähän haasteeseen on tartuttu perustamalla laskennallisen biolääketieteen suuntautumisvaihtoehto.
”Yksi esimerkki datan uudelleenkäsittelyn haasteista ovat suomalaiset biopankit, joihin on tallennettu yli puolen miljoonan suomalaisen genomit. Ei ole ihan yksinkertainen juttu käydä biopankeissa analysoimassa dataa, koska sitä on ihan järjetön määrä.”
Ahola viittaa FinnGen -tutkimushankkeeseen, joka käynnistyi syksyllä 2017. Sen päätavoitteena on lisätä ymmärrystä sairauksien syistä ja edistää niiden diagnosointia, ennaltaehkäisyä ja hoitojen kehittämistä. FinnGen -tutkimuksessa hyödynnetään suomalaisten biopankkien keräämiä näytteitä. Kesäkuuhun 2023 mennessä FinnGen -tutkimukselle saatiin kerättyä yli 553 000 näytettä. Tutkimushankkeen ensimmäisen vaiheen kesto oli kuusi vuotta. Vastaavan kokoluokan tutkimushankkeita on maailmassa vain muutama.
Tutkimushankkeissa genomidata yhdistetään kansallisissa terveydenhuollon rekistereissä oleviin aineistoihin. Suomessa onkin harvinaisen hyvät edellytykset koko väestön kattavalle geenitutkimukselle.
Kliininen data pitkittäistutkimuksista yhdistettynä geenidataan tarjoaa paljon mahdollisuuksia. Mutta dataa pitää olla paljon.
”Datakokoelmia tarvitaan, koska yksikään tutkija ei voi kerätä 10 tai 100 tuhannen yksilön aineistoa. Jos aineisto on pienempi sillä ei välttämättä saada luotettavaa tietoa geneettisesti kompleksisten tautien tutkimiseen ”
Itä-Suomen yliopistossa on monia eri datalähteitä hyödyntäviä tutkimushankkeita. Itä-Suomen yliopiston ja Kuopion yliopistollisen sairaalan Alzheimerin tautia käsittelevässä hankkeessa yhdistetään potilaskäynneillä kerätty kliininen data FinnGen -aineistoon. Näin tutkijat pyrkivät selvittämään Alzheimerin taudin puhkeamiseen johtavia biologisia mekanismeja.
”FinnGenin biopankki on ainutlaatuinen resurssi, jota voitaisiin kuitenkin hyödyntää tutkimuksessa mahdollisesti vielä paljon enemmän”, sanoo Ahola.
”Toinen esimerkki Alzheimerin taudin tutkimuksesta on Rappta Therapeutics:in ja Itä-Suomen yliopiston professoreiden Mikko Hiltusen ja Annakaisa Haapasalon projekti, jossa tutkitaan transgeenisten solulinjojen avulla eri Alzheimerin hoitojen vaikutusta proteiinien toimintaan.”
Yksi mielenkiintoinen yhteistyöprojekti on akatemiatutkija Kirsi Ketolan kanssa.
Siinä tutkitaan eturauhassyövän hoitoon käytettyä karboplatiini-resistenssiä. Karboplatiini tuottaa ”DNA-ristilinkkejä”, mikä johtaa DNA:n korjausmekanismin aktivoitumiseen ja resistenssiin, jolloin syöpäsolut kykenevät taas jakautumaan. Tutkimukseen käytetään yksisolutekniikoita, jossa yksittäisen solun tasolla pystytään mittaamaan sekä geenien ilmentymistä että kromatiinin muutoksia.”
Kromosomit sijaitsevat tumassa pitkinä kromatiini-rihmoina.
Virpi Aholan mukaan hyvä datankäsittely ja sen taitava yhdistäminen voisi mahdollistaa yksilöllisen hoidon.
”Potilaille voitaisiin räätälöidä paremmin olemassa olevilla lääkkeillä tehtyjä hoitosuunnitelmia”.
Ahola kannattaa vahvasti datan avoimuutta ja uudelleenkäyttöä sekä sellaisen menetelmien ja infrastruktuurien luomista, joka helpottaa ja kannustaa tähän. Yhtenä esimerkkinä hän mainitsee EGA:n. European Genome-phenome Archive (EGA) on data-arkisto, jossa voi jakaa ja lupaa vastaan on mahdollista saada käyttöönsä jo julkaistuja biolääketieteellisiä datoja.
”Arkisto sisältää ihmisen genomista dataa, joka on yhdistetty kliiniseen ja muuhun metadataan. Koska periaatteessa henkilö voi olla mahdollista genomisen ja fenotyypin perusteella identifioida, datan jakamien on tarkkaan säädeltyä.”
Aholan mukaan EGA:n avulla datan jakaminen on hoidettu asianmukaisella tavalla ja näin arvokasta biolääketeteen tutkimusaineistoa on mahdollista käyttää uudelleen, kuten uusien tutkimushypoteesien luomiseen tai testaamiseen.
”Olemassa olevia aineistoja voidaan myös katsoa eri näkökulmasta. Esimerkiksi potilaita voidaan valita eri kriteereillä kuin jo julkaistussa tutkimuksessa tai aineistoja voidaan käyttää osana laajempaa datakokoelmaa.”
Aholan mukaan yhdessä pitäisi tehdä enemmän ja viittaa Biokeskus Suomeen, joka yhdistää seitsemän eri Suomen yliopiston biokeskusta. Yhteistyötä pitäisi pystyä lisäämään eri biokeskusten välillä ja yli valtakunnan rajojen esimerkiksi Suomen ELIXIR-keskus CSC:n avulla.
”ELIXIR on meille väylä verkostoitua ja oppia muiden bioinformatiikkakeskuksien kokemuksista sekä olla mukana niissä pöydissä, jossa tutkimusinfrastruktuuriin liittyvistä asioista keskustellaan ja uusia aloitteita tehdään.”
Koska uudet teknologiat tuottavat isoja ja kompleksisia data-aineistoja, tutkimusinfrastruktuureilta edellytetään muutakin kuin vain tutkimuslaitteistoja.
”Jotta aineistoja voitaisiin tehokkaasti hyödyntää, pelkkä esimerkiksi CSC:n tarjoama laskentakapasiteetti ei riitä vaan datojen käsittelyyn ja uudelleenkäyttöön tarvitaan niihin perehtynyttä henkilökuntaa. Näen, että biokeskusten parempi resursointi ja systemaattinen yhteistyö voisi olennaisesti helpottaa ja parantaa isojen genomisten datojen käsittelyä, yhdistämistä ja uudelleenkäyttöä.”
Ari Turunen
1.9.2023
Lue artikkeli PDF-muodossa
Lisätietoja:
Bioinformatiikkakeskus, Itä-Suomen yliopisto
https://uefconnect.uef.fi/tutkimusryhma/bioinformatiikkakeskus/
CSC – Tieteen tietotekniikan keskus Oy
on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
https://research.csc.fi/cloud-computing
ELIXIR
rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org