• Suomi
  • English

Sadat geenit voivat olla yksittäisen taudin taustalla

Professori Aarno Palotie Helsingin yliopiston Suomen molekyylilääketieteen instituutista (FIMM) keskittyy sairauksien geneettiseen analyysiin hyödyntämällä ihmisistä kerättyä suuria datamääriä. Data-analyysien perusteella hän on tutkimusryhmineen pystynyt osoittamaan, että monien neurologisten sairauksien taustalla on lukuisia geenejä, ei yksittäinen tautia aiheuttava geeni. Esimerkiksi migreeniin, epilepsiaan tai Parkinsonin ja Alzheimerin tauteihin sairastumisen alttiuteen voi vaikuttaa satoja eri geenejä.

 

Aarno Palotien tutkimukset tarvitsevat valtavasti näytemääriä. Vuonna 1998 ollessaan professorina Kalifornian yliopistossa (UCLA) hänellä oli käytössään siihen asti maailman suurin migreenitutkimusaineisto: dataa oli kerätty 400 suomalaisesta migreeniperheestä. Määrä on vuosien saatossa kasvanut 1600 perheeseen. Vuosina 2007-2013 hän teki suurilla aineistoilla Cambridgessa Britanniassa migreeniin, skitsofreniaan ja epilepsiaan liittyvää tutkimusta.

Ihmisistä kerättyä kliinistä ja tutkimuksellista dataa tuotetaan ja tallennetaan jatkuvasti lisää. Mitä enemmän dataa saadaan tutkimuskäyttöön, sen tarkemmin voidaan löytää tilastollisia muuttujia. Suurista datamääristä voi löytyä paljon uutta tietoa, jos data osataan louhia ja analysoida hyvin.

”Tutkimuksissa pitää päästä hyödyntämään näytemääriä, joita ei enää mitata tuhansissa vaan jopa miljoonissa, ” Aarno Palotie huomauttaa.

”Suuret näytemäärät on kerätty eri biopankkeihin kirjavasta luovuttajakunnasta. Jotta saadaan numerot oikein isoiksi, dataa yhdistetään eri lähteistä. Näin saadaan signaali isoksi ja kohina pieneksi.”

Isolla signaalilla Palotie tarkoittaa, että datasta tulee tilastollisesti merkittävää. Esimerkiksi harvinaisten tautien louhiminen aineistosta esiin edellyttää suuria datamääriä.

Tutkijoille on arvokasta, jos data on kerätty samalla tavoin. Eri laboratorioissa ja tutkimuslaitoksissa voi olla erilaisia käytäntöjä mittausinstrumenteista saadun raakadatan keräämiseen, jälkikäsittelyyn ja luokitteluun. Mitä yhtenäisempää data on, sen helpompaa on analysointi.

”Oikeassa elämässä, esimerkiksi sairauksien tutkimisessa ehdoton harmonisointi on kuitenkin hyvin haasteellista. Siksi datan harmonisointi on tärkeää tehdä niiltä osin kun se on mahdollista, jotta valtavista datamääristä saadaan tehtyä oikeita löytöjä ja tulkintoja.”

Genotyypitys kustannustehokasta

 

Perinteisesti genomidataa on kerätty sekvensointitekniikoilla, joilla selvitetään koeputkissa geenien emäsjärjestys. Sekvensoinnin kustannukset ovat kuitenkin suuret, kun aineistoa tarvitaan paljon, kuten tutkittaessa tavallisia ja kroonisia tauteja. Kustannustehokkaaksi ja luotettavaksi menetelmäksi on vakiintunut genotyypitys. Genotyypityksessä DNA:n sisältämä geneettinen tieto määritetään näytteistä DNA-mikrosirutekniikalla. Näytteet luetaan mikrosiruskannerilla, jonka tuottama raakadata käsitellään. Genotyypityksessä luetaan vain ne tiedossa olevat kohdat kromosomeissa, joissa esiintyy tutkittavaan tautiin liittyviä geenivariantteja. Tämän jälkeen otetaan avuksi laskennalliset menetelmät. Referenssigenomin (useiden eri luovuttajien DNA-sekvenssien avulla luotu vertailugenomi) avulla voidaan sitten ennustaa ne variantit, joita ei ole luettu.

Genominlaajuisissa assosiaatiotutkimuksissa (GWAS) tutkittavat geenivariantit mitataan näytteistä, joiden määrä vaihtelee sadoista tuhansista miljooniin. GWAS- menetelmää käytetään erityisesti silloin, kun sairauden geneettinen tausta on monitekijäinen, polygeeninen, eli sadat tai tuhannet geenivariantit vaikuttavat sairausriskiin. Monitekijäisiä sairauksista ovat esimerkiksi sydän- ja verisuonitaudit, allergiat, diabetes ja mielenterveyden häiriöt. Luotettava GWAS analyysi edellyttää suurta tutkimusaineistoa. Aineiston analysoimiseen tarvitaan supertietokoneiden laskentatehoa.

”Sekvensointiin tarvitaan vieläkin isompia datamääriä kuin GWAS -tekniikoissa. Sekvensointi on myös GWAS -menetelmään verrattuna kallista. Datan tuottaminen GWAS -menetelmällä maksaa muutaman kympin. Menetelmää voidaan soveltaa riittävän suuriin näytemateriaaleihin. Data on standardoitua ja se säilyy hyvin. Eri paikoissa genotyypitettyjä aineistoja voidaan hyvin helposti yhdistää.”

DNA-mikrosiruja

Migreenin synty

 

Migreeni on päänsärkykohtauksia aiheuttava sairaus, jonka ajatellaan saavan alkunsa useimmiten ulkoisten tekijöiden aiheuttamasta häiriöstä aivorungossa. Sitä esiintyy yhdellä kymmenestä aikuisesta, naisilla kolme kertaa miehiä yleisemmin. Palotie on tutkinut migreeniä pitkään. Yhdessä tutkimuksessa hyödynnettiin näytteitä, joita oli kerätty 375 000 ihmisestä ympäri maailmaa. Näistä 60 000 oli migreenipotilaita. Vuonna 2016 hänen tutkimusryhmänsä tunnisti 30 uutta migreenin perinnöllistä riskitekijää. Moni sijaitsee verisuonien toimintaa säätelevissä geeneissä.

Vuonna 2018 julkaistiin Neuron-tiedelehdessä Palotien ja muiden tutkijoiden artikkeli, joka antoi merkittävästi uutta tietoa migreenin synnystä. Tärkeä havainto oli, että migreeniin eivät vaikuta edes migreeniperheissä vain tietyt geenit vaan suuri joukko geenejä. Palotie puhuu geenikuormasta (gene load).

”Vuosikymmeniä on ajateltu sairauksien genetiikkaa niin kuin Mendel sen kuvasi. Asia on paljon monimutkaisempi”, Palotie toteaa.

Genetiikan isäksi kutsuttu Gregor Mendel osoitti, että yksilön tietyt ominaisuudet ovat periytyviä sukupolvesta toiseen. Geenit voivat olla vallitsevia tai peittyviä. Palotien mukaan uudet tutkimustulokset ovat osoittaneet, että asia ei ole näin yksinkertainen. Esimerkiksi sairauteen voi vaikuttaa joukko geenimuunnoksia, ei välttämättä yksi geenivariantti.

”Oletuksena on ollut, että jos suvussa on ollut migreeniä, sydäninfarkteja, syöpää tai jotain muita tavallisia sairauksia, nämä sairautta aiheuttavat geenivariantit ovat vahvoja ja kulkeutuvat vanhemmilta lapsille. Migreenitutkimus yhdessä muiden tutkimusten kanssa osoittavat itse asiassa sen, että tiettyjen sairauksien taustalla on todennäköisesti hyvin tavallisten geenivarianttien kasautumista. Kyse on samoista varianteista, joita koko väestössä ilmenee. Joskus sattuu vain niin, että henkilöllä ja hänen puolisollaan on molemmilla iso geenivarianttien kuorma. Kun nämä kaksi tuhansien geenivarianttien sisältämät kuormat liittyvät yhteen, se lisää jälkeläisissä riskiä sairastua.”

Palotie ryhmineen etsii vastaavanlaisia kuormia muista neurologisista sairauksia. Nyt Palotietä työllistää suuri kansainvälinen tutkimus psykoosisairauksien geneettisestä taustasta. Aineistoa kerätään maailmanlaajuisesti yhteensä yli 100 000 ihmisestä. Geenilöydöillä uskotaan olevan suuri merkitys sairauksien ymmärtämisessä, mikä on perusta uusien hoitojen kehittämisessä.

”Kun potilaasta saadaan tarvittava määrä dataa, voidaan potilaiden hoitoa täsmentää, puhutaan täsmähoidosta ja yksilöllisemmästä hoidosta. ”

Dopamiinia välittä neuroni.

Harvinaiset geenivariantit oikotie biologiaan

 

Palotie tekee tutkimusta kahdesta suunnasta: hän etsii tavallisten geenimuunnosten kasautumia, mutta myös harvinaisia geenivariantteja.

”Harvinaiset variantit voivat olla oikotie biologiaan”, hän sanoo.

Palotie mainitsee esimerkiksi skitsofreenipotilaan, jolta löytyy muutama geeni, jossa on sairauteen liittyvä vahva muunnos. Tämä on skitsofrenian tapauksessa ollessa hyvin harvinaista, koska yleensä kyseessä on tuhansien geenien yhteisvaikutuksesta syntyvä sairausalttius.

”Tällainen harvinainen poikkeus voi kuitenkin valottaa sairausmekanismeja laajemminkin. Harvinaiset, muutamat muunnokset skitsofreenipotilaassa voivat helpommin osoittaa biologisen signalointireitin solussa kuin yleisten varianttien kasautumat.”

Signalointireitin tutkiminen eli ymmärtäminen, miten solu reagoi siihen kohdistuvaa viestintään, on keskeistä sairausmekanismien ymmärtämiseksi. Solut muuttavat toimintaansa ympäristöstä saapuvien viestien mukaisesti. Usein signaali ulottuu tumaan asti, jolloin se alkaa säädellä geenien toimintaa. Joskus solussa on erityisiä proteiineja, joiden tehtävänä on katkaista signaalin kulku. Esimerkiksi syöpäsolut eivät reagoi moniin niille tarkoitettuihin viesteihin. Sen sijaan syöpäsolut vahvistavat signalointireittiä, joka saa solun jakautumaan ja täten kasvaimen kasvamaan.

Suomalaisilla on joukko geenivariantteja, jotka ovat muualla maailmassa harvinaisia, mutta meillä väestöhistoriamme vuoksi rikastuneita. Kun suomalaisten dataa yhdistetään muusta populaatiosta kerättyyn dataan, voidaan saada lisää tietoa signalointireiteistä. Japanilainen potilas voi siis hyötyä suomalaisista kerätystä datasta ja päinvastoin.

”Vaikka Suomesta löydettyä varianttia ei tunnetakaan Japanissa, ihmisen fysiologia ja biologia ovat kuitenkin hyvin samanlaisia. Löydetty variantti ohjaa toivottavasti kohti oikeaa solun signalointireittiä. Kun me tunnistamme uuden solunsignalointireitin, niin toisessa populaatiosta voidaan löytää toinen geenivariantti, joka itse asiassa liittyykin samaan signalointireittiin. Tällöin löydös vahvistaa, että signalointireitti onkin tässä taudissa merkityksellinen.”

Geenivariantin sijainnilla on merkitystä. Palotie kertoo esimerkin. Vieraillessaan Islannissa Palotie kertoi Leif Groopin tutkimuksesta, jonka tuloksena löydettiin Suomen länsirannikon populaatiosta harvinainen geenivariantti, joka suojaa kakkostyypin diabetekselta. Leif Groopin kollega tiedusteli islantilaisilta tutkijoilta, onko samanlaista varianttia löydetty islantilaisesta populaatioista. Islantilaiset tarkistivat asian omista tietokannoistaan. Samanlaista geenivarianttia ei oltu löydetty, mutta samasta geenistä islantilaiset olivat löytäneet toisen variantin.

”Tämä islantilaisten löytö vahvisti kyseessä olevan geenin suojaavan merkityksen tyypin 2 diabeteksessa. Tällainen suojaava geenivariantti on tietenkin hyvin mielenkiintoinen molekyyli lääkeainesuunnittelussa.”

Vaikka Suomesta löydettyä varianttia ei tunnetakaan Japanissa, ihmisen fysiologia ja biologia ovat kuitenkin hyvin samanlaisia.

FinnGen ja fenotyyppidata

 

Syksyllä 2017 alkoi FinnGen -projekti, jonka tavoitteena on taltioida puolen miljoonan suomalaisen genomit. Hankkeessa hyödynnetään kaikkien suomalaisten biopankkien keräämiä näytteitä. Suomalaisten perimästä saatava data on tarkoitus yhdistää kansallisissa terveydenhuollon rekistereissä olevaan kliiniseen tietoon. Tavoitteena on sairauksien parempi ymmärtäminen yhdistämällä genomi- ja terveystietoa. Vain suuria näytemääriä analysoimalla voidaan merkittävästi tehostaa potilasterveydenhuoltoa.

FinnGenin keskiössä on terveysrekistereistä saatava suomalaisten fenotyyppidata. Palotien mielestä FinnGen voidaan ottaa malliesimerkiksi siitä, miten biopankkien aineistoa ja terveysrekisteridataa voidaan yhdistää genomidataan analyyseja varten.

Hankkeessa on partnereita ympäri maailmaa. Tarkoituksena on yhdistää suomalaisten biopankkien näytteistä saatua tietoa muiden maiden biopankkien tulosten kanssa meta-analyysia varten.

”Datojen yhdistäminen on iso haaste, siksi tulosten meta-analyysi on usein toimivampi ratkaisu. FinnGenin meta-analyysia on harjoiteltu Britannian ja Japanin biopankkien kanssa. Tavoitteena on saada myös muita maita mukaan.”

Palotien mukaan on ensiarvoisen tärkeää, että suomalaisista kerätyn datan lisäksi tutkimusaineistoon pitää pystyä yhdistämään muista maista ja populaatioista tuotettua dataa. Koko ajan kehitetään uusia menetelmiä, joilla dataa käsitellään ja siitä saadaan jalostettua uutta tietoa. Uusista menetelmistä ei ole mitään hyötyä, jos tutkijoilla ei ole käytössä riittävää määrää dataa, jota analysoida ja vertailla.

”Myös tekoälyn on vaikeaa toimia ilman riittävän suurta datamäärää.”

Ari Turunen

Artikkeli PDF-muodossa

Lue myös:

Suomalaisen väestön perimästä apua sydän- ja verisuonisairauksien hoitoon

Massiivinen datanhallintaprojekti: suomalaisten perimä kerätään talteen

Lisätietoja:

 

FIMM

Suomen molekyylilääketieteen instituutti (FIMM) on kansainvälinen tutkimuslaitos, jonka toiminta keskittyy sairauksien molekyylitason mekanismien selvittämiseen genetiikan ja lääketieteellisen systeemibiologian menetelmin. Tavoitteena on tutkimustiedon siirtäminen terveydenhuollon käyttöön mm. henkilökohtaista lääketiedettä edistämällä.

www.fimm.fi

 

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
http://www.elixir-finland.org
http://www.elixir-europe.org