
Mittavassa FINRISKI -tutkimusprojektissa on vuodesta 1972 lähtien kerätty viiden vuoden välein terveystietoa suomalaisista. Aineistoa voidaan käyttää kroonisten tautien riskitekijöiden selvittämiseen. Yhä enemmän kerätään myös geenidataa, jonka yhdistäminen rekisteritietoihin mahdollistaa sairauksien ennaltaehkäisemisen ja entistä tehokkaampien hoitomenetelmien kehittämisen.
Suomalaisia tutkimusaineistoja on paljon, mutta THL:n johtavan tutkijan Kati Kristianssonin mukaan FINRISKI sisältää poikkeuksellisen paljon monipuolista dataa suomalaisen väestön terveydestä. Tutkittavat on valittu satunnaisotoksella eri alueiden väestöistä. Terveystarkastuksiin osallistuneilta kysellään myös elintavoista, sairauksien perhehistoriasta, mielialasta sekä muista terveyteen ja hyvinvointiin liittyvistä asioista. Rekisteri- ja kyselytiedot voidaan yhdistää geeninäytteisiin.
”Kun kaikki nämä laboratoriomittaukset ja kyselyaineistot saadaan yhdistettyä terveysrekisteritietoihin, saadaan selville sairaushistoria, minkälaisia lääkityksiä henkilöillä on ollut ja kaikki kuolinsyyt.”
FINRISKI-kokoelmia siirrettiin vuonna 2015 THL Biopankkiin. Kaksi vuotta myöhemmin FINRISKI- ja Terveys 2000 -tutkimukset yhdistettiin uudeksi FinTerveys -väestötutkimukseksi. Biopankkiaineistoja, joihin on tallennettu genomidataa ja terveystarkastuksissa saatua dataa on toki muuallakin. FINRISKI –aineistosta tekee poikkeuksellisen laadukkaan sen aikajänne.
”Henkilöstä mitataan ensimmäisessä terveystarkastuksessa erilaisia arvoja. Tämän lähtötilanteen jälkeen samaa henkilöä voidaan seurata edelleen rekistereistä vaikka 30 vuotta eteenpäin ja nähdä mitä henkilölle on tapahtunut. Voidaan nähdä, minkälaisia riskitekijöitä on jo alussa, minkälaisia sairauksia tulee tai mihin henkilö mahdollisesti kuolee. ”
Kristianssonin mukaan FINRISKI -väestöaineistossa erityisen arvokasta on ajassa seuraaminen alkumittausten jälkeen.
”Tällainen analyysi edesauttaa arvioimaan minkälaiset tekijät nostavat tulevan sairastumisen riskiä. Sitä pystyään hyvin arvioimaan perinnöllisten ja elintapatekijöiden avulla.”
FINRISKI -aineistot on tallennettu THL Biopankkiin. Lisää dataa tallennetaan koko ajan eri tutkimusprojekteista. Kristianssonin tutkimus nojaa vahvasti biopankkiaineistoihin. Hän vetää THL:ssä Väestönterveysyksikössä Kansantautien tutkimus -tiimiä ja on mukana keräämässä dataa vuonna 2022 alkaneessa Terve Suomi -tutkimusprojektissa, joka tuottaa ajankohtaista tietoa Suomessa asuvien aikuisten terveydestä ja hyvinvoinnista.
Kati Kristiansson on käyttänyt FINRISKI -aineistoa koko tutkijanuransa ajan.
”Kun aloitin tutkijan urani, tutkin kansantautien perinnöllisyystekijöitä keskittyen erityisesti sydän- ja verisuonisairauksien riskitekijöihin. Tätä olen tehnyt siitä lähtien. Kansansairauksien riskitekijöiden selvittäminen ja mahdollisten ennaltaehkäisevien toimenpiteiden arviointi on ollut sydäntäni lähellä koko työurani.”
FINRISKI -tutkimukseen on kutsuttu 10 000 ihmistä terveystarkastuksiin viiden vuoden välein. Uusimmissa terveystarkastuksissa on otettu myös ulostenäyte ja siitä on tutkittu bakteeristo eli mikrobiomi ja verinäytteistä metabolomi, eli satoja aineenvaihduntatuotteita.
”Saamme myös tietoa väestön lihomisesta. Eli saadaan painoindeksit ja paljon sellaista tietoa, mitä ei ole rekistereissä.”

Kristiansson on tutkinut tyypin 2 diabeteksen ja sepelvaltimotaudin riskitekijöitä. Erityisesti häntä kiinnostaa genomitiedon hyödyntäminen kansantautien ehkäisyssä.
”Suomessa on hienot rekisterit ja niitä eri aineistoihin yhdistämällä saadaan hienoa tutkimusta aikaan. Kyselyt, terveystarkastukset tai rekisterit yksinään eivät kuitenkaan riitä. Jos halutaan selvittää kansansairauksien perinnöllisiä riskitekijöitä, tarvitaan rekistereiden lisäksi genomitieto.”
Kattavien mittausten lisäksi terveystarkastuksissa on otettu verinäyte. Näin saadaan talteen DNA sekä selville erilaiset rasva-arvot, lipidien kolesteroli ja verensokeri.
Vuodesta 1992 alettiin eristää DNA:ta terveystarkastuksista saaduista näytteistä. Nyt näytteille on tehty koko perimän kattava genotyypitys. jossa DNA:n sisältämä geneettinen tieto määritetään mikrosirutekniikalla. Genotyypityksessä luetaan satoja tuhansia kohtia kromosomeista, ja sen jälkeen tieto vielä laajennetaan käsittämään miljoonia muita kohtia tilastollisilla menetelmillä. Näissä kohdissa esiintyy paljon erilaisiin tauteihin liittyviä geenivariantteja.

FINRISKI- aineistoa on yhdistetty myös muista maista kerättyihin aineistoihin. Kansainvälisissä tutkimusprojekteissa kerätään usein mahdollisimman iso määrä näytteitä, jotta voitaisiin tehdä kattavia koko perimän assosiaatioanalyyseja (GWAS). Näissä tutkimuksissa selvitetään eri sydän- ja verisuonitauteihin liittyviä geenialueita. FINRISKI -aineistosta löytyy paljon tutkimusdataa sydän- ja verisuonitaudeista ja niiden riskitekijöistä, joita ovat muun muassa lihavuus, diabetes, veren kolesteroli, verensokeri ja perimä.
Kristianssonia kiinnostavat aineistosta löytyvät biomarkkerit, jotka kertova biologisen tilan muutoksista. Yksi tutkimuskohde FINRISKI-aineistoissa on ollut peptidit, alle 50 aminohapon ”pienet proteiinit”. Natriureettiset peptidit saavat aikaan munuaisissa natriumionien ja veden eritystä ja vähentävät verenpainetta.
ANP (eteispeptidi) ja BNP (B-tyypin natriureettinen peptidi) erittyvät sydämestä verenkiertoon ja toimivat hormonien tavoin.
Näiden peptidien eritystä säätelee sydänlihaksen painekuormitus. Sydämen vajaatoiminnassa peptidien pitoisuudet plasmassa suurenevat. Ne ovat hyviä kliinisiä biomarkkereita ilmaisemaan sydänrasitusta.
Tutkimuksessa, jossa Kristiansson oli mukana, havaittiin mielenkiintoisia eroja peptidien määrässä eri ihmisissä. Tutkimusryhmä selvitti geenivarianttien vaikutusta peptidien määrään ja vertasivat varianttien vaikutusta verenpaineeseen. Tutkimuksissa otettiin huomioon asuinpaikka, ikä, sukupuoli, tupakointi, verenpaine sekä hiussuonikerästen suodatusnopeus munuaisissa. Huononeva munuaistoiminta ilmenee suodatusnopeuden (GFR) laskuna. Geenitutkimus voisi tuoda lisävalaistusta siihen, mitkä tekijät ja geenialueet erityisesti vaikuttavat peptidien määrään ja verenpaineen vaihteluun.
Kristianssonin mukaan tällaiset tutkimustulokset FINRISKI -aineistosta antavat osviittaa, minkälaisiin geenialueisiin jatkotutkimuksen ja lääkekehityksen voisi suunnata.
”Kun tiedetään näitä genomin alueita, jotka vaikuttavat sairauksien biomarkkereihin, niin jatkotutkimuksessa voidaan yrittää etsiä hyvä lääkeproteiini.”
Kristianssonin mukaan hyviä esimerkkejä tällaisesta ovat tällaiset kolesterolia alentavat lääkkeet. Lääkekehitystä tehdään muun muassa Helsingin yliopiston koordinoimassa FinnGen -tutkimuksessa. Sen tuottama aineisto on jatkossa muidenkin kansallisten ja kansainvälisten tutkijoiden ja yritysten hyödynnettävissä.
FINRISKI -aineistot hyödyttävät Kristianssonin mukaan erityisesti sairauksien ennaltaehkäisyssä.
”Tässähän tarkoituksena on elintapojen muutos.”
Ari Turunen
23.5.2022
Lue artikkeli PDF-muodossa
Sitaatti
Ari Turunen, Kati Kristiansson, & Tommi Nyrönen. (2022). FINRISK: one of the world’s longest-running population survey time series. https://doi.org/10.5281/zenodo.8154515
Terveyden ja hyvinvoinnin laitos THL
FINRISKI-laskuri
https://thl.fi/fi/web/kansantaudit/sydan-ja-verisuonitaudit/finriski-laskuri
CSC – Tieteen tietotekniikan keskus Oy
on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
ELIXIR
rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

Sydän- ja verisuonitaudit ovat yleisin kuolinsyy maailmassa. Suomessa yli kolmannes kuolemista johtuu sydän- ja verisuonitaudeista. Nyt tavoitteena on saada terveysdatan perusteella arvio jokaisen sairastumisriskistä Suomessa ennen lääkärillä käyntiä.
Andrea Ganna, Suomen molekyylilääketieteen instituutin (FIMM) ryhmän vetäjän ja Harvardin lääketieteellisen koulun opettaja, haluaa perustaa maanlaajuisen yksilöllisen riskiarvioinnin, joka olisi perustana, joilla voisi suunnitella julkisen terveydenhallinnon toimenpiteitä. Arviointi perustuu kansalaisten terveys, väestö- ja geenitietoon. Arviointi, joka hyödyntää teköälyä, parantaa ehkäisevien hoitojen kohdentamista nykyistä halvemmalla kustannustasolla.
“Pohjoismailla ja erityisesti Suomella on tähän ainutlaatuinen mahdollisuus ja miljöö, sillä nämä maat ovat keränneet terveys- ja väestödataa vuosia. Mutta tapa, jolla dataa on aiemmin kerätty, on jossain määrin vanhentunut. Datasta on katsottu vain tiettyjä riippuvuussuhteita ja yhteyksiä. Kuitenkin uudet menetelmät, kuten tekoäly, ovat tulossa ja antavat mahdollisuuden suurempaan ja kunnianhimoisempaan visioon.”
Andrea Ganna ja hänen tutkimusryhmänsä kehittävät tekoälyyn (AI) perustuvia lähestymistapoja yksittäisen ihmisen terveyshistorian mallintamiseksi.
“Jokaisella henkilöllä on tietynlainen terveys- ja lääkintähistoria. Haluamme tietää, onko muilla samantyyppisiä seurantatietoja. Heitä voi olla tuhansia. Me hyödynnämme näiden ihmisten terveystietoja ja selvitämme, mitä heille tapahtui. Näin autamme alentamaan sairastumisriskiä. Voimme käyttää kaikkea tätä dataa aiempaa paljon kokonaisvaltaisemmalla tavalla auttaaksemme julkista terveyshallintoa ja antaaksemme potilaille ja lääkäreille enemmän tietoa päätöksenteon tueksi.”
Andrea Ganna on kiinnostunut epidemiologiasta, genetiikasta ja tilastotieteestä. Hän on keskittynyt hyödyntämään suuria epidemiologisia aineistoja tunnistaakseen yhteiskunnallis-väestötieteellisiä, metabolisia ja geneettisiä tunnusmerkkejä, jotka ovat yleisten ja monimutkaisten tautien taustalla. Bostonissa ollessaan hän työskenteli laajojen eksomi- ja genomisekvenssidata-aineistojen parissa.
Gannan mukaan sydän- ja verisuonitaudit sopivat täydellisesti tekoälyn tekemiin analyyseihin, koska näiden tautien hoito on ennaltaehkäisevää.
“Tarkka korkean riskin yksilöiden tunnistaminen on yksi kulmakiviä kardiometabolisten sairauksien ennaltaehkäisyssä”, hän sanoo.
”Kuitenkin tällä hetkellä kardiometabolisten sairauksien riskitekijöiden arviointi edellyttää potilailta käyntiä lääkärillä lipidimittauksessa.”
Lipidi on yleisnimitys kaikille veressä kiertäville rasvoille ja rasvan kaltaisille aineille. Keho varastoi ravinnosta saatua rasvaa tulevaan käyttöön. Runsasrasvainen ruokavalio saa rasvan kiinnittymään valtimoiden seinämiin, mistä aiheutuu sydän- ja verisuonitauteja sekä valtimotauteja. Lipidimittauksessa saadaan selville, millaisia rasvoja testattavalla on elimistössään. Lipidimittaus on tehokas, mutta ongelma on, että osa väestöstä ei tiedä kuuluvansa riskiryhmään.
Ganna haluaa mullistaa sairausten ennaltaehkäisyn tarjoamalla riskiarvioinnin potilaalle ennen kuin hän menee lääkärin vastaanotolle.
“Jotkut eivät yksinkertaisesti mene lääkärille ja paljon ihmisiä puuttuu. Mutta koska kaikki lääkitykseen ja diagnooseihin liittyvä data on jo kerätty, voimme tunnistaa korkean riskin potilaat ennen kuin he menevät lääkärille. Voimme tehdä sydän- ja verisuonitautien riskikartan koko maasta mukaanlukien kaikki yksittäiset henkilöt.”
Riskilaskelma tehdään mallintamalla sairauksien ja lääkitysten pitkittäisseurannasta saatua dataa yhdessä geeni-, perhe- ja väestödatan kanssa.
“Yritämme ymmärtää, kuinka genetiikka vuorovaikuttaa sellaisen datan kanssa, joka saadaan lääkityksistä, diagnooseista, väestöstä ja perheestä. Tämä voi antaa ennennäkemättömän kokonaisvaltaisen näkökulman yksilön terveydentilaan.”
Ganna antaa esimerkin.
“Kun katkaiset jalkasi, menet lääkärille. Kuitenkin tänä päivänä lääkäri katsoo vain jalkaasi, vaikka samalla käynnillä voisit saada hyötyä myös muusta tiedosta. Me voimme informoida lääkäriä muista riskeistä, joita potilaalla on perustuen kerättyyn dataan. Voimme laskea ennalta potilaan muut riskit, kuten esimerkiksi, jos hänellä on korkea riski sydän- ja verisuonisairauksiin. Siten, samalla käynnillä, lääkäri voi myös antaa neuvoja tai ohjata potilaan asiantuntijalle.”

Ganna päätti tulla Suomeen laajan geeniprojektin, FinnGenin takia.
Elokuussa 2017 alkaneessa projektissa taltioidaan puolen miljoonan suomalaisen genomit. Hankkeessa hyödynnetään kaikkien suomalaisten biopankkien keräämiä näytteitä. Perimästä saatava data yhdistetään kansallisissa terveydenhuollon rekistereissä olevaan tietoon. FinnGen on yksi ensimmäisiä näin laajassa mittakaavassa tehtyjä erittäin yksilöllistettyjä lääketieteen projekteja. Julkisten ja yksityisten organisaatioiden yhteistyö on poikkeuksellista.
“Suomessa on sopiva lainsäädäntö, joka antaa pääsyn maanlaajuiseen populaatiodataan. Minulle tämä on ainutlaatuinen kattaus.”
Ganna ja hänen tutkimusryhmänsä integroivat rekistereissä olevan tiedon ja biopankkeihin tallennetun laajan tutkimustiedon auttaakseen tunnistamaan yksilöryhmiä, jotka voisivat eniten hyötyä olemassaolevista farmakologisista toimenpiteistä.
“Ehkä tärkein ryhmä on nuoret yksilöt jotka eivät käy lääkärissä kovinkaan usein. Nykyiset riskitekijät eivät toimi hyvin tässä ryhmässä. Genetiikka on erityisesti arvokasta, koska sen avulla voidaan löytää sairastumisen riskitekijät aikaisemmalla iällä verrattuna muihin riskitekijöihin. Ensimmäinen askel on ymmärtää, miten ihmiset hahmottavat tämän tiedon. Meidän täytyy varmistaa että lääkärit käyttävät dataa oikealla tavoin ja mitä sillä voidaan tehdä.”

Gannan tavoitteena on integroida kansalliset ja alueelliset rekisterit syvä- ja koneoppimiseen.
“Perinteisillä menetelmillä on etunsa, sillä ne ovat suhteellisen yksinkertaisia ja helppoja tulkita, mutta ne eivät skaalaudu. Viimeisten 20 vuoden aikana yli 500 miljoonaa lääketieteellistä diagnoosia on tehty suomalaisista. Puhumme valtavista datajoukoista. Joka vuosi tehdään miljoonia uusia lääkemääräyksiä ja diagnooseja. Tämän skaalaamiseksi ja hyödyntämiseksi tarvitaan syväoppimisen menetelmiä.
Keinotekoiset neuroverkot ovat tehokkaita koneoppimisen algoritmeja, joita voidaan hyödyntää hahmontunnistamisessa. Takaisinkytkeytävät neuroverkot (recurrent neural network) voivat hyödyntää niiden sisäistä muistia syötejonojen käsittelyssä. Tämä tekee niiistä soveltuvia sellaisiin tehtäviin, kuten segmentoitumattomaan tunnistamiseen. Ganna haluaa laajentaa nämä neuroverkot käyttämäänsä dataan.
”Voidaan ajatella, että terveydentilaa kuvaavien tapahtumien muutosjono, jota yritämme mallintaa, on ”tekstiä”, jossa jokainen sana on erilainen koko elämän aikana ollut tauti, lääkitys, väestötieteellinen tapahtuma jne. Nämä ovat luonnollisesti sovitettu mallintamaan muutosta kuvaavaa tapahtumaketjua, esimerkiksi niitä käytetään ennustamaan seuraavaa todennäköisintä sanaa tekstiviestissä.”
Syväoppimisen menetelmät edellyttävät suurta supertietokoneinfrastruktuuria.
”CSC on luonut turvallisen ympäristön laskentaan. Ilman turvallista superlaskennan ympäristöä, emme voisi toteuttaa tätä projektia. Onnistuaksemme me tarvitsemme yhtäältä tutkimusta ja kehitystyötä ja toisaalta tehokasta laskentaympäristöä.”
Potilasdata on tärkeää tutkimukselle, mutta henkilökohtainen data on myös suojeltua. Esimerkiksi Suomen molekyylilääketieteen instituutissa kehitetty VEIL.AI anonymisoi potilasdatan perinteisiä menetelmiä tehokkaammin, nopeammin ja informaatiota paremmin säilyttäen. Tarvittaessa sovelluksen avulla voidaan tuottaa myös synteettistä, täysin anonyymia eli siis yksittäisestä henkilöstä erillään olevaa tilastollista dataa.
“Meillä on tarve taata yksilöiden yksityisyys, mutta samalla meidän täytyy integroida paljon henkilökohtaista dataa, jotta voisimme todella hyötyä tekoälystä ja syväoppimisen lähestymistavoista ja jotta voisimme kohdentaa tulokset parempiin julkisen terveydenhuollon toimenpiteisiin. Luomalla synteettisiä terveystiedon historioita autetaan kunnioittamaan yksityisyyttä, mutta samaan aikaan pystytään yhdistämään paljon persoonakohtaista tietoa ei pelkästään Suomessa vaan Pohjoismaiden välillä.”
“Toivon, että rutiininomaisesta terveydenhuollossa kerätty persoonakohtainen data voi auttaa ja hyödyntää kaikkia. Toivon, että tämä tieto voi auttaa lääkäreitä tekemään parempia päätöksiä ja myös motivoimaan potilaita elämäntapamuutoksiin. Siten kaikki auttavat kaikkia.”
Ari Turunen
30.9.2019
Lue artikkeli PDF-muodossa
Sitaatti
Ari Turunen, Andrea Ganna, & Tommi Nyrönen. (2019). Risk assessment of cardiovascular diseases for all citizens. https://doi.org/10.5281/zenodo.8131074
Lisätietoja:
FIMM
Suomen molekyylilääketieteen instituutti (FIMM) on kansainvälinen tutkimuslaitos, jonka toiminta keskittyy sairauksien molekyylitason mekanismien selvittämiseen genetiikan ja lääketieteellisen systeemibiologian menetelmin. Tavoitteena on tutkimustiedon siirtäminen terveydenhuollon käyttöön mm. henkilökohtaista lääketiedettä edistämällä.
CSC – Tieteen tietotekniikan keskus Oy
CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing
ELIXIR
ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org