Suomalaisia tutkimuksia

Ensimmäinen sarja artikkeleita suomalaisista tutkimuksista koottu kirjaksi

ELIXIR, eurooppalainen biotieiden infrastruktuuri, on sitoutunut järjestämään ja ylläpitämään biotieteistä tuotettua dataa mahdollistaakseen sen tulkinnan. ELIXIR mahdollistaa esimerkiksi ihmisdatan tietoturvallisen käsittelyn uusimpien IT-alan innovaatioiden avulla estääkseen datan laittoman käytön. ELIXIR-infrastruktuurissa on 22 jäsentä, 21 jäsenmaata sekä EMBL – Euroopan molekyylibiologian laboratorio. ELIXIR kattaa lähes 200 organisaatiota, jotka muodostavat uskottujen osapuolten federaation. Vuoden 2017 alussa, ELIXIR-infrastruktuurin avulla, 21 000 tieteellistä artikkelia oli julkiastu ja 8 500 patenttia myönnetty. Patentteja myönnettiin rokotteisiin, biomarkkereihin, entsyymeihn ja Ebola-viruksen ehkäisemiseen.

Lataa kirja, joka esittelee suomalaisia ELIXIR-infrastuktuuriin liittyviä tutkimushankkeita vuosilta 2014-2018. ELIXIR-infrastuktuurin Suomen solmupisteestä vastaa CSC – Tieteen tietotekniikan keskus. Vuonna 2018, ELIXIR Suomi tuki yli 300 bioalan tieteellistä projektia, monet niistä julkisrahoitteisia.

ELIXIR

ELIXIR on eurooppalainen tutkimusinfrastruktuuri, joka kokoaa yhteen euroopanlaajuisesti bio- ja terveystieteiden resursseja, kuten aineistotietokantoja, ohjelmistotyökaluja, koulutusmateriaaleja, pilvitallennuskapasiteettia ja tieteellistä suurteholaskentaa. Tavoitteena on muodostaa yksi yhteinen, eurooppalainen tutkimusinfrastruktuuri, jonka ansiosta bio- ja terveystieteiden tutkijat voivat aiempaa helpommin löytää, analysoida ja jakaa aineistojaan ja tietotaitoaan sekä toteuttaa alan parhaita käytäntöjä. Tämä auttaa tutkijoita hyödyntämään valtavaa määrää bio- ja terveystieteissä tuotettua dataa, mikä puolestaan auttaa meitä kehittämään tietämystämme elävistä organismeista. ELIXIR koostuu 23:sta jäsenmaasta ja yli 200:ta tutkimusorganisaatiosta, ja infrastruktuurin toiminta nojaa viisivuotiskausittain tieteellisessä ohjelmassa asetettaviin strategisiin. Infrastruktuurin työtä koordinoi ELIXIR Hub Hinxtonissa, Iso-Britannian Cambridgessa. ELIXIR-jäsenmaissa kansalliset organisaatiot muodostavat ELIXIR-osakeskukset. Suomessa kansallisen ELIXIR Suomen toiminnasta vastaa CSC – Tieteen tietotekniikan keskus.

ELIXIR Suomi

ELIXIR Suomi on kansallisesti merkittävä bio- ja terveystieteiden tutkimusinfrastruktuuri ja osa Suomen Akatemian tutkimusinfrastruktuuristrategiaa. ELIXIR-verkostossa ELIXIR Suomi toimii yhtenä kansallisena osakeskuksena, ja kehittää yhteistyössä kansainvälisten kumppanien kanssa eurooppalaisia bio- ja terveystieteiden tutkimusinfrastruktuuripalveluita. ELIXIR Suomen toiminnasta vastaa CSC – Tieteen tietotekniikan keskus. Bio- ja terveystieteellisen tutkimuksen muuttuessa jatkuvasti data- ja laskentaintensiivisemmäksi, tutkijat tarvitsevat yhä kehittyneempiä ohjelmistoja datan analysoimiseen, turvallisempia käyttöalustoja aineistojen käsittelyyn, lisääntyvää pilvipalvelukapasiteettia tutkimus- ja vertailuaineistojen tallentamiseen sekä tutkimusaineistojen käyttöoikeuksien hallintaa turvallisen tutkimustyön takaamiseksi. ELIXIR Suomen avulla Suomi linkittyy nopeilla tietoliikenneyhteyksillä muihin eurooppalaisiin biotieteiden keskuksiin. Kauttamme suomalaiset bio- ja terveystieteiden tutkijat pääsevät käsiksi erittäin suuriin biologisen tiedon tutkimusaineistoihin ja saavat käyttöönsä tehokasta laskentakapasiteettia, ohjelmistotyökaluja, datan tallennuspalveluja sekä tarvittavaa koulutusta palveluiden käyttöön.

Lue lisää ELIXIR-verkostosta täältä: https://elixir-europe.org/about-us

Lue lisää palveluistamme täältä: https://www.elixir-finland.org/palvelut

Lue lisää käyttötapauksistamme täältä: https://www.elixir-finland.org/julkaisut-ja-raportit

ELIXIR Suomen yhteystiedot:

Asiakaspalvelu:
Arkisin klo 8.30-16.00
(09) 457 2821
asiakaspalvelu@csc.fi

CSC – Tieteen tietotekniikan keskus Oy
PL 405
02101 Espoo

Käyntiosoite:
Life Science Center Keilaniemi
Keilaranta 14, Espoo

Puiden kuorista eristetyt alkaloidit tuhoavat syöpäsoluja

Puun kuori on tärkeä kemiallinen ase tuholaisia kohtaan. Kun kasvia uhkaa bakteeri tai hyönteinen, niissä olevat alkaloidit voivat esimerkiksi estää tuholaisten DNA:n tai solunjakautumisen toiminnan, mikä pysäyttää niiden lisääntymisen. Näin toimivat paklitakseli ja kamptotesiini, kaksi eri puiden kuoresta eristettyä yhdistettä, joista kehitettiin tehokkaita syöpälääkkeitä. Puiden ja muiden kasvien sisältämien bioaktiivisten yhdisteiden selvittämisen avuksi ovat nyt tulleet data-analyysit ja tietokannat.

Maailmassa on puoli miljoonaa kasvia, joista arviolta 7 prosenttia on käytetty lääkinnässä. Noin 25 % nykyisistä reseptilääkkeistä on kasvipohjaisia. Tämä tarkoittaa lääkkeitä, joissa on puhtaita kasveista eristettyjä yhdisteitä tai niistä kehitettyjä synteettisiä johdannaisia. Luonnon monimuotoisuuden säilyttäminen on ensiarvoisen tärkeää myös lääkkeiden takia, koska koko ajan löydetään uusia kasvilajeja ja tunnettujenkin kasvilajien kemiallinen koostumus on pääosin selvittämättä.

Paklitakseli ja kamptotesiini ovat esimerkkejä syöpälääkkeistä, jotka löydettiin, kun potentiaalisen lääkekasvien näytteitä alettiin seuloa järjestelmällisesti. Yhdysvaltain kansallinen syöpäinstituutti NCI seuloi yli 35 000 kasvinäytettä tutkimusohjelmassa, joka käynnistettiin 1956 ja jatkui vuoteen 1981 asti. Ohjelman tarkoituksena oli etsiä kasveista yhdisteitä, joilla voisi olla syöpää ehkäiseviä tai hoitavia vaikutuksia.

Kunnianhimoinen ohjelma hyödynsi myös etnobotaniikkaa ja historiaa. Ohjelman johtaja Jonathan Hartwell kokosi kattavan kokoelman muinaisten kiinalaisten, egyptiläisten, kreikkalaisten ja roomalaisten tekstejä kasvien lääkekäytöstä. Näytteiden löytämiseksi ja tarkkojen kasvitieteellisten tietojen saamiseksi Hartwell kääntyi Yhdysvaltain maatalousministeriön (USDA) puoleen. USDA:n kasvitieteilijät alkoivat kerätä kasveja eri puolilta maailmaa analysoitaviksi laboratorioissa.

Kamptotesiini ja sen johdannaiset

”Onnen puu” *Camptotheca acuminata* on kotoisin eteläisestä Kiinasta. Kuva Kumningin EXPO-puutarhasta. Kasvin kamptotesiini-yhdisteestä kehitetyt johdannaiset topotekaani ja irinotekaani ovat tärkeitä mm. keuhkosyövän ja suolisyöpien hoidossa.

Research Triangle Institute -tutkimuslaitoksen kemistit Monroe E. Wall ja Mansukh C. Wani saivat Camptotheca acuminata -puun näytteet tutkittavakseen. Puuta kutsutaan Kiinassa ”onnen puuksi” ja se kasvaa luontaisesti kosteilla penkoilla Jangtse-joen rannoilla. Kiinalaisessa perinteisessä lääketieteessä puun lehtiä ja kuorta on käytetty erilaisten tulehdusten ja infektioiden hoitoon.

Wall ja Wani huomasivat, että C. acuminatan sisältämät aineet olivat erittäin aktiivisia hiiren leukemian L1210-solulinjassa eli vaikutuksia oli nähtävissä syöpäsoluissa. L1210-linjaa käytetään yleisesti syöpätutkimuksessa ja uusien syöpälääkkeiden testaamisessa. Se on peräisin hiirestä, jolla oli lymfaattinen leukemia. Wall ja Wani eristivät puusta aktiivisen yhdisteen, joka sai nimen kamptotesiini. Sen havaittiin olevan erittäin tehokas leukemiasoluja vastaan.

Kamptotesiini sitoo solujen tärkeän entsyymin, topoisomeraasi I:n, DNA-komplekseihin. Tämä estää syöpäsolujen DNA:n kopioitumisen ja johtaa solun kuolemaan. Huolimatta tehokkuudestaan kamptotesiinillä on vakavia sivuvaikutuksia ja huono liukoisuus. Lääkkeen vesiliukoisuus on tärkeä, koska se vaikuttaa lääkkeen imeytymiseen ja jakautumiseen elimistössä. Myöhemmin kehitettiin kamptotesiinin johdannaisia, jotka olivat paremmin siedettyjä, vesiliukoisia ja säilyttivät tehokkuutensa. Näitä ovat topotekaani ja irinotekaani. Topotekaania (Hycamtin) käytetään munasarja-, keuhko- ja kohdunkaulansyövässä, irinotekaania (Camptosar) ensisijaisesti paksusuolen- ja peräsuolisyövän hoitoon.

Irinotekaanin kehittäminen

Luonnollisesta yhdisteestä jatkokehitetyt synteettiset johdannaiset voivat olla alkuperäistä yhdistettä huomattavasti tehokkaampia. 1980-luvulla japanilainen Yakult Honsha -yhtiö kehitti kamptotesiinin johdannaisen irinotekaanin. Silloin selvisi, että sen aktiivinen muoto elimistössä on sen aineenvaihduntatuote 7-etyyli-10-hydroksikamptotesiini, joka on noin 100–1000 kertaa aktiivisempi kuin itse iritotekaani. Yhdistettä alettiin kutsua nimellä SN-38. Yhdisteen nimi on lääkeyhtiön koodi ”SmithKline Number 38”. Se ei ole aktiivinen sellaisenaan, vaan toimii ns. prolääkkeenä. SN-38 on voimakas syöpälääkeaine, joka syntyy elimistössä, kun irinotekaanimuuttuu aktiiviseksi muodokseen. Iritotekaani muuttuu maksassa ja muissa kudoksissa SN-38:ksi. Se on siis muokattu versio luonnosta löytyvästä kamptotesiinista, johon on lisätty etyyli- ja hydroksyyliryhmät. Näillä muutoksilla saatiin aikaan erittäin tehokas lääkeaine.

Joillakin ihmisillä on UGT1A1*28-mutaatiota. Jos UGT1A1-geenissä on mutaatio (kuten UGT1A1*28), se voi vähentää entsyymin toimintaa, jolloin SN-38:n eliminoituminen hidastuu ja sen toksisuus voi kasvaa. Tämä voi lisätä haittavaikutuksia. Ensembl-tietokannasta voi esimerkiksi tutkia UGT1A1-geeniä, sen mutaatioita ja mahdollisia vaikutuksia SN-38:n metaboliaan.

Paklitakseli: maailman tärkeimpiä solunsalpaajia

Tyynenmeren marjakuusi, *Taxus brevifolia*. Siitä saatu paklitakseli on yksi yleisimmin käytetyistä lääkkeistä rintasyövän, munasarjasyövän ja keuhkosyövän hoidossa.

Wall ja Wani jatkoivat kasvinäytteiden tutkimista kamptotesiinin löytämisen jälkeen. He saivat analysoitavakseen Tyynenmeren marjakuusen (Taxus brevifolia) näytteitä.

Tyynenmeren marjakuusi on yksi viidestä suvusta Taxaceae-heimossa. Se kasvaa Pohjois-Amerikassa hyvin hitaasti jättimäisten havupuiden varjossa purojen rannoilla, syvissä rotkoissa ja kosteissa solissa. Sen puu on kovaa mutta vain vähän hyödynnettävissä. Puulla on vain vähän luonnollisia tuholaisia, koska suurin osa kasvista on myrkyllistä. Vuonna 1971 Wall, Wani ja heidän työtoverinsa julkaisivat tutkimustuloksen, jossa he esittelivät marjakuusen kuoresta eristetyn yhdisteen. Se estää mikrotubulusten hajoamisen ja pysäyttää syöpäsolun jakautumisen. Yhdiste sai nimekseen paklitakseli (Taxol).

Paklitakseli oli tehokas syöpälääke, mutta se aiheutti ympäristöhuolia. Yhdisteen eristäminen tappoi harvinaisia marjakuusia. Koska luonnollinen lähde (marjakuusen kuori) ei riittänyt laajamittaiseen lääkkeiden tuotantoon, 1990-luvulla kehitettiin puolisynteettinen menetelmä, jossa lähtöaineena käytetään marjakuusen neulasista saatavaa 10-deasetyylibakkatiinia. Tuo yhdiste (10-DAB) on paklitakselin esiaste, mutta kun siihen lisätään bentsyyliamiinia, saadaan puhdasta ja ekologisesti kestävää paklitakselia. Paklitakseli on yksi yleisimmin käytetyistä lääkkeistä rintasyövän ja munasarjasyövän hoidossa.

ELIXIR Core Data Resources: biolääketieteelle tärkeitä palveluita

ELIXIR Core Data Resources (CDR) on valittu niiden laadun, laajan käytön ja pitkäaikaisen merkityksen perusteella. Ne ovat keskeisiä monille tutkimusaloille, kuten genomiikalle, proteomiikalle ja lääkekehitykselle. ELIXIR Core Data Resources tarjoaa tutkijoille avoimen ja luotettavan pääsyn biologisiin tietoaineistoihin, mikä edistää uusia löytöjä ja nopeuttaa esimerkiksi uusien lääkkeiden kehittämistä, tautien ymmärtämistä ja biomarkkerien tunnistamista.

ELIXIR-infrastruktuurin tarjoamat data-analyysipalvelut ja koneoppimismallit voivat auttaa tunnistamaan uusia lääkeaihioita suurista tietomassoista. Näiden resurssien sekä tietokantojen avulla luonnosta löydettyjä yhdisteitä voidaan analysoida nopeammin ja tarkemmin, mikä edistää niiden kehitystä turvallisiksi ja tehokkaiksi lääkeaineiksi.

ENA (European Nucleotide Archive): geneettistä dataa eri eliöistä

ENA on Euroopan bioinformatiikkainstituutin (EMBL-EBI) ylläpitämä tietokanta, joka tallentaa ja jakaa sekvenssidataa eri eliöistä, mukaan lukien mikrobit, kasvit, eläimet ja ihmiset. Koska ENA sisältää genomi- ja sekvenssidataa kaikista elämänmuodoista, se on keskeinen tietokanta biodiversiteettitutkijoille, jotka analysoivat lajien geneettistä monimuotoisuutta, populaatiogenetiikkaa ja evoluutiota. Se auttaa uusien lajien tunnistamisessa (DNA-viivakoodaus ja metagenomiikka) sekä lajien välisen sukulaisuuden tutkimisessa (fylogeneettiset analyysit).

ENA:n sisältämät geneettiset tietokannat tarjoavat mahdollisuuden suorittaa laajoja meta-analyysejä ja verrata eri väestöjen tai lajien geneettisiä tietoja. Tämä voi tukea monenlaisten tutkimusalueiden, kuten evoluutiobiologian, sairauksien tutkimuksen ja lääketieteen, edistymistä. ENA on avoin tutkijoille ympäri maailmaa.

ChEBI: pienimolekyyliset yhdisteet

ChEBI (Chemical Entities of Biological Interest) on biokemiallinen tietokanta, joka sisältää tietoa pienimolekyylisistä yhdisteistä, joilla on biologista merkitystä. Se on kuratoitu ja tarjoaa tarkkoja kemiallisia ja biologisia tietoja muun muassa lääkeaineista, metaboliiteista ja luonnonaineista. ChEBI tarjoaa tarkan kemiallisen rakenteen, molekyylikaavan, massan ja isomeerisen tiedon, mikä auttaa tutkijoita analysoimaan lääkeyhdisteiden kemiallisia ominaisuuksia.

Haku: tietokannasta voi hakea tietoa esimerkiksi paklitakselin biologista vaikutuksesta ja sen kohdemolekyylit

Ensembl: genomitietoa eliöistä

Ensembl on genomi- ja bioinformatiikkatietokanta, joka tarjoaa analysoituja genomitietoja useista eliöistä, mukaan lukien ihmiset, eläimet, kasvit ja mikrobit.

Haku: paklitakselin pääasiallinen vaikutuskohde on tubuliini -proteiini. Ensembl tarjoaa geneettistä ja proteiinirakennetietoa tubuliinista ja siihen liittyvistä geeneistä, mikä auttaa tutkimaan lääkeresistenssiä ja mutaatioiden vaikutuksia. Ensembl sisältää tietoa geneettisistä variaatioista, jotka voivat vaikuttaa Taxolin tehoon ja aiheuttaa haittavaikutuksia. Esimerkiksi CYP3A4- ja CYP2C8-entsyymit metabolisoivat Taxolia, ja niissä esiintyvät mutaatiot voivat vaikuttaa lääkkeen tehokkuuteen.

INSDC (International Nucleotide Sequence Database Collaboration) on maailmanlaajuinen verkosto, johon kuuluvat ENA, GenBank ja DNA Data Bank of Japan (DDBJ). Tämä yhteistyö mahdollistaa geneettisen datan jakamisen ja standardoinnin, jotta tutkijat voivat käyttää tietoja eri arkistoista ilman esteitä. Jos dataa tallennetaan johonkin näistä arkistoista, se on yleensä saatavilla myös muissa. Kun tutkija tallettaa geneettisen sekvenssin ENA:han, se voidaan synkronoida myös GenBankiin ja DDBJ:hen, mikä varmistaa tiedon globaaliin saatavuuden. Tämä synkronointi tapahtuu säännöllisesti, ja tietojen siirtäminen arkistojen välillä on automaattista ja ilman manuaalista väliintuloa. Koska ENA ja GenBank jakavat tietoja, tutkijat voivat käyttää samoja hakutyökaluja ja palveluja molemmista arkistoista, mikä helpottaa tietojen etsimistä ja analysointia.

Ari Turunen

8.5.2025

Lue artikkeli PDF-muodossa

Lisätietoja:

ELIXIR Core Data Resources

https://elixir-europe.org/platforms/data/core-data-resources

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-finland.org

http://www.elixir-europe.org

Mikrobisto vaikuttaa immuunijärjestelmään

Mikael Niku tutkii sikiöitä ja minkälaiseksi bakteeristo muodostuu syntymän jälkeen. Häntä kiinnostaa, miten äidin tai emon mikrobisto eri nisäkkäillä vaikuttaa sikiön kehittymiseen ja immuunijärjestelmään.

Pitkään on tiedetty, että syntymän jälkeen äidin mikrobit siirtyvät jälkeläiseen. Tämä siirtyminen valmistaa lasta syntymänjälkeiseen elämään.

”Emon mikrobisto vaikuttaa myös immuunijärjestelmän kehitykseen. Immuunijärjestelmä oppii hyväksymään hyödylliset suolistomikrobit ja toisaalta torjumaan taudinaiheuttajat. Monimuotoinen mikrobisto estää itsessäänkin taudinaiheuttajia asettumaan taloksi,” sanoo dosentti Mikael Niku, joka työskentelee Helsingin yliopiston Vuorovaikutukset yksilönkehityksessä (Developmental Interaction Lab)-tutkimusryhmässä.

Kuva: Mikael Niku; metaboliittien rakennekuvat: QuteMol (Tarini & Montani 2006).

Niku haluaa selvittää, millaisilla mekanismeilla äidin tai emän mikrobit ohjaavat immuunijärjestelmän kehitystä. Data-analyysejä tehdään Suomen ELIXIR-keskuksen CSC:n koneilla.

Niku analysoi mikrobistoja amplikonisekvensoinnilla, joka kohdentaa analyysin 16S-ribosomaalisen RNA:n (rRNA) geenialueelle. Näin voidaan tutkia mikrobiston koostumusta. 16S-geenialueet sekvensoidaan ja tunnistetaan julkisten tietokantojen kautta.

Suolistossa on iso osa kehon immuunisoluista. Ne kehittyvät verikantasoluista ja muuttuvat erilaisiksi valkosoluiksi. Ruokavalio, elämäntyyli, lääkkeet ja ympäristön kemikaalit vaikuttavat suoliston mikrobistoon. Mikrobit hajottavat elimistöön imeytyneet aineet aineenvaihduntatuotteiksi, metaboliiteiksi.

”Aikaisemmin me muiden tutkimusryhmien tavoin selvitimme, meneekö sikiöön äidin bakteereita. Terveessä sikiössä ei juurikaan ole eläviä bakteereita. Tiedetään kuitenkin, että sikiöön kulkeutuu mikrobien tuottamia pienimolekyylisiä metaboliitteja.”

Nikua kiinnostaa, minkälaisia metaboliitteja sikiöön kulkeutuu ja miten ne vaikuttavat kehitykseen.

”Mikrobien tuottamat metaboliitit imeytyvät suolistosta vereen ja veren kautta istukkaan ja sieltä sikiöön. Havaitsimme, että joidenkin metaboliittien pitoisuudet ovat yhteydessä sikiön geenien toimintaan. Nämä geenit usein liittyvät immuunijärjestelmään ja sen kehittymiseen.”

Vesikkelit vaikuttavat sikiön kehitykseen

Yhtenä mielenkiinnon kohteena ovat bakteerien tuottamat solunulkoiset vesikkelit. Vesikkelit ovat solujen tuottamia kalvorakkuloita, joita tuottavat sekä eläin- että bakteerisolut. Niitä löytyy kaikista kehon nesteistä. Vesikkelit löydettiin jo 1946, mutta vasta 2000-luvulla tutkimus lisääntyi. Vesikkelit sisältävät monenlaisia solujen tuotteita.

”Vesikkelit ovat mahdollisesti tärkeitä mm. materiaalien kierrätyksessä, solujen välisessä viestinnässä, immuunijärjestelmän säätelyssä ja erilaisissa sairauksissa.”

Oulun yliopiston tutkijat julkaisivat ensimmäisen tutkimuksen maailmassa, jossa osoitettiin, että äidin tai emon mikrobiston vesikkeleitä menee sikiöön. Löydettiin aiemmin tuntematon vuorovaikutusmekanismi äidin mikrobiston ja kehittyvän sikiön välillä.

Nikua kiinnostaa sikiön immuunijärjestelmän kehitys ennen syntymää. Oppiiko sikiön immuunijärjestelmä jo silloin tunnistamaan hyviä bakteereita, joita vastaan ei pidä hyökätä?

”Vesikkeleiden mukana sikiöön pääsisi bakteerien makromolekyylejä, esimerkiksi proteiineja, jotka mahdollisesti kouluttaisivat sikiön immuunijärjestelmää. Näin jälkeläinen, jo ennen syntymäänsä, voisi oppia tuntemaan äitinsä tai lajinsa suolistomikrobit.”

Seuraavaksi Niku selvittää, millä tavoin vesikkeleitä esiintyy sikiön kudoksissa ja miten ne pääsevät istukasta läpi ja miten ne vaikuttavat sikiössä.

Nikun mukaan voidaan ennen pitkää sitten sanoa, minkälaisia bakteereja ja bakteerien tuotteita sikiö tarvitsee, jotta immuunijärjestelmä kehittyisi optimaalisesti.

”Voitaisiin ehkä kehittää esimerkiksi sellaisia probioottivalmisteita, joissa on elimistölle tarpeellisia mikrobeja tai mikrobien tuottamia aineita, joita ei nyt ole saatavilla.”

Ari Turunen

14.11.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Microbiota affects the immune system. https://doi.org/10.5281/zenodo.14823362

Lisätietoja:

Helsingin yliopisto. Vuorovaikutukset yksilönkehityksessä-tutkimusryhmä

https://www.helsinki.fi/en/researchgroups/developmental-interactions

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Ihon monipuolinen mikrobisto auttaa immuunipuolustusta

Ihon mikro-organismeilla on suoliston tavoin merkittävä rooli kehon immuunijärjestelmän parantamisessa. Helsingin yliopiston yhteisöekologi Mira Grönroos tutkii elinympäristön, mikrobiyhteisöjen ja ihmisen terveyden välisiä yhteyksiä. Hän on kiinnostunut millä tavalla metsässä oleskelu ja erilaiset kontaktit luontoon vaikuttavat ihon mikrobistoon. Tavoitteena on löytää ratkaisuja ihmisen immuunipuolustuksen toiminnan parantamiseksi. Aihetta ei ole paljon tutkittu.

Allergialääkäri Tari Haahtela on esittänyt erityisen terveyden biodiversiteettihypoteesin: llman altistumista muulle luonnolle ja sen mikrobeille, elimistömme immuunipuolustus ei toimi tarkoituksenmukaisesti. Jos vuorovaikutus on heikkoa, kehon puolustus ei opi erottamaan, mikä on vaarallista ja mikä ei. Elimistö menee stressitilaan, josta seuraa matala-asteista tulehdusta. Kehon puolustusjärjestelmän ylireagointi voi johtaa sairauksiin.

Mira Grönroos on tutkijatohtorina Suomen Akatemian rahoittamassa monitieteisessä NATUREWELL-hankkeessa (2019-2025). Dosentti Riikka Puhakan vetämässä hankkeessa tutkitaan suomalaisnuorten ulkoiluharrastusten vaikutuksia terveyteen ja hyvinvointiin. Grönroos keskittyy hankkeessa siihen, miten ulkoilu ja luonnossa liikkuminen vaikuttavat nuorten elimistön mikrobiston koostumukseen.

”Nuoret osallistuivat erilaisiin luontoaktiviteetteihin. Heidän iholtaan otettiin mikrobinäytteet ennen ja jälkeen näiden aktiviteettien. Tutkimme muuttaako metsävaellus tai ulkoilu kaupunkiluonnossa nuorten mikrobistoa. Etsimme myös keinoja, miten nuoria voidaan kannustaa luontoon”, Grönroos kertoo.

Grönroos toimii tutkimusryhmässä, jota johtaa Luonnonvarakeskuksen erikoistutkija Aki Sinkkonen. Tutkimusryhmän muissa tutkimuksissa on mitattu interleukiinien ja T-solujen määriä. Pienimolekyyliset proteiinit, sytokiinit, toimivat elimistön solujen toimintoja ohjaavan säätelyjärjestelmän viestinviejinä. Niihin kuuluvat interleukiinit, jotka lisäävät tai vähentävät tulehduksia. T-solut auttavat tuhoamaan solujen sisällä eläviä taudinaiheuttajia. B-solut huolehtivat vasta-ainevälitteisestä immuniteetista. Tutkimuksissa havaittiin, että tulehdusta vähentävien interleukiini 10-proteiinien tasot nousivat mikrobialtistuksen jälkeen.

Päiväkotilapsien immuunijärjestelmän toiminta muuttui

Grönroosin mukaan immuunijärjestelmä ja mikrobit ovat jatkuvassa vuorovaikutuksessa keskenään.

”Tähänastiset tulokset ovat hyvin rohkaisevia. Nyt tutkitaan, kuinka voimakas luontoaltistus olisi tarpeen. Luonnossa oleskelulla on myös monia muitakin hyvinvointihyötyjä ja jo niidenkin takia metsään kannattaa mennä. Jos haluaa retkeltä lisäksi enemmän mikrobikontaktia, voi hyvin vaikka unohtaa käsien desinfioinnin ennen eväiden syöntiä”, sanoo Grönroos.

Sinkkosen tutkimusryhmässä on tehty interventiotutkimuksia. Tiedonkeruussa tutkijoiden puuttuminen tutkittavaan ilmiöön on menetelmän olennainen osa. Yhdessä tutkimuksessa lisättiin päiväkotien lapsien kontakteja luonnon mikrobistoon. Tutkimuksessa seurattiin kuukauden ajan 3 – 5-vuotiaita päiväkotilapsia kymmenessä päiväkodissa Lahdessa ja Tampereella.

”Päiväkodin piha viherrettiin ja lapset olivat sitä kautta enemmän luonnonmateriaaleihin kontaktissa. Toisessa tutkimuksessa hiekkaan lisättiin mikrobistoa sisältävää materiaalia”, kertoo Sinkkonen.

Kokeilla osoitettiin ensimmäistä kertaa maailmassa, että lasten immuunijärjestelmän säätely muuttui, kun lapset olivat kontaktissa monimuotoiseen, luonnon materiaaleista peräisin olevaan mikrobistoon.

Hiekasta, ihosta ja suolistosta kerätty mikrobisto sekvensoitiin. Tutkimuksessa selvitettiin, miten mikrobisto muuttui koeryhmällä ja kontrolliryhmällä. Tutkimuksessa sekvensoitiin 16S- ribosomaalisen RNA:n geenialue (16S rRNA) ja bioinformatiikka tehtiin Suomen ELIXIR-keskuksen CSC:n resursseilla. 16S- geenialueet ovat säilyneet evoluutiossa muuttumattomana miljoonia vuosia bakteereilla, minkä vuoksi näiden geenialueiden perusteella voidaan tunnistaa eri lajeja.

Lasten ihosta saatiin selville bakteeriyhteisön koostumus, metagenomi. Yli 30 bakteerisuvun suhteellinen runsaus kasvoi lasten iholla. Iholla olevien immuunipuolustusta tehostavien gammaproteobakteerien runsastuminen oli yhteydessä allergioiden ja immuunivälitteisten sairauksien syntyyn yhdistetyn interleukiini-17A:n muutokseen.

”Tehokkaat sekvensointimenetelmät ja niillä saatu data ovat elinehto mikrobien monimuotoisuuden sekä sen vaikutusten tutkimiselle. Pelkillä kasvatusmenetelmillä ei pystytä tutkimaan tällaisia kysymyksiä”, sanoo Grönroos.

Rinnakkaissekvensointi tarkoittaa miljoonien, jopa miljardien DNA-pätkien tunnistamista yhdestä näytteestä yhdellä kertaa. Sinkkosen tutkimusryhmässä on aloitettu myös shotgun -sekvensointi eli satunnaissekvensointi.

”Tällä menetelmällä saadaan tarkempaa tietoa koko mikrobiomin taksonomisesta profiilista sekä sen toiminnallisuudesta, kuten geeneistä ja aineenvaihduntareiteistä”, sanoo Sinkkonen.

Luontoaltistusta ja mikrobien moninaisuutta on pyritty myös kaupallisesti hyödyntämään. Tampereen yliopiston molekyylivirologi Olli Laitinen ja silloinen yliopistotutkija Aki Sinkkonen olivat perustamassa Uute Scientific -firmaa. Se alkoi vuonna 2020 valmistaa Lohjalla uutetta, joka sisältää tuhansia mikrobeja, joita on saatu metsämaasta. Jauheen muodossa olevia tuotteita on jo yli 40. Sinkkonen, Laitinen ja Grönroos ovat kollegoineen patentoineet menetelmän Euroopassa ja Yhdysvalloissa. Kuva: Uute Scientific

Mira Grönroosin tutkimus on monitieteistä. Mukaan on tullut myös yhteiskunta- ja kasvatustieteellinen näkökulma. Nyt halutaan edistää vuorovaikutusta luonnon kanssa. Jo aiemmissa päiväkotitutkimuksissa havaittiin, että lapset rakastivat leikkimistä luonnon materiaaleissa. Vastikään alkaneessa Tampereen yliopiston hankkeessa tutkitaan lasten suhtautumista mikrobeihin. ”Mikrobeja tuodaan näkyviksi sekä taiteen että tieteen keinoin. Itse toteutan tiedeosuuden. Lapset saivat päättää, mistä haluavat ottaa näytteet. Videoviestien kautta he pääsevät seuraamaan näytteiden matkaa laboratoriossa. Lopuksi esittelen sekvensoinnin tulokset lapsille.”

Ari Turunen

21.10.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). The skin’s wide range of microbiota improves the immune system. https://doi.org/10.5281/zenodo.14823352

Lisätietoja:

Helsingin yliopisto

https://www.helsinki.fi/en/researchgroups/nature-based-solutions

Luonnonvarakeskus

https://www.luke.fi/en/projects/biwe

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

RNA:ta sitovista proteiineista uusia lääkekohteita

Itä-Suomen yliopiston farmasian laitoksen lääketutkijan Piia Bartoksen kiinnostuksen kohteena on RNA, RNA:ta sitovat proteiinit ja miten tähän järjestelmään vaikuttamalla voisi estää syövän kasvua. RNA:ta ja siihen sitoutuvan argonautti- proteiinin toimintaa hän on tutkinut massiivisilla simulaatioilla.

Molekyylidynamiikan simulaatiot ovat antaneet tietoa, miten biomolekyylit vuorovaikuttavat toisiinsa atomien tasolla. Koska atomit ovat jatkuvassa liikkeessä, niiden väliset voimat lasketaan ja tämän perusteella selvitetään esimerkiksi proteiinin atomien uudet sijainnit, nopeudet ja energiat. Näin saadaan uutta tietoa lääkeainesuunnitteluun.

Bartos on tutkinut RNA:han sitoutuvia proteiineja (RBP-proteiinit), joilla voi olla merkitystä syövän hoitamisessa. Niillä on havaittu olevan merkitystä syöpäsoluille etenkin lääkevasteissa ja lääkeresistenssin muodostumisessa. Yli 1500 RBP-proteiinia on löydetty. Muutoksen näiden proteiinien toiminnassa voivat vaikuttaa syöpägeenien ilmentymisen tasoon.

RNA-häirintä (RNA-interferenssi eli RNAi) on biokemiallinen mekanismi, jossa RNA aiheuttaa lähetti-RNA:n pilkkoutumisen solussa, jolloin geenin ilmentyminen häiriintyy. RNAi:n löytäneet tutkijat Andrew Fire ja Craig Mello saivat työstään lääketieteen Nobelin palkinnon vuonna 2006. RNAi:n avulla voidaan sammuttaa syövän kasvua edistävien proteiinien ilmentyminen.

”Erityisenä kiinnostuksen kohteenamme ovat argonauttiproteiinit, joilla on tärkeä rooli RNA-välitteisessä geenien hiljentämisessä eli RNA-häirinnässä. Näistä tärkeimpänä on Ago2,”sanoo Bartos.

Kun RNA on sitoutunut Ago2-proteiiniin, tätä yhdistelmää kutsutaan RNA-Ago2-kompleksiksi. Argonautti 2-proteiini sitoo mikro-RNA -molekyylejä soluissa.

”Koska argonautti-2 on solun toiminnalle elintärkeä proteiini, se todennäköisesti vaikuttaa kaikkiin syöpätyyppeihin. Jos se poistetaan soluista, solut eivät pysy elossa. Jos sen toiminta pystyttäisiin poistamaan syöpäsoluissa, syöpäsolutkaan eivät pysyisi elossa. Näin voitaisiin estää syöpäsolujen kasvaminen ja leviäminen.”

Kompleksi, jossa RNA on esitetty palloina ja Ago2:n (argonautti 2) eri osat (domeenit) eri väreillä. Nämä kompleksit voivat hyödyntää muita proteiineja lääkevaikutusten aikaansaamiseksi. Hyvä lääkeaine ei synny, ellei tiedetä, mihin proteiineihin se elimistössämme vaikuttaa.

Proteiinin rakenteen simulaation avulla etsitään täsmälääkkeitä

Haasteena on, että RNA-Ago2-kompleksissa voi olla sitoutuneena kahdenlaisia RNA-molekyylejä. Ensimmäinen estää, mutta toinen lisää proteiinin tuotantoa. Jälkimmäisessä tapauksessa syöpäsolujen tuotanto voikin lisääntyä.

”Simuloin RNA:n toimintaa erikseen ja yhdessä Ago-2-proteiinin kanssa. Olen pyrkinyt selittämään, miten Ago-2- kompleksit eroavat rakenteellisesta toisistaan, siis silloin kun siinä on sellainen RNA, joka lisää proteiinin tuotantoa ja silloin kun siinä on proteiinin tuotantoa vähentävä RNA. Olemme vasta saaneet simulaatiot ajettua ja nyt tuloksia analysoidaan.”

Molekyylidynamiikkasimulaation avulla voidaan tehdä eräänlaisia videoita Ago2-RNA-kompleksien liikkeistä ja vertailla aktivoivien ja hiljentävien kompleksien eroja.

Simulaatiossa käytetty RNA-sekvenssidata saatiin A.I Virtanen-instituutista. Simulaatioissa oli kuusi RNA-molekyyliä, joista kolme lisäsi ja kolme vähensi proteiinien tuotantoa. Näille kaikille tehtiin molekyylidynamiikan simulaatioita noin 50 mikrosekuntia eli sekunnin miljoonasosa systeemiä kohden. Simulaatioissa tarvittiin paljon Suomen ELIXIR-keskuksen CSC:n laskentaresursseja.

”Se on aika iso proteiini. Yhdessä RNA:n ja ympäröivän veden kanssa siinä on noin 300 000 atomia, ja niille kaikille piti laskea nopeus ja paikka neljän femtosekunnin välein.”

Femtosekunti on miljoonasosa sekunnin miljardisosasta. Bartos haluaa selvittää, muuttuuko kompleksin muoto ja liikkuuko joku proteiinin osa eri tavalla, kun siinä on lisäävä tai vähentävä RNA sitoutuneena.

”Kompleksin muodon muuttuminen voi todennäköisesti indikoida sitä, että kompleksi sitoutuu eri proteiineihin.”

Kompleksien rakenteissa tai liikkeissä täytyy siis olla jokin ero, joka saa aikaan erilaiset geenien ilmentymistä lisäävät ja vähentävät vaikutukset.

Ymmärtämällä geenien ilmentymistä vähentävien ja lisäävien RNA-proteiinikompleksien rakenteelliset erot, pystytään suunnittelemaan ja etsimään lääkeaineita, jotka sitoutuvat vain haluttuun kompleksiin. Bartosin mukaan tällaiset lääkeaineet olisivat lääketieteellinen läpimurto ja tarjoaisivat uuden mahdollisuuden hoitaa syöpäsairauksia, joissa proteiinien tuotanto on häiriintynyt.

”RNA-häirintään perustuvat lääkkeet ovat hyvä vaihtoehto. Nämä lääkkeet verrattuna tavalliseen pienimolekyyliseen syöpälääkkeeseen voisivat olla spesifisempiä ja tarkemmin syöpäsoluun kohdentuvia. RNA-häirinnällä pystyisimme tarvittaessa estää minkä tahansa haluamamme proteiinin ilmentymisen syövässä. Eli siitä saisi täsmälääkkeitä.”

Bartosin mukaan RNA:n toiminnan mallintaminen on kuitenkin vielä haasteellista. Simulaatioissa voimakenttämallit toimivat hyvin proteiineille, mutta eivät RNA:lle.

”Se johtuu siitä, että se RNA on kemiallisesti ja fysikaalisesti aika erilainen kuin proteiinit.”

Ongelma on esimeriksi fosfaatti, joka muodostaa RNA:n rangan yhdessä deoksiriboosin kanssa.

”RNA:n fosfaatti on sähköisesti varautunut ja sitä nämä nykyiset voimakenttäyhtälöt eivät kovin hyvin pysty mallintamaan. Eli tässä on selkeästi työsarkaa työkalujen kehittämisessä.”

Lääkeainesuunnittelu etenee suurin harppauksin monella tasolla. DeepMindin tekoäly Alphafold osaa jo ratkaista, miten sekvenssi muuttuu proteiinirakenteeksi. Se käyttää tunnettuja proteiinirakenteita ja ennustaa rakenteen kaikille tunnetuille proteiineille. Sekvensoinnin avulla voidaan puolestaan selvittää syövässä esiintyvät mutaatiot ja mallien avulla tutkia, miten mutaatiot vaikuttavat syöpälääkkeiden toimintaan.

”Mutaatio voi esimerkiksi estää syöpälääkkeen sitoutumisen kohdeproteiiniin lääkevaikutuskohteeseen, jolloin kyseisestä lääkityksestä harvoin on potilaalle hyötyä.”

Laskentakapasiteetin kasvaessa voidaan tulevaisuudessa myös simuloida isompia kokonaisuuksia.

”Olisi hienoa simuloida yksittäistä proteiinia isompaa yksikköä, esimerkiksi solutasolla. Voitaisiin simuloida, miten proteiini vaikuttaa muiden proteiinien, solukalvojen ja soluelinten kanssa.”

Ari Turunen

30.9.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). New drug targets from RNA-binding proteins. https://doi.org/10.5281/zenodo.14810576

Lisätietoja:

Hanna Baltrukevich & Piia Bartos: RNA-protein complexes and force field polarizability. Front. Chem., 22 June 2023

Sec. Theoretical and Computational Chemistry

Volume 11 – 2023 | https://doi.org/10.3389/fchem.2023.1217506

Milla Kurki et all: Structure of POPC Lipid Bilayers in OPLS3e Force Field. Journal of Chemical Information and Modeling. Vol 62/Issue 24

https://pubs.acs.org/doi/full/10.1021/acs.jcim.2c00395

Itä-Suomen yliopisto

www.uef.fi

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Uusi koneoppimisen menetelmä nopeuttaa lääkeaineiden seulontaa satakertaisesti

Itä-Suomen yliopistossa seulottiin virtuaalisesti 1,56 miljardia molekyyliä kahdelle lääkekohde-ehdokkaalle. Seulonta oli maailman suurin lajissaan.

Suurin osa käytössä olevista lääkkeistä on suunniteltu niin, että niiden kohdemolekyyleinä ovat elimistön proteiinit. Kun proteiiniperheen yhden jäsenen rakenne on selvitetty, voidaan muiden samaan perheeseen kuuluvien proteiinien rakenne ennustaa mallintamalla. Toimiva lääke voidaan kehittää esimerkiksi siten, että seulotaan isosta kirjastosta molekyyli, jonka kolmiulotteinen rakenne mahdollistaa vuorovaikutuksen kohdeproteiinin kanssa.

Professori Antti Poson tutkimusryhmässä etsittiin kahden lääkevaikutuskandidaatin, SurA-kaperonin ja GAK-kinaasin kanssa reagoivia molekyylejä. Hankkeessa testattiin seulontaan kehitetyn HASTEN-algoritmin toimivuutta ja luotiin uusi koneoppimisen malli.

”Nämä kohdeproteiinit, eli SurA ja GAk, olivat meille entuudestaan tuttuja, olemassa olevista akateemisista tutkimushankkeista. Massiivisten seulontojen tuloksia voidaan nyt hyödyntää muissa tutkimuksissa. Emme siis pelkästään validoineet menetelmää vaan voimme myös auttaa erillisiä akateemisia tutkimushankkeita”, sanoo Poso.

Kaperonit auttavat proteiinien laskostumisessa ja säätelevät proteiinien välisiä vuorovaikutuksia. Kinaasit toimivat mm. solujen signaalienvälittäjinä.

”SurA –kaperoni liittyy Tübingenin yliopiston yhteistyöhankkeeseen, jossa tavoitteena on kehittää uusia antibiootteja. Kinaasit taas ovat iso proteiiniperhe. Syöpälääkkeistä iso osa on kinaasi-inhibiittoreita. Kinaaseja on noin 500 erilaista ja GAK (Cyclin-G-associated kinase) on yksi niistä. GAK:n potentiaali on syöpälääkkeissä ja virusinfektoiden torjunnassa.”

Poson ryhmässä tutkitaan lääkeaineiden vuorovaikutuksia proteiinien kanssa ja rakennetaan kohdeproteiinimalleja. Kohdeproteiinin rakenteesta voidaan yleensä tunnistaa lääkeaineen sitoutumispaikka proteiinin ja saada siten lääkeaine toimimaan. Mallia voidaan erityisesti käyttää virtuaaliseulontaan, jossa suurista molekyylitietokannoista etsitään uusia ideoita lääkekehitykseen.

”Kaperoni on proteiinirakenteeltaan hyvin erityyppinen kuin kinaasi. Kyseessä on siis kaksi hyvin erilaista kohdeproteiinia, joita oli hyvä testata yhdessä.”

Tekoäly osasi ennustaa molekyylien sitoutumisen proteiineihin

Enamine Real-tietokannan täysi versio sisältää jo 48 miljardia rakennetta. Pelkästään molekyylirakenteiden muuttaminen kolmiulotteiseen muotoon on aikaavievää ja työlästä näin ison datamäärän ollessa kyseessä, mutta HASTEN-algoritmin avulla tämä vaihe voidaan ”ohittaa” ja materiaali käydään läpi muutamassa päivässä. Kuva: Ina Pöhner.

Kahden lääkeaihion rakenteen erilaisuus oli tärkeä tekijä, koska algoritmin pitää toimia kaikissa proteiiniperheissä.

”Kahdella lääkeaineaihiolla testattiin, miten Orionin Tuomo Kalliokosken kehittämä HASTEN-algoritmi toimisi CSC:n superlaskentaympäristössä. Skaalautuvuus onnistui.”

Kohdeproteiinien seulontaa tehtiin vertailun vuoksi HASTEN-algoritmilla ja perinteisellä telakointi -menetelmällä (docking). Telakoinnissa hakualgoritmi laskee vuorovaikutukset proteiinin ja tietokannassa olevan lääkeainekandidaatin välillä. Algoritmin antama lukuarvo kertoo, miten hyvin lääkeaine sitoutuu proteiiniin.

Poson ryhmässä seulottiin 1,56 miljardia lääkeainekandidaattia sisältävää molekyyliä. Molekyylit seulottiin ison ukrainalaisen kemian alan yrityksen Enaminen REAL-tietokannasta.

”Ensin laskettiin joka ikinen tietokannassa oleva piirretty kaksiulotteinen molekyyli ja ne muutettiin kolmiulotteiseen muotoon. Sitten tietokoneohjelma yritti sovittaa kunkin molekyylin GAK:n tai SurA:n sisään. Yksittäinen sovitus voi käsittää jopa satojatuhansia potentiaalisia vaihtoehtoja.”

Sitten tutkijat kokeilivat, miten koneoppimisen malli pärjäsi telakointiin verrattuna. Koneoppimiseen käytettiin HASTEN-algoritmia.

”Valitsimme ensin satunnaisesti miljoona molekyyliä ja katsoimme, miten telakointi sujui. Sitten tämä tulos kerrottiin tekoälylle. Kone siis opetteli miljoonan molekyylin perusteella ennustamaan tuloksen. Eli kun molekyyli näyttää tietynlaiselta, se telakoituu tiettyyn kohtaan.”

Tämän jälkeen tekoälylle syötettiin kaikki 1,56 miljardia molekyyliä ja ennustetiin tulokset perustuen miljoonan molekyylin tuloksiin. Parhaiksi ennustetut telakoitiin ja tulosten perusteella koneoppimine tehtiin uudelleen. Muutaman kierroksen jälkeen tekoäly ennusti telakoinnin 90% tarkkuudella.

”Opetettu kone pystyi tekemään seulonnan huomattavasti nopeammin kuin perinteisen telakointimenetelmän avulla. Kun telakoinnin laskemiseen meni pari kuukautta tehokkaillakin tietokoneilla, koneoppimisen avulla oppimisprosessi ja ennustaminen vei muutaman päivän.”

Poson mukaan nyt tutkijat pystyvät rutiininomaisesti seulomaan miljardeja molekyylejä samassa ajassa kuin missä aiemmin seulottiin miljoona. Lisäksi koneoppimisen mallin takia miljardien molekyylien seulonnan voi nyt tehdä ilman supertietokonetta.

”Nyt tietenkin voidaan supertietokoneella seuloa vieläkin suuremmista tietokannoista tuhansia miljardeja molekyylejä tämän menetelmän avulla. ”

Poson ryhmä tutkii seuraavaksi ns. vivid screening-menetelmää.

”Sen sijaan, että ennustetaan jokin tietty yksittäinen aktiivisuus tai telakointi, voidaankin samaan aikaan ennustaa useita erilaisia ominaisuuksia, esim. välttää jotakin sivuvaikutuksen omaavaa sitoutumispaikkaa samalla kun pidetään sitoutuminen oikeaan kohteeseen hyvänä.”

Tutkimuksessa käytettiin Suomen ELIXIR-keskuksen CSC:n superlaskentaresursseja, datantallennusta sekä tarvittavien työkalujen kontitusta.

Ari Turunen

31.8.2024

Lue artikkeli PDF-muodossa

Sitaatti:

Turunen, A., & Nyrönen, T. (2024). New machine learning method speeds up drug screening hundred-fold. https://doi.org/10.5281/zenodo.13691983

Lisätietoja:

Toni Sivula, Laxman Yetukuri, Tuomo Kalliokoski, Heikki Käsnänen, Antti Poso & Ina Pöhner (2023): Machine Learning-Boosted Docking Enables the Efficient Structure-Based Virtual Screening of Giga-Scale Enumerated

Chemical Libraries. J. Chem. Inf. Model. DOI: 10.1021/acs.jcim.3c01239. Available at: https://pubs.acs.org/doi/full/10.1021/acs.jcim.3c01239

HASTEN-algoritmi

https://github.com/TuomoKalliokoski/HASTEN

Itä-Suomen yliopisto

https://www.uef.fi/fi

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Kahvin perimän selvittäminen parantaa taudinkestävyyttä

Arabica-kahvin genomi julkaistiin huhtikuussa 2024. Se oli yksi viimeisistä merkittävistä viljelykasveista, jonka perimän sekvensointia ei ollut vielä julkaistu. Tutkimusta johtaneen Jarkko Salojärven mukaan nyt voidaan löytää geenejä, jotka parantavat kahvin satoisuutta ja kestävyyttä tauteja vastaan.

Kansainvälinen tutkimuskonsortio, jossa oli mukana muun muassa Helsingin yliopiston ja Singaporen Nanyangin teknillisen yliopiston tutkijoita, on koostanut kolmen kahvilajin perimän kahvipensaan lehtisolujen DNA:n sekvenssipätkistä. Arabican (Coffea arabica) genomi koostettiin Singaporessa ja Helsingissä, ja robustan (C.canephora) sekä C. eugenioides-lajikkeen perimä Cornellin yliopistossa Yhdysvalloissa.

”Tarkoituksena on löytää satoisuutta ja laatua parantavia ominaisuuksia. Viljelty arabica on geneettisesti vähemmän moninainen ja altistuu siksi taudeille helposti”, sanoo apulaisprofessori Jarkko Salojärvi.

Kahvin taloudellinen merkitys on valtava. Sitä viljellään 70:ssä eri maassa ja yli 100 miljoonaa ihmistä saa siitä elantonsa. Kahvi onkin yksi maailman tärkeimmistä kaupallisista tuotteista. Kahvin jalostuksessa on kuitenkin riskinsä.

”Yleensäkin viljelykasvien geneettinen moninaisuus on jalostuksen myötä vähentynyt. Tautien vastustuskyvystä vastaavat geenit eivät siis ole viljellyissä kahvilajikkeissa kovin monimuotoisia. Siksi arabica on patogeeneille altis.”

Kaiken kaikkiaan 60% maailman kahvista on arabicaa (Coffea arabica). Arabican lisäksi kaupallisesti viljelty lajike on robusta (Coffea canephora), joka sisältää arabicaa enemmän kofeiinia ja on kitkerämpää. Sitä käytetään etenkin pikakahveissa. Vietnam on maailman suurin robustan tuottaja. Harvinainen Coffea eugenioides on makeaa, koska sen kofeiinipitoisuus on pieni. Sen satoisuus on heikompaa kuin arabican ja robustan.

Salojärvi on erikoistunut kasvien genomien selvittämiseen. Hän on ollut mukana tutkimassa avokadon, koivun, litsin ja Darrowin mustikan perimää. Salojärvi työskentelee Nanyangin teknillisessä yliopistossa Singaporessa sekä Helsingin yliopistossa. Hyvin laaja-alainen ja kansainvälinen tutkimusryhmä käyttää paljon laskennallisia resursseja ja tietokantoja molemmissa maissa.

Koko genomin sekvensointi mahdollistaa sekä yleisten että harvinaisten mutaatioiden paljastamisen koko genomissa. Arabican genomi sekvensointiin vasta vuonna 2024 johtuen sen perimän monimutkaista rakenteesta.

Arabica on Coffea eugenioidesin ja robustan risteymä. Koska kumpikin lajikkeista on diploidi, niin arabicassa kromosomeja on nelinkertainen määrä eli se on tetraploidi. Tällaiset kasvit kasvavat usein nopeammin ja suuremmiksi kuin diploidit. Niiden genomin rakenne on usein erittäin monimutkainen ja luo haasteita sen kokoamiselle. Arabican genomin kokoamista vaikeutti se, että kaksi alagenomia (C.canephora) ja C. eugenioides) ovat hyvin samankaltaisia johtuen niiden läheisestä evoluutiohistoriasta, niiden lajiutuminen tapahtui vain noin 4.5-7.2 miljoonaa vuotta sitten.

Näihin verrattuna arabica-risteymän villi, Etiopiasta kotoisin oleva versio on verrattain nuori, noin 350 000 vuotta vanha. Arabica on käynyt läpi monia ns. geneettisiä pullonkauloja, jolloin huomattava osuus populaatiosta estyy lisääntymästä ja populaatio supistuu oleellisesti. Siksi arabican geneettinen moninaisuus ei ole kovin suuri. Sen viljellyssä versiossa on villeihin versioihin verrattuna vielä vähemmän geneettistä variaatiota. Tämä johtuu ihmisen aikaansaamasta pullonkaulasta: suurin osa maailmassa viljellystä arabicasta periytyy oikeastaan vain kahdesta, noin 300 vuotta sitten eläneestä kasvista.

1600-luvun alussa arabican siemeniä salakuljetettiin Jemenin ulkopuolelle ja arabicaa ryhdyttiin viljelemään Kaakkois-Aasiassa ja myöhemmin Karibialla. Tätä arabican muunnosta kutsutaan nimellä typica ja sen viljelyä hallinnoivat alankomaalaiset. 1700-luvulla ranskalaiset aloittivat arabican viljelyn Intian valtameren Reunionin saarella. Tätä muunnosta kutsutaan Reunionin vanhan nimen mukaan nimellä bourbon. Nykyiset viljellyt arabica-pensaat periytyvät siis joko typicasta tai bourbonista.

Ilmastonmuutos vaikuttaa kahvin satoisuuteen

Ilmastonmuutos vaikuttaa jo nyt kahvin satoisuuteen. Kuivuus on pienentänyt satoja esimerkiksi Brasiliassa ja Kolumbiassa. Arabicaa viljellään yli 1500 metrin korkeudessa tropiikissa. Kun ilmasto lämpenee, sitä on viljeltävä entistä korkeammalla, jolloin viljelyala pienenee.

Ilmaston lämpeneminen lisää myös sairauksia. Kahviruoste (Hemileia vastatrix) saa kahvipensaan pudottamaan lehtensä. Tauti ei selviä alle 10 asteen lämpötiloissa, joten vuoriston öiden lämpeneminen edistää taudin leviämistä.

Jarkko Salojärven mukaan kahvin kestävyyttä voidaan kuitenkin parantaa genomiin perustuvan jalostuksen avulla.

”Voidaan tehdä ennustettavia malleja sekvensoimalla jonkun populaation vanhemmat ja katsomalla, kuinka hyvin voidaan vanhempien genomien perusteella ennustaa ilmiasua jälkeläisille. Sen perusteella pystytään löytämään markkereita, joiden perusteella voidaan valita seuraavan sukupolven yksilöitä, jotka todennäköisesti tuottavat parempaa satoa tai ovat resistenttejä patogeeneille. Tällaistahan tarvitaan erityisesti kahville, jonka viljelypinta-ala voi puolittua ilmastonmuutoksen takia jo noin 30 vuoden sisällä. ”

Genomijalostus kahviruostetta vastaan

Sekvensoinnin avulla voidaan etsiä kahvilajien genomeista geenialueita, jotka ovat lämmönkestäviä ja vastustuskykyisiä taudeille. Tiedetään, että robusta kestää kuumaa säätä paremmin kuin arabica. Se on myös vastustuskykyinen tauteja, kuten kahviruostetta, vastaan. Erityisen kestävä on Timorin saarelta 1930-luvulla löydetty robustan ja typica-arabican hybridi (Hibrido de Timor).

Salojärven mukaan sen genomista löydetyt alueet voivat mahdollistaa genomiin perustuvan arabican jalostuksen.

”Timorilaisesta hybridistä saadut geenit ovat tosin vasta kandidaattigeenejä. Seuraavaksi pitää tutkia onko yhteys oikeasti kausaalinen. Sen testaamiseen menee varmaan n. 5-10 vuotta, jolloin tuota tietoa voidaan käyttää jalostuksessa.”

Tutkimus kohdistuu näiden kandidaattigeenien toimintaan taudin iskiessä.

”Esimerkiksi voi olla, että nuo geenit kyllä aktivoituvat kahviruosteen hyökätessä, mutta ne voivat olla sen verran myöhäistä vastetta, että niistä ei ole sen estämiselle enää mitään hyötyä,” Salojärvi huomauttaa.

”Seuraavaksi pitäisi hiljentää nuo geenit ja selvittää, poistuuko resistenssi. Tai sitten siirtää ne kahviruosteelle alttiiseen lajikkeeseen ja katsoa, saadaanko sillä resistenssiä aikaiseksi. Kumpaakaan versiota ei voi käyttää kahvintuotantoon, koska ne olisivat siirtogeenisiä yksilöitä, mutta niillä saadaan varmistettua, että kyseessä ovat oikeat geenit. Jalostamisessa voidaan sitten keskittyä jälkeläisiin, joilla tuo resistenssialue on olemassa.”

Kahvin perimän kromosomi -tason määrittäminen vaati myös kromosomien kolmiulotteisen rakenteen selvittämistä. Suomen ELIXIR-keskuksen CSC:n laskentaresursseja käytettiin tähän tehtävään. Prosessissa kahvin yhtenäiset perimäjaksot yhdisteltiin rakennetta hyväksi käyttämällä kromosomin pituisiksi tikastuksiksi (scaffolding).

”Se tarkoittaa, että kromosomi koostetaan täysin sekvensoiduista paloista sekä tyhjistä palikoista niiden välillä. Rakenteen selvitys paljastaa muun muassa yhteyden geenien ja niitä säätelevien perimän alueiden kanssa.”

Sademetsän biodiversiteetti

Kahvin genomin selvittämisen jälkeen Jarkko Salojärvi tutkii seuraavaksi sademetsän kasvien genomeja. Singaporen Bukit Timahin 163 hehtaarin luonnonsuojelualueella kasvaa yli 800 erilaista koppisiemenistä kasvilajia. Nanyangin teknillisen yliopiston hankkeessa hänen ryhmässään tutkitaan sademetsän biodiversiteettiä sekvensoimalla kaikki alueen kasvilajit. Painopiste on sademetsän geenien koostumuksessa. Samalla katsotaan ennen näkemättömiä biosynteesireittejä, joissa kasvit valmistavat yksinkertaisista yhdisteistä entsyymien avulla monimutkaisia yhdisteitä.

”Erityisen kiinnostavaa on tutkia, millaisia erilaisia muunnoksia eri kasvilajeilla on pääasiallisiin biosynteesireitteihin.”

Kasvien aineenvaihduntatuotteet, metaboliitit, ovat tärkeitä tutkimuskohteita esimerkiksi uusien lääkeaineiden löytämiselle. Salojärven mukaan koneoppiminen mullistaa lääkeaineiden ja metaboliittien tutkimisen.

”Esimerkiksi Googlen tekoälyohjelma Alphafold 3 pystyy ennustamaan kasvin genomista proteiinirakenteet ja erilaisia modifikaatioita metaboliiteille. Kun genomi on selvitetty, niin tämä tutkimus lähtee vauhdilla tekoälyn ansiosta eteenpäin.”

Belgian ELIXIR-keskus: työkaluja kasvitutkimukseen

Kaikki kolme kahvin genomia on jaettu EBI/NCBI-tietokantoihin. Näiden lisäksi annotaatiotietoihin pääsee ORCAE-tietokannan kautta. ORCAE tarjoaa työkaluja geenien rakenteiden tutkimiseen ja sisältää annotaatioita eri aitotumaisten genomeista. Sitä operoi Belgian ELIXIR-keskus.

Belgian ELIXIR tukee kasvien ja biodiversiteetin tutkimusta. Se tarjoaa resursseja genomiikkaan ja fenotyyppidatan hallinnointiin. VIB-UGent -yliopiston bioinformatiikan ryhmät, jotka myös osallistuivat kahvitutkimukseen, ovat kehittäneet työkaluja genomien annotaatioiden kuratoimiseksi (ORCAE) sekä vertailevaan genomiikkaan (PLAZA). ORCAE on verkossa toimiva portaali aitotumaisten genomien kuvailutietojen selailuun, kun taas PLAZA on liityntäpiste vertailevan genomiikan ja genomisen datan keskittämiselle.

“Kaikki julkisesti rahoitettu projektidata pitää julkaista generoituna raakadatana tiedeyhteisöille. Kukin tallennusjärjestelmä tarjoaa käyttöliittymät ja toimintaohjeet auttamaan raakadatan ja siihen liittyvät metadatan tallentamisessa”, sanoo johtava tutkija Stephane Rombauts (VIB-UGent Center for Plant Systems Biology).

”Olemme kehittämässä parempia ja uudempia käyttöliittymiä jotta saisimme koko toimitusprosessin helpommaksi.”

Belgian ELIXIR-keskus on ollut kehittämässä työkaluja myös helpottamaan toimittamista Euroopan nukleotidiarkistoon (European Nucleotide Archive, ENA). ENA on täysin avoin arkisto raa’an sekvenssi, koonti- ja annotaatiodatan tallentamiseen.

ENA Data Submission Toolbox-työkalu yksinkertaistaa sekvenssidatan toimittamisen tarjoamalla yksivaiheisen toimitusprosessin, graafisen käyttöliittymän, taulukkomuotoillun metadatan ja asiakaspuolen todentamisen.

”Käyttöliittymät tarjoavat vain väylän datan lataamiselle, mutta jos ne toimisivat myös varmuuskopiona, se olisi kannuste ladata dataa nopeammin,” Rombauts sanoo.

“Asiantuntijoiden pitää validioida kertaalleen ladattu data, ennen kuin se liitetään järjestelmään ja vasta sitten lopuksi se saa ainutkertaisen käyttönumeronsa. Prosessi voi olla toisinaan hidas koska sekvensointi tulee halvemmaksi ja helpommaksi ja samaan aikaan asiantuntijoiden silti pitää validoida alati kasvavia latauksia.”

”Lisäksi genomista dataa saadaan kasvavassa määrin long-read-muodossa, tai raakana, rikkaampana, aiempaa suurempina määrinä tehden nämä käyttöliittymät toisinaan sopimattomiksi viimeisille datatyypeille tai uusimmille sovelluksille.”

Ari Turunen

22.7.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Mapping the coffee genome to improve disease resistance. https://doi.org/10.5281/zenodo.13691962

The genome and population genomics of allopolyploid Coffea arabica reveal the diversification history of modern coffee cultivars.
Nature Genetics, 56, 721-731 (2024).
https://doi.org/10.1038/s41588-024-01695-w

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Miksi jotkut sairastuvat vaikeaan koronavirustautiin?

Koronavirus ei ole kadonnut maailmasta ja voi muuntautua jälleen vaaralliseksi. THL:n tutkimusprofessori Markus Perola selvittää ryhmänsä kanssa rekisteri- ja genomitietojen perusteella, mitkä tekijät vaikuttavat siihen, että osa väestöstä sairastuu vaikeaan koronaan ja joutuu sairaalahoitoon. Tutkimus vaatii paljon laskentaa ja sensitiivisen datan käsittelyä.

Loppuvuonna 2019 ilmaantunut COVID 19-virus aiheutti pandemian, joka järkytti koko maailmaa. Tauti oli hengenvaarallinen iäkkäille. Maaliskuussa 2021 mennessä tautiin oli kuollut 2,5 miljoonaa ihmistä noin 15 kuukauden aikana. Maailmanlaajuinen kriisi vaikutti niin talouteen kuin terveydenhuoltoon.

”Pandemioita tulee, koska väkiluku kasvaa ja asumme tiiviimmin ja lähempänä tuotantoeläimiä. Samalla luonnon monimuotoisuus vähenee ja syömme yksipuolisemmin. Maapallo on oikeastaan petrimalja, jossa kasvatetaan pandemioita,” sanoo Markus Perola.

Koska uusia muotoja viruksesta voi ilmetä, on tärkeää ymmärtää viruksen toimintaa ja miten sitä vastaan voidaan taistella. Esimerkiksi COVID-19 Host Genetics Initiative-projektissa tutkijat ympäri maailmaa yhdistivät voimansa kerätäkseen tietoa koronavirustartunnan piirteistä.

Tarkoituksena on tunnistaa yksilöt, joilla on suuri riski saada vakava tauti. Projektin tuloksena löytyi yli 50 perimän aluetta, joissa voi olla COVID-19 -taudille altistavia geenejä. Osa näistä altistaa myös erityisen vaikealle tautimuodolle.

”Näitä tietoja hyödynnetään THL:n omassa tutkimuksessa, jossa selvitetään, miksi jotkut koronaan sairastuneista joutuvat sairaalaan. Yksi syy voi löytyä geeneistä, ” sanoo Markus Perola.

Perolan johtamassa tutkimuksessa kerätään dataa yli 3 000 henkilöstä, jotka ovat joutuneet sairaalahoitoon tai lievemmissä taudin muodoissa hakeutuneet koronavirustestiin. Tutkimuksessa käytetään rekisteritietoja. Näytteiden keräys tehdään yhteistyössä biopankkien kanssa. Verinäytteistä tutkitaan muita samanaikaisia tartuntatauteja, tulehduksen vakavuusastetta sekä muita elimistön tasapainosta kertovia arvoja.

”Kun aina puhutaan eri riskiryhmistä, unohdetaan se, että iso osa koronaan sairastuneista riskiryhmäläisistä ei joudu teho-osastolle tai kuole siihen. Esimerkiksi kuolleisuus koronaan yli 80-vuotiaissa on kymmenen prosentin luokkaa, mutta kymmenet prosentit eivät myöskään kuole. Eli mikä on näiden ryhmien ero? Entä miksi jotkut hyvin ylipainoiset ihmiset joutuvat teho-osastolle, mutta toiset eivät? Toiveeni on, että löydettäisiin riskiryhmät, joita voitaisiin parhaiten suojata rokotuksin.”

Geeni-ja rekisteridatan yhdistäminen

Perolan mukaan genetiikan ja rekisteridatan yhdistäminen antaa lisävalaistusta asiaan. Isojen datamäärien analysoinnista Perolalla on poikkeuksellisen kiinnostavia tutkimustuloksia. Tero Hiekkalinnan ja Joseph Terwilligerin kanssa hän teki simulaation, jossa testattiin miljoonan ihmisen genomin data-aineiston hyödyntämistä. Aineistossa oli myös kliinistä fenotyyppidataa. CSC:n supertietokoneella analysoitiin anonymisoitua dataa, jossa oli genomidatan lisäksi tietoja terveydestä, sukulaisuussuhteista, iästä, sukupuolesta. Tämä testi tuotti arvokasta uutta tietoa, miten suuria datamääriä voitaisiin tulevaisuudessa hyödyntää julkisessa terveydenhoidossa.

Miksi kansallisten terveysvariaatioiden ymmärtäminen on tärkeää kansakunnan terveydenhuollolle?

”Jos emme tunne suomalaisia erityispiirteitä, ei kukaan muukaan niitä tutki. Hyvänä esimerkkinä on suomalaisen tautiperimän taudit, joita on nelisenkymmentä tänne konsentroitunutta harvinaista sairautta. Geenitutkimuksessa tehdään vankkaa kansainvälistä yhteistyötä geenien tunnistamisessa ja geenien toiminnan selvittämisessä. Mutta sen tuomisen kliiniseen todellisuuteen tekevät suomalaiset. ”

Suomi on geneettinen isolaatti, koska se on historiallisesti kasvanut vähän erillään muista Euroopan maista. Meillä on oma perimän muotomme, jota on tutkimuksellisesti helppo lähestyä eri tavalla. Täältä löytyy sellaista biologiaa, mitä ei muusta väestöstä löydy. Täältä on löytynyt toistasataa suomalaista tauteihin vaikuttavaa varianttia, joita ei muissa väestöissä näy.

Perolan mukaan suomalainen väestö on tavallaan maailman suurin isolaatti.

”Meillä on tilastollista voimaa enemmän löytää näitä variantteja verrattuna muihin eristyksissä oleviin populaatioihin, kuten Islantiin. Harvinaiset geenivariantit tuovat uutta tietoa tautien biologioista mitä ei muista populaatioista saada. Ne voivat avata ihan uusia syitä ja teitä tautien ymmärtämiselle. Olisiko tähän lääke vai pitääkö kehittää lääke?”

Suomi on mallimaa rekisteridatan hyödyntämisessä

Suomi on rekisteridatassa Perolan mukaan maa, josta katsotaan mallia. Näin tapahtui esimerkiksi Euroopan terveysdata-avaruuden EHDS:n luomisessa. Rekisteridataa on kerätty vuosikymmeniä. Esimerkiksi syöpärekisteri pystytettiin jo 1950-luvulla.

”Meillä on laajasti dataa rekistereissä, esimerkiksi Kanta. Siinä ovat omat terveystiedot ja reseptit tallennettu. Vastaavanlaista ei ole monessa maassa. Esimerkiksi niin että kaikki laboratoriotiedot olisivat saatavissa niin kuin meillä nykyään on. Meillä on mahdollisuus saada tutkijoiden käyttöön koko populaation data eri tietojärjestelmistä tai hallintorakenteista huolimatta.”

Perola ottaa esimerkiksi yhden tutkimuksensa. Siinä selvitettiin rekisteridatan perusteella, mikä erotti Suomessa niitä ihmisiä, jotka ottivat ensimmäisen koronarokotteen niistä, jotka kieltäytyivät.

”Haluttiin löytää niitä ilmiöitä, jotka kuvaavat niitä vajaata 20% suomalaista, jotka eivät ottaneet ensimmäistä rokotetta. Tarkastelimme perhesuhteita ja sosioekonomisia muuttujia: onko palkkatyössä vai ei, asuinpaikan sijainti ja äidinkieli. Datasta pystyi tieteellisesti perustelemaan, että viesti rokotteista ei tavoittanut maahanmuuttajia ajoissa ja että oli sellaisia henkilöitä, joilla ei ollut resursseja hankkia itse tietoa rokotuksesta.”

Toinen asia, mitä tutkittiin oli RS-viruksen aiheuttamaa infektiota alle 1-vuotiailla. RS-virus (respiratory syncytial virus, RSV) on RNA-virus, joka aiheuttaa maailmanlaajuisesti miljoonia hengitystieinfektioita vuosittain. Se on erityisen merkittävä pienten lasten infektioiden aiheuttaja.

”Rekisteridatan perusteella seurattiin niitä perheitä, joiden lapsi oli RS-viruksen saatuaan joutunut sairaalaan. Tutkimuksessa löydettiin sosioekonomiseen statukseen, vanhempien päihteiden käyttöön ja lapsen synnynnäisiin ominaisuuksiin liittyvää dataa. ”

Perolan mukaan tämä oli arvokasta tietoa, joka saatiin tekoälyä käyttämällä. Koneelle syötettiin rekisteridata ja opetettiin tunnistamaan tietyt piirteet datajoukosta.

”Tätä ei voitu tehdä muilla kuin CSC:n sensitiivisen datan palveluilla ja superlaskentaympäristössä.”

Markus Perola käyttää tutkimuksissaan geeni-ja rekisteridataa.

”Infrastruktuurin merkitys on tärkeä. Tutkimus tarvitsee sellaisia organisaatioita, kuten CSC, joka mahdollistaa analyysien teon. On ihan sama onko tutkija astronomi tai geenitieteilijä: molemmat käyttävät samaa infraa. Infrastruktuurille on aina vaikea saada rahaa kun säätiöt eivät niitä rahoita vaan olettavat, että valtio maksaa. Valtio taas sanoo, että hankkikaa rahoitus ulkopuolelta. Infran tukeminen on välttämätöntä, jotta voidaan tehdä huipputiedettä Suomessa.”

Ari Turunen

25.6.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Why do some get the severe form of COVID-19?. https://doi.org/10.5281/zenodo.14810467

Lisätietoja:

CSC SD-connect

https://thl.fi/etusivuhttps://docs.csc.fi/data/sensitive-data/sd_connect/

Terveyden ja hyvinvoinnin laitos THL

https://thl.fi/fi/

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keski- tettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Terveysdataa ymmärtävä tekoälymalli varoittaa tulevista sairauksista

Yhdistämällä perimästä saatavaa tietoa eli genomitietoa kansallisissa terveydenhuollon rekistereissä olevaan dataan, voidaan kehittää tekoälymalli, jolle voidaan esittää kysymyksiä mahdollisista tulevaisuuden sairaalahoidoista. Tällaiset tilastolliset ja koneoppimisen mallit kykenevät ennustamaan sairauksien esiintymistä.

Apulaisprofessori Andrea Ganna Helsingin yliopiston Suomen molekyylilääketieteen instituutista (FIMM) on kiinnostunut geneettisen ja tilastollisen datan yhdistämisestä.

”Terveydenhuollossa voidaan hyödyntää koneoppimista, koska se oppii koko ajan valtavasta datamäärästä. Tekoälylle voidaan esittää kysymyksiä tulevaisuuden mahdollisiin sairaalahoitoihin liittyen. Tekoäly voi kertoa, mikä on elinajanennuste tai kuinka paljon reseptilääkkeet maksavat tietynlaisella elämäntyylillä ensi vuonna. ”

Ganna on hyödyntänyt suuria aineistoja tunnistaakseen demografisia ja geneettisiä tunnusmerkkejä, jotka ovat yleisten ja monitekijäisten tautien taustalla. Tekoäly voi tehdä jokaiselle henkilökohtaisen riskilaskelman, joka tehdään mallintamalla sairauksien ja lääkitysten pitkittäisseurannasta saatua dataa yhdessä geeni-, perhe- ja väestödatan kanssa.

Yksi maailman laajimpia datan toisiokäytön tutkimuksia

Ganna käyttää tutkimuksissaan erityisesti FinRekisterit-aineistoa. FinRekisterit on Terveyden ja hyvinvoinnin laitoksen (THL) ja Suomen molekyylilääketieteen instituutin yhteinen tutkimusprojekti, jonka vastuututkijana toimii tutkimusprofessori Markus Perola. Se on yksi maailman laajimpia rekisteridatan toisiokäyttöön perustuvia tutkimuksia.

”Datakokoelmassa on 7,2 miljoonaa yksilöä eli kaikki Suomen kansalaiset sekä osa jo kuolleita sukulaisia. Siinä on paljon erilaista ja monipuolista tietoa. Saatavilla on terveystietoa, tietoja perhesuhteista, sosio-ekonomista tietoa, laboratoriotuloksia ja lääkereseptejä. Tämä on todella laaja datakokoelma.”

Aineistossa on 19 eri maanlaajuista rekisteriä, kuten Syöpärekisteri, Lääkeostorekisteri ja Kanta. Kanta on rekisteri, johon kerätään terveydenhuollossa ja apteekeista saatuja asiakas- ja potilastietoja. Kokoelmassa yksinomaan lääkeostoja on rekisteröity kokoelmaan yli miljardi. Ne ovat datapisteitä eli jokainen yksittäinen fakta on datapiste. Niitä datakokoelmassa on yhteensä yli 6,5 miljardia.

”Pidän hanketta ainutlaatuisena. Data on rikasta ja monipuolista”, sanoo Ganna.

”Terveystiedon yhdistäminen sosiaaliseen ja ekonomiseen informaatioon on minulle erittäin olennaista. Monesti näitä pidetään erillisinä, mutta tietojen yhdistäminen on erittäin tärkeää terveydelle. Meidän täytyy tarkastella sosio-ekonomista tietoa ymmärtääksemme kuinka ”reiluja” tekoälymallit ovat. Emme halua tekoälymallia, joka tekisi työnsä huonoimmin väestömme kaikkein haavoittuvimmissa osissa.”

Riskiryhmään kuuluvien tunnistaminen voi edistää sairauksien ennaltaehkäisyä

Kun data on kerätty eri rekistereistä, yksilölliset tiedot salataan ja tallennetaan Suomen ELIXIR-keskuksen CSC:n sensitiivisen datan palveluihin. Ganna tutkimusryhmineen analysoi dataa tässä tietoturvallisessa ympäristössä.

”Olemme yhteistyössä CSC:n kanssa kehittäneet palveluja hyödyllisemmiksi tutkijoille. Olemme aloittaneet yksinkertaisista analyyseista kulkien kohti monimutkaisempia malleja.”

Andrea Gannan tutkimuksissa sensitiivistä dataa on valtava määrä.

”Luomme datamatriisin tekoälyä ja koneoppimisen malleja varten. Olemme myös hyvin tietoisia datan sensitiivisestä luonteesta. Emme pysty tunnistamaan yksilöitä ja käytämme erittäin kehittyneitä turvatoimia estääksemme luvattoman pääsyn dataan.”

Näitä tietoja voidaan käyttää eri tarkoituksiin.

”Saamme paremman ymmärryksen eri tautiryppäistä ja parempia ennusteita. Voimme laatia jopa digitaalista ikääntymistä kuvaavan kellon. Siinä käytetään koko väestön dataa, jotta voisimme antaa jokaiselle Suomen kansalaiselle eräänlaisen digitaalisen iän, joka perustuu terveystiedoista saadulle suuntaa-antavalle kehityskululle.”

Suunnitteilla on, että Ganna tutkimusryhmineen integroi rekisteridataa biopankeissa olevaan genomidataan. Kunnianhimoisena tavoitteena on tunnistaa yksilöissä kehittyviä sairauksia, joiden puhkeaminen voitaisiin estää. Tulevaisuudessa datan perusteella voitaisiin löytää riskiryhmään kuuluvia yksilöitä, jotka voisivat hyötyä ennaltaehkäisevistä lääkehoidoista. Andrea Gannan mukaan dataa on jo tarpeeksi, jotta tämä olisi mahdollista. Yhtenä hyvänä esimerkkinä tutkimusaineistosta Ganna mainitsee FinnGen-tutkimushankkeen, joka on tuottanut genomitietoa puolesta miljoonasta suomalaisesta. Hankkeessa on selvitetty suomalaisen väestön eri sairauksien geneettistä taustaa. Seuraavaksi on alettu selvittää, miten geenit vaikuttavat sairauksien etenemiseen.

”Biopankeissa oleviin, riskiryhmään kuuluviin ihmisiin voitaisiin olla yhteydessä. Tämä tietysti edellyttää että biopankeissa olevat ihmiset ovat antaneet kontaktointiin suostumuksensa.”

Gannan mielestä CSC:n sensitiivisen dataan liittyviä palveluita pitäisi pystyä kehittämään siihen suuntaan, että ne tukisivat erityisesti koneoppimisen malleja. Toistaiseksi tekoälymalleja on kokeiltu vain tutkimuksessa koska nykyisen lainsäädännön puitteissa ei voida automaattisesti käyttää rekisteridataa, jotta voitaisiin ottaa uudelleen yhteyttä riskiryhmään kuuluviin ihmisiin.

”Voimme laatia näitä kauniita malleja, mutta emme voi varoittaa riskiryhmäläisiä,” Ganna toteaa, mutta huomauttaa, että jos malleja yksinkertaistetaan tarpeeksi, niitä voidaan käyttää myös kliinisessä hoidossa.

Yhtenä esimerkkinä hän mainitsee RS-viruksen, jonka riskitekijöitä THL:n Markus Perola yhdessä FIMM:n Pekka Vartiaisen kanssa tutki FinRekisterit-hankkeessa. RS-virus (respiratory syncytial virus) on maailmanlaajuisesti yleisin pienten lasten hengitystieinfektioita aiheuttava virus. Tutkijat loivat yksinkertaistetun mallin, jota voitaisiin hyödyntää RSV:n kliinisessä hoidossa. Nyt Suomessa lääkärit voivat rekisteridatan perusteella tunnistaa, ketkä ovat vaarassa saada viruksen ja kenelle voisi antaa ajoissa hoitoa.

Andrea Ganna uskoo, että tulevaisuudessa terveydenhuolto hyötyy tekoälymalleista, joka ymmärtää terveysdataa.

”Tekoäly tukee päätöksentekoa auttamalla lääkäreitä paremmin tekemään yhteenvetoja heidän potilaidensa terveyden kehityskuluista. Tulevaisuus on valoisa.”

Ari Turunen

30.5.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). An AI model that understands health data warns of future diseases. https://doi.org/10.5281/zenodo.13691998

Lisätietoja:

Suomen molekyylilääketieteen instituutti (FIMM)

FIMM on osa Helsingin yliopiston HiLIFE Helsinki Institute of Life Science -tutkimuskeskusta.

https://www.helsinki.fi/en/hilife-helsinki-institute-life-science/units/fimm

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

Euroopan tutkimusyhteisö valmistautuu seuraavaan pandemiaan

BeYond-COVID-projektin (By-COVID) tavoitteena on saattaa eri Euroopan maista kerätty COVID-19 data tutkijoiden, sairaaloiden ja julkishallinnon saataville. Datan tunnistaminen, yhdistäminen eri lähteistä ja sen integroiminen analyysejä varten on iso urakka. Tähän haasteeseen on tarttunut 53 organisaatiota 19 eri maasta. Suomesta mukana on THL ja Tampereen yliopisto. Suomesta THL:ssä kerättyä dataa on käsitelty CSC:ssä.

THL:n tutkimusprofessori Markus Perolan mukaan By-COVID-projekti yksinkertaisesti valmistautuu seuraavaan pandemiaan analysoimalla COVID-19 dataa.

”Nyt pilotoidaan, miten tällaista yhteistyötä voidaan tehdä kun seuraava pandemia tulee. Tämä näyttää olleen tarpeen.”

Perolan mukaan datan harmonisaatiota todella tarvitaan Euroopan maiden kesken.

”Esimerkiksi eri maiden käsitykset, mitä pidetään COVID-tartuntaketjuissa olennaisina tekijöinä voivat poiketa paljonkin toisistaan.”

Perola käyttää lähes kaikissa tutkimuksissaan CSC:n laskentaa ja sensitiivisen datan tallennus- ja analyysipalveluja. Geneettisen aineiston lisäksi hän hyödyntää paljon rekisteriaineistoja. By-COVID-projektissa hänen tutkimusryhmänsä on hyödyntänyt suomalaisia tartuntatautirekistereitä sekä Tilastokeskuksesta saatua kuolinsyydataa. Dataa käytetään yhteisiin -analyyseihin By-COVID-projektissa. THL:n raakadata on käytettävissä CSC:n sensitiivisen datan palveluissa, mutta se ei poistu Suomen rajojen ulkopuolelle. Tämän lisäksi By-COVID-hanke kerää tietoa viruksesta itsestään. Tämä tieto on avointa tutkimusdataa.

”THL osallistuu hankkeessa yhteen työpakettiin, jossa federoidusti analysoidaan eri maista saatua rekisteridataa. Hankkeessa poimitaan tiettyjä asioita eri rekistereistä ja yhdistetään niitä ja edetään yhteiseen analyysin Euroopan laajuisesti.”

Suomesta kerätty rekisteridata pitää sisällään kaikki Suomen asukkaat, joilla on henkilötunnus.

Markus Perolan mukaan tällainen datan kerääminen ja analysoiminen on välttämätöntä tehdä. Hänen mielestään olisi jopa epäeettistä jättää käyttämättä tärkeä tieto, joka Euroopan kansalaisista kerätään.

”Miksi dataa kerätään, jos sitä ei käytetä? Tilastointi on tärkeää, mutta se ei riitä, että informaatio saadaan siirrettyä kliiniseen työhön tai yhteiskuntapoliittiseen päätöksentekoon. Tähän tarvitaan vertaisarvioitua tieteellistä tutkimusta ja sitä By-COVID tarjoaa.”

Projekti päättyy syksyllä 2024.

COVID-19- portaali

By-COVID-projektin sivuilla on saatavilla COVID-19-dataa sisältämä portaali. Hanketta koordinoi ELIXIR-infrastruktuuri, jonka jäsenorganisaatio EMBL-EBI on koonnut portaalin tärkeimmät koronaviruksen data-aineistot. Tutkijat pääsevät portaalin kautta analysoimaan COVID-19 viitedataa. Se sisältää yli 8 miljoonaa COVID-viruksen sekvenssiä.

Suomen Akatemia rahoitti Suomen ELIXIR-keskuksen CSC:n kokeilua, jossa portaalin sisältämää dataa analysoitiin ja testattiin Suomen LUMI-supertietokoneella. Työ tukee By-COVID-hanketta: CSC:n tärkeä tehtävä on edistää supertietokoneiden käyttöä dataintensiivisessä laskennassa.

Suomen ELIXIR-keskuksen johtajan Tommi Nyrösen mukaan projekti selviytyi monista teknisistä datan hallinnan haasteista

“Laskennan työvuot Euroopan bioinformattikan instituutista EMBL-EBI:stä mahdollistivat COVID-19 – virusdatan analysoimisen ja tämä työ tehtiin yhteistyössä CSC:n ja EMBL-EBI:n asiantuntijoiden kanssa.. Eurooppalaisessa superlaskennassa voimme nyt siirtää satoja tuhansia viruksen datapisteitä päivittäin laskentakeskusten välillä ja tässä apuna ovat eurooppalaiset tutkimusverkot.”

Tästä seuraa, että supertietokoneen kapasiteettia tarvitaan tulevaisuudessa analysoimaan koko dataa.

“Tätä vaaditaan nopean vastatoimen takia pandemian ollessa kyseessä ja myös COVID-19-portaalissa olevan datasta saadun tiedon päivittämiseksi.”

Ari Turunen

1.4.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). European research community preparing for next pandemic. https://doi.org/10.5281/zenodo.13691578

FIRI

Suomen Akatemia on tukenut artikkelin tuotantoa apurahalla numerolla 345591, joka on myönnetty FIRI 2021-hankkeelle ”ELIXIR European Life-Sciences Infrastructure for Biological Information”.

COVID-19 Data Portal

https://www.covid19dataportal.org

BeYond COVID

https://by-covid.org

Terveyden ja hyvinvoinnin laitos THL

https://thl.fi/fi/

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Rintasyövän hoitoennuste paranee nestebiopsian avulla

Rintasyöpäpotilaan verinäytteestä voidaan eristää syöpäsolun DNA:ta, jonka pilkkoutumisasteesta pystytään arvioimaan onko potilaalla huono tai hyvä hoitoennuste.

Rintasyöpä on naisten yleisin syöpä. Yli kaksi miljoonaa naista sairastui siihen vuonna 2020. Rintasyövän ennuste on onneksi parantunut, koska se on mahdollista havaita varhaisessa vaiheessa ja hoitomenetelmät ovat kehittyneet. Yksi tällainen on nestebiopsia, josta on tulossa yhä merkittävämpi syöpien diagnostiikan menetelmä.

Henkilökohtaisen lääketieteen ja biopankkitoiminnan professori Arto Mannermaan ryhmässä nestebiopsiaa on tutkittu vuodesta 2015 alkaen. Nestebiopsia perustuu siihen, että elimistön solut vapauttavat verenkiertoon ja ruumiinnesteisiin DNA:ta, jota kutsutaan solunulkoiseksi DNA:ksi (cell free DNA, cfDNA). Syöpäsoluista vapautuu siis potilaiden verenkiertoon DNA:ta, joka sisältää kullekin syövälle ominaisia mutaatioita. DNA sekvensoidaan, jolloin saadaan selville kasvaimessa olevat geneettiset muutokset.

”Solunulkoisesta DNA:sta olemme tutkineet sen pitoisuutta, pilkkoutumisastetta ja mutaatioita, jotka ovat yhteydessä rintasyöpäpotilaiden ennusteeseen. Vastaavanlaisia yhteyksiä löytyy myös useissa muissa syöpäsairauksissa”, sanoo tutkija Jouni Kujala. Hän työskentelee Mannermaan tutkimusryhmässä Itä-Suomen yliopistossa.

”Tämä on sellainen tutkimusaihe, jossa on ollut hyvinkin paljon laskennallista puolta, varsinkin sekvensointidatan työstämistä,” Kujala sanoo. Kujala aikoo keskittyä jatkossa solunulkoiseen mikro-RNA:han.

”Se on kokonaan toinen nukleiinihappotyyppi, mitä syöpäpotilaiden verinäytteistä voidaan eristää. Solunulkoinen mikro-RNA säätelee geenien toimintaa, eikä niiden ennusteellista arvoa vielä täysin ymmärretä.”

Solunulkoinen DNA

Mannermaan tutkimusryhmässä on tutkittu solunulkoisen DNA:n pilkkoutumista. Sen perusteella voidaan nyt arvioida rintasyöpäpotilaan hoitoennustetta. Tulos on merkittävä, sillä menetelmä auttaa tunnistamaan huonon hoitoennusteen rintasyöpäpotilaat aiempaa varhaisemmin ja tarkemmin. Varhainen tunnistus on keskeisimpiä keinoja vähentää rintasyövän kuolleisuutta.

Tutkijat ovat analysoineet solunulkoisen DNA:n eheyden syy-yhteyttä rintasyövän hoitoennusteeseen.

”Kun syöpäsolut vapauttavat solunulkoista DNA:ta verenkiertoon se alkaa pikkuhiljaa pilkkoutua pienemmäksi, kunnes se hajoaa kokonaan.”

Eheys kuvaa DNA:n pilkkoutumisastetta eli kuinka paljon DNA on veressä pilkkoutunut.

”Mitä eheämpää eli vähemmän pilkkoutunutta solunulkoinen DNA on, sitä enemmän se on yhteydessä huonoon rintasyövän ennusteeseen.”

Mannermaan ryhmän tutkimustuloksen mahdollisti mittava potilasaineisto, Kuopion rintasyöpäprojekti.

”Kuopion rintasyöpäprojekti kattaa yli 500 rintasyöpäpotilasta ja heistä on kerätty todella kattavat tiedot. Tiedämme heidän elintapansa ja heidän saamansa syöpähoidot. Meillä on seurantatiedot parhaimmillaan 25 vuoden ajalta, mikä on kansainvälisestikin poikkeuksellisen pitkä seuranta-aika.”

Tässä tutkimuksessa aineistoon oli valittu rintasyöpäpotilaita, joille ei oltu vielä aloitettu syöpähoitoja.

”Aineistossa oli varhaisen vaiheen rintasyöpäpotilaita, jotka olivat lähtökohtaisesti hyväennusteisia.”

Tällaisen aineiston valinnalle oli selkeä peruste, sillä rintasyöpä uusiutuu jopa kolmanneksella potilaista ja on naisten yleisin syöpäperäinen kuolinsyy. Mannermaan ryhmän tavoitteena on, että tulevaisuudessa aggressiivista rintasyöpää sairastavat potilaat voitaisiin tunnistaa nykyistä aikaisemmin eheysmittauksen avulla ja tarvittaessa ohjata tehostettuun hoitoon ja seurantaan.

Aineistoa tekoälyn opettamiseen

Eheyden mittaus on menetelmänä yksinkertainen. Käytännössä eristetty näyte laitetaan mittauslaitteeseen, joka määrittää näytteessä olevien DNA-pätkien suhteellisen osuuden. Sitten voidaan laskea, mikä näytteessä olevan solunulkoisen DNA:n eheysaste on.

Kujalan mukaan näinkin yksinkertainen DNA-näytteen laatua kuvaava arvo voi olla käyttökelpoinen syövän ennusteen arvioinnissa. Tätä menetelmää voidaan jatkossa hyödyntää tekoälyn opettamiseen.

”Kun mitataan solunulkoisen DNA:n pitoisuutta ja eheyttä, nehän ovat puhtaasti laatumittareita. Niitä ei nykyisellään käytetä potilaan ennusteen arvioimisessa. Varsinainen diagnostinen puoli on pitkälti keskittynyt mutaatioihin ja muihin DNA:n piirteisiin. Koneoppiminen voisi hyödyntää tätäkin dataa nykyistä tehokkaammin. Tämä data joka tapauksessa kerätään kaikista näytteistä joita tutkitaan, mutta sitä ei juurikaan hyödynnetä.”

Mannermaan ryhmässä kehitetään genomidatan ja kliinisen datan perusteella oppivia algoritmeja, jotka tunnistavat ja ennustavat rintasyövän riskitekijöitä. Genomidata ja kliininen data yhdistetään tekoälymalliksi, joka auttaa paitsi sairastumisriskin määrittämisessä, myös yksilöllisten hoitosuunnitelmien tekemisessä.

Mannermaan ryhmän tutkimuksissa käyttämän datan määrä on niin iso, että siihen tarvitaan Suomen ELIXIR-keskuksen CSC:n superlaskentakapasiteettia.

”Meillä on CSC:n resursseja käytössä nimenomaan koneoppimisen takia. Toistaiseksi olemme kehittäneet syöpäriskin analytiikkaa, mutta samoja malleja hyödynnetään näiden nestebiopsiatulosten jatkotyössä. Vielä tätä dataa ole jatkotyöstetty”, sanoo professori Arto Mannermaa.

Ari Turunen

23.1.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Improving breast cancer treatment prognoses with liquid biopsy. https://doi.org/10.5281/zenodo.13691344

Lisätietoja:

Maria Lamminaho, Jouni Kujala, Hanna Peltonen, Maria Tengström, Veli-Matti Kosma ja Arto Mannermaa. High Cell-Free DNA Integrity Is Associated with Poor Breast Cancer Survival. Cancers. 2021.

https://doi.org/10.3390/cancers13184679.

Itä-Suomen yliopisto

https://www.uef.fi/fi/

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Kasvien mikrobikumppanit kaivosjätteiden puhdistajana

Kaisa Lehosmaa tutkii arktisten mikrobien ja kasvien käyttöä teollisuuden valumavesien puhdistamisessa. Tämä voi auttaa kaivosteollisuuden aiheuttamien ympäristöhaittojen vähentämisessä. Typpi ja raskasmetallipitoista kuormitusta vesistöihin muodostuu kaivostoiminnan lisäksi jätevedenpuhdistamoilta, hulevesistä, maataloudesta ja turvetuotannosta. Mikrobien soveltuvuutta biopuhdistukseen analysoidaan pääasiassa sekvensointimenetelmillä, mutta myös eristäen mikrobeja sammalesta.

Ihmisen aiheuttamat teolliset prosessit, kuten kaivosteollisuus, ovat johtaneet siihen että maaperän ja vesistöjen typpi ja raskasmetallipitoisuudet ovat lisääntyneet. Tutkijatohtori Kaisa Lehosmaa Oulun yliopistosta tutkii professori Anna Maria Pirttilän tutkimusryhmässä sammalen sekä muiden kasvien sisällä eläviä mikrobeja ja niiden sovellettavuutta vesienpuhdistuksessa. Kasvien mikrobikumppaneiden käyttö biopuhdistuksessa on suhteellisen vähän tutkittu aihe. Joukko kasveja voi varastoida tai jopa haihduttaa haitta-aineita, kuten metalleja ja ravinteita ilmakehään. Kasvien mikrobikumppanit ovat merkittävässä roolissa ravinteiden ja metallien keräämisessä ja muunnostyössä kasvien sisällä.

Nevasirppisammal on lupaava

Lehosmaa on tutkinut erityisesti nevasirppisammalta (Warnstorfia fluitans), joka kasvaa Suomessa vähäravinteisilla soilla ja pohjavesiriippuvaisissa lähde-ekosysteemeissä. Sammalta esiintyy Pyhäjärvellä Pyhäsalmen kaivosta ympäröivillä alueilla. Pyhäsalmi on Euroopan syvin perusmetalleja louhiva kaivos. Sieltä saadaan kuparia ja sinkkiä.

”Olemme löytäneet tämän sammalen kaivosalueelta ja se on luontaisesti sopeutunut poikkeaviin olosuhteisiin. Sammalesta löytyneitä mikrobeja voidaan yhdessä sammalen kanssa käyttää kaivosteollisuuden valumavesien puhdistajana kylmissä ilmasto-olosuhteissa, ” sanoo Lehosmaa.

Kaivostoiminta muodostaa hapanta ja metallipitoista ja painovoiman ansiosta liikkuvaa suotovettä. Suotovedet ovat erittäin happamia ja sisältävät runsaasti haitallisena pidettäviä metalleja (Zn, Al, Cu, Cd). Tällaista jätevettä on käsiteltävä ja puhdistettava huolellisesti, koska sillä on kielteisiä ympäristövaikutuksia.

Lehosmaan tutkimuksissa nevasirppisammal osoittautui tehokkaaksi metallien poistajaksi myös alhaisissa lämpötiloissa. Se pystyy poistamaan myös typpeä erityisen hyvin yhdistettäessä puuhakebioreaktori-puhdistusyksikköön. Lehosmaa ja hänen kollegansa tunnistivat nevasirppisammalen mikrobikumppanit sekvensointimenetelmillä.

”Sekvensoinnilla saadaan kokonaiskuva siitä, minkälainen sammalen mikrobien monimuotoisuus on eli kuinka paljon ja minkälaisia mikrobeja siellä on.”

Haluamme myös tietää, mitkä mikrobien geenit ovat aktiivisia eri olosuhteissa, jotta ymmärtäisimme, miten mikrobeja voidaan laajemmin hyödyntää.”

Sammalen solukosta tunnistetaan sinne kertyneet metallit ja mikrobit sekvensoinnila ja perinteisillä mikrobiologisilla kasvatusmenetelmillä. Tunnistuksen jälkeen paikannetaan solukosta metallit ja mikrobit. Tunnistuksen ja paikannuksen avulla selvitetään metallipitoisiin olosuhteisiin adaptoituneet mikrobit, joita mahdollisesti voidaan hyödyntää puhdistusprosesseissa. Puhdistusprosessien tehostaminen tapahtuu lisäämällä mikrobeja sammaleeseen.

Kasvien mikrobikumppanit huonosti tunnettuja

Lehosmaa on käyttänyt tutkimuksessa Suomen ELIXIR-keskuksen CSC:n laskentaresursseja ja Chipster-ohjelmistoa mikrobiomi-aineistojen analysoinnissa.

”Sammalen mikrobiomi on aika tuntematon. Kasvien mikrobikumppanit ovat yleisesti ottaen melko huonosti tunnettuja. Olemme alustavasti amplikonisekvensoinnilla tunnistaneet niitä.”

Amplikonisekvensointi kohdentaa analyysin tietyille geenialueille, tässä tapauksessa 16S- ja ITS-ribosomaalisen RNA:n (rRNA) geenialueelle. 16S- ja ITS-rRNA-geenialueet ovat säilyneet evoluutiossa muuttumattomana miljoonia vuosia bakteereilla ja sienillä, minkä vuoksi näiden geenialueiden perusteella voidaan tunnistaa eri lajeja. 16S- ja ITS-rRNA geenialueet sekvensoidaan ja tunnistetaan julkisten tietokantojen kautta.

”Seuraava askel mikrobien tunnistamisen jälkeen on selvittää mitä ne tekevät. Meillä on jo alustavaa näyttöä siitä, että sammalen solukossa tapahtuu mielenkiintoisia prosesseja.”

Lehosmaan mukaan on tärkeää tietää, mitä sammalen sisällä tapahtuu ja miten sammalen mikrobit pystyvät käsittelemään metalleja.

”Happamassa vedessä on yleensä metalleja liukoisessa muodossa. Mikrobien avulla ei voida välttämättä poistaa metalleja vedestä, koska ne ovat epäorgaanisia yhdisteitä. Voimme kuitenkin mikrobien avulla muuttaa metallien liukoisuutta. Usein biopuhdistuksessa käytetäänkin eläviä mikrobeja saostamaan metalleja partikkelimuotoon, jolloin ne ovat helpommin hallittavissa ja poistettavissa.”

Olennaista on, että löydettyjä mikrobeja pystyy kasvattamaan myös laboratoriossa.

”Mehän emme voi hyödyntää potentiaalisia mikrobeja, jos emme voi kasvattaa ja täten jatkojalostaa ja lisätä niitä saman tai eri kasvilajin edustajiin,” sanoo Lehosmaa ja tarkoittaa tällä, että potentiaalisilla mikrobikumppaneilla voi tehostaa biopuhdistusta. Mikrobikumppanit auttavat kasveja selviytymään haastavissa biologisissa olosuhteissa.

Sammalen lisäksi eräs tehokas biopuhdistukseen käytetty kasvi on järviruoko. Sammalen tavoin se sitoo tehokkaasti itseensä haitta-aineita. Järviruoko tuottaa paljon biomassaa ja lähtee helposti kasvamaan. Juurakossa elävät levät sitovat maaperän rakenteita ja estävät sinileväkukintoja. Järviruokoa hyödynnetäänkin metallien talteenotossa (phytomining). Yhdessä Lehosmaan tutkimuksessa kartoitettiin Pyhäsalmen kaivoksen kupari- ja sinkkipäästöjen kertymistä järviruokoon.

Seuraavaksi tavoitteena on tutkia ja optimoida pohjoisiin olosuhteisiin sopeutuneiden muiden luonnonkasvien, sienten ja bakteerien kykyä pidättää vedestä typpeä ja raskasmetalleja.

”Koska löydettyjä mikrobeja voidaan kasvattaa ja lisätä, niin nyt tarkoitus on laajentaa muihin sammaliin. On hyvä selvittää pystyvätkö mikrobit toimimaan yhtä hyvin muissa kasveissa kuin nevasirppisammalessa.”

Ari Turunen

31.10.2023

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2023). Purifying mining wastewater with plant-associated microbes. https://doi.org/10.5281/zenodo.13690962

Lisätietoja:

Oulun yliopisto

www.oulu.fi

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

Dataa eri lähteistä yhdistämällä saadaan yksilöllisiä hoitoja

Itä-Suomen yliopiston Bioinformatiikan keskuksessa kehitetään Virpi Aholan johdolla biolääketieteellisen ja multimodaalisen datan analysoimiseen uusia sovelluksia. Näitä voidaan hyödyntää syöpien, metabolisten, sydän- ja verisuonisairauksien sekä hermostoa rappeuttavien sairauksien tutkimisessa.

Aholalla on pitkä ura bioinformatiikasta. Hän oli mukana professori Ilkka Hanskin metapopulaatiobiologian tutkimusryhmässä, jossa sekvensointiin täpläverkkoperhosen koko genomi. Se oli ensimmäinen Suomessa tehty referenssigenomi. Karolinska Institutissa Hong Kongissa hän analysoi geenien toimintaa eri taudeilla yhden solun tasolla ja tutki sen avulla, miten kantasoluja käyttämällä voidaan kehittää uusia lääkkeitä ja hoitoja. Nyt hän johtaa Bioinformatiikkakeskusta.

Bioinformatiikakeskuksessa yhdistellään erilaisia omiikka-datoja (genomiiikka, proteomiikka, transkriptomiikka) kliiniseen dataan ja jatkossa mahdollisesti myös kuvantamisdataan.

”Tavallisten omiikka-analyysien lisäksi tehdään eri tutkimusryhmille multimodaalista data-analyysiä. Siinä yhdistetään erityyppisten datojen analyysi ja pyritään siihen, että saadaan enemmän tietoa kuin erikseen analysoimalla.”

Multimodaalisen datan analyysitapa vaihtelee sen mukaan, onko erityypiset datat kerätty samasta potilaasta vai ovat ne peräisin eri potilaista.

Omiikka on tutkimustapa, jolla pyritään analysoimaan tutkimuskohteen kaikkia geneettisesti määräytyviä muuttujia samanaikaisesti. Kun genomiikassa analysoidaan geneettistä muuntelua ja geenien toimintaa, proteomiikassa keskitytään proteiineihin ja epigenetiikassa geenien toiminnan säätelyyn ja perinnöllisen tiedon tallentumiseen ilman DNA-sekvenssin muutoksia. Metabolomiikassa analysoidaan sairauden, ruokavalion tai lääkityksen aiheuttamia muutoksia aineenvaihdunnassa.

”Kehitämme bioinformatiikkapalveluja yhteistyössä biolääketieteen asiantuntijoiden kanssa. Yksi painopiste Itä-Suomen yliopistossa on keskeisten kroonisten kansansairauksien molekulaarisen taustan selvittämisessä sekä niiden ehkäisyn ja hoidon kehittämisessä”, sanoo Ahola.

Niveltävä lääketiede tarjoaa yksilöllisen hoidon

Translationaalinen eli niveltävä lääketiede hyödyntää perustutkimusta kliinisessä tutkimuksessa ja toisaalta potilasnäytteitä ja tautimalleja tautimekanismien ja lääkevaikutuskohteiden selvittämisessä. Lähtökohtana on poikkitieteellisyys, joka auttaa tutkimuksen ohella myös potilaita.

”Translationaalisen lääketieteen tulemista hidastaa se, että ei kerta kaikkiaan tiedetä tarpeeksi. Monen eri datalähteen yhdistämisen lähtökohta on, että saataisiin enemmän tietoa esille. Yhdistäminen on hyvin paljon laskennallista ja siihen tarvitaan CSC:n resursseja ja ELIXIRin tapaisia infrastruktuureja.”

Yhtenä esimerkkinä Ahola mainitsee yksisolutekniikat.

Transkriptiossa DNA:ssa olevaa geneettistä koodia kopioituu RNA:ksi. Transkriptio on proteiinisynteesin ensimmäinen vaihe. Transkriptomiikan avulla saadaan tarkkaa tietoa yksittäisen solun geenien ilmenemisestä juuri tietyllä hetkellä.

”Yksisolutranskriptomiikan käyttö on vielä kallista. Avoimen tieteen periaatteet ovat olemassa ja sen vuoksi kaikki data pitää jakaa, kun se julkaistaan. Tällöin dataa voi uudelleen käyttää ja eri datalähteitä yhdistellä.”

Haasteena on kuitenkin, että dataa on tuotettu erilaisilla teknologioilla.

”Eri datalähteissä voi solujen määrä vaihdella tai niissä voi olla eri solutyyppejä. Minkälaisia menetelmiä pitäisi tällöin käyttää erilaisten datojen yhdistämiseen? Jos tämä voitaisiin ratkaista, silloin voitaisiin tehokkaammin tutkia potilaan solujen kehitystä ja niiden erikoistumista.”

Laskennalliset menetelmät ison datan käsittelyssä on haaste jatko-opiskelijoille

Aholan tavoitteena on avustaa enemmän laskennallisten menetelmien käytössä. Itä-Suomen yliopiston Bioinformatiikan keskus tarjoaa tutkijoille laskentakapasiteettia ja auttaa tutkijoita esikäsittelemään ja analysoimaan dataa sekä avustamaan erilaisten laskennallisten menetelmien ja ohjelmistojen käytössä ja asentamisessa.

”Jos samassa ryhmässä tai yhteistyökumppanina ei ole bioinformaatikkoja, tutkijoiden oletetaan hallitsevan myös laskennalliset menetelmät ja ison datan käsittelyn.”

Ahola myöntää, että vaatimukset ovat kovat esimerkiksi jatko-opiskelijoille.

Itä-Suomen yliopistossa on tähän haasteeseen on tartuttu perustamalla laskennallisen biolääketieteen suuntautumisvaihtoehto.

”Yksi esimerkki datan uudelleenkäsittelyn haasteista ovat suomalaiset biopankit, joihin on tallennettu yli puolen miljoonan suomalaisen genomit. Ei ole ihan yksinkertainen juttu käydä biopankeissa analysoimassa dataa, koska sitä on ihan järjetön määrä.”

Ahola viittaa FinnGen -tutkimushankkeeseen, joka käynnistyi syksyllä 2017. Sen päätavoitteena on lisätä ymmärrystä sairauksien syistä ja edistää niiden diagnosointia, ennaltaehkäisyä ja hoitojen kehittämistä. FinnGen -tutkimuksessa hyödynnetään suomalaisten biopankkien keräämiä näytteitä. Kesäkuuhun 2023 mennessä FinnGen -tutkimukselle saatiin kerättyä yli 553 000 näytettä. Tutkimushankkeen ensimmäisen vaiheen kesto oli kuusi vuotta. Vastaavan kokoluokan tutkimushankkeita on maailmassa vain muutama.

Tutkimushankkeissa genomidata yhdistetään kansallisissa terveydenhuollon rekistereissä oleviin aineistoihin. Suomessa onkin harvinaisen hyvät edellytykset koko väestön kattavalle geenitutkimukselle.

Kliininen data pitkittäistutkimuksista yhdistettynä geenidataan tarjoaa paljon mahdollisuuksia. Mutta dataa pitää olla paljon.

”Datakokoelmia tarvitaan, koska yksikään tutkija ei voi kerätä 10 tai 100 tuhannen yksilön aineistoa. Jos aineisto on pienempi sillä ei välttämättä saada luotettavaa tietoa geneettisesti kompleksisten tautien tutkimiseen ”

Itä-Suomen yliopistossa on monia eri datalähteitä hyödyntäviä tutkimushankkeita. Itä-Suomen yliopiston ja Kuopion yliopistollisen sairaalan Alzheimerin tautia käsittelevässä hankkeessa yhdistetään potilaskäynneillä kerätty kliininen data FinnGen -aineistoon. Näin tutkijat pyrkivät selvittämään Alzheimerin taudin puhkeamiseen johtavia biologisia mekanismeja.

”FinnGenin biopankki on ainutlaatuinen resurssi, jota voitaisiin kuitenkin hyödyntää tutkimuksessa mahdollisesti vielä paljon enemmän”, sanoo Ahola.

”Toinen esimerkki Alzheimerin taudin tutkimuksesta on Rappta Therapeutics:in ja Itä-Suomen yliopiston professoreiden Mikko Hiltusen ja Annakaisa Haapasalon projekti, jossa tutkitaan transgeenisten solulinjojen avulla eri Alzheimerin hoitojen vaikutusta proteiinien toimintaan.”

Yksi mielenkiintoinen yhteistyöprojekti on akatemiatutkija Kirsi Ketolan kanssa.

Siinä tutkitaan eturauhassyövän hoitoon käytettyä karboplatiini-resistenssiä. Karboplatiini tuottaa ”DNA-ristilinkkejä”, mikä johtaa DNA:n korjausmekanismin aktivoitumiseen ja resistenssiin, jolloin syöpäsolut kykenevät taas jakautumaan. Tutkimukseen käytetään yksisolutekniikoita, jossa yksittäisen solun tasolla pystytään mittaamaan sekä geenien ilmentymistä että kromatiinin muutoksia.”

Kromosomit sijaitsevat tumassa pitkinä kromatiini-rihmoina.

Virpi Aholan mukaan hyvä datankäsittely ja sen taitava yhdistäminen voisi mahdollistaa yksilöllisen hoidon.

”Potilaille voitaisiin räätälöidä paremmin olemassa olevilla lääkkeillä tehtyjä hoitosuunnitelmia”.

Itä-Suomen yliopiston Bioinformatiikkakeskuksen tutkimuspalvelut.

Datan uudelleenkäyttö vaatii osaamista

Ahola kannattaa vahvasti datan avoimuutta ja uudelleenkäyttöä sekä sellaisen menetelmien ja infrastruktuurien luomista, joka helpottaa ja kannustaa tähän. Yhtenä esimerkkinä hän mainitsee EGA:n. European Genome-phenome Archive (EGA) on data-arkisto, jossa voi jakaa ja lupaa vastaan on mahdollista saada käyttöönsä jo julkaistuja biolääketieteellisiä datoja.

”Arkisto sisältää ihmisen genomista dataa, joka on yhdistetty kliiniseen ja muuhun metadataan. Koska periaatteessa henkilö voi olla mahdollista genomisen ja fenotyypin perusteella identifioida, datan jakamien on tarkkaan säädeltyä.”

Aholan mukaan EGA:n avulla datan jakaminen on hoidettu asianmukaisella tavalla ja näin arvokasta biolääketeteen tutkimusaineistoa on mahdollista käyttää uudelleen, kuten uusien tutkimushypoteesien luomiseen tai testaamiseen.

”Olemassa olevia aineistoja voidaan myös katsoa eri näkökulmasta. Esimerkiksi potilaita voidaan valita eri kriteereillä kuin jo julkaistussa tutkimuksessa tai aineistoja voidaan käyttää osana laajempaa datakokoelmaa.”

Aholan mukaan yhdessä pitäisi tehdä enemmän ja viittaa Biokeskus Suomeen, joka yhdistää seitsemän eri Suomen yliopiston biokeskusta. Yhteistyötä pitäisi pystyä lisäämään eri biokeskusten välillä ja yli valtakunnan rajojen esimerkiksi Suomen ELIXIR-keskus CSC:n avulla.

”ELIXIR on meille väylä verkostoitua ja oppia muiden bioinformatiikkakeskuksien kokemuksista sekä olla mukana niissä pöydissä, jossa tutkimusinfrastruktuuriin liittyvistä asioista keskustellaan ja uusia aloitteita tehdään.”

Koska uudet teknologiat tuottavat isoja ja kompleksisia data-aineistoja, tutkimusinfrastruktuureilta edellytetään muutakin kuin vain tutkimuslaitteistoja.

”Jotta aineistoja voitaisiin tehokkaasti hyödyntää, pelkkä esimerkiksi CSC:n tarjoama laskentakapasiteetti ei riitä vaan datojen käsittelyyn ja uudelleenkäyttöön tarvitaan niihin perehtynyttä henkilökuntaa. Näen, että biokeskusten parempi resursointi ja systemaattinen yhteistyö voisi olennaisesti helpottaa ja parantaa isojen genomisten datojen käsittelyä, yhdistämistä ja uudelleenkäyttöä.”

Ari Turunen

1.9.2023

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Improving breast cancer treatment prognoses with liquid biopsy. https://doi.org/10.5281/zenodo.13691344

Lisätietoja:

Bioinformatiikkakeskus, Itä-Suomen yliopisto

https://uefconnect.uef.fi/tutkimusryhma/bioinformatiikkakeskus/

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

https://www.elixir-finland.org

Yksittäisen solun sekvensointitekniikka mahdollistaa sairauksien yksilöllisen hoidon

Mullistava yksittäisten solujen RNA-sekvensointi (scRNA-seq) mittaa kaikkien geenien aktiivisuudet jokaisessa solussa erikseen, jolloin saadaan aiempaa tarkempi kuva solujen eroavaisuuksista. Tämä tekniikka tuo valtavasti uutta tietoa sairauksista, kuten syövästä. Syöpäsoluja on kasvaimessa miljoonia. Datan analysointi vaatii yhä enemmän laskentakapasiteettia ja tehokkaita algoritmeja, kun analysoitavien solujen ja yhdistettävien näytteiden määrät kasvavat.

RNA kuljettaa solussa valmistusohjeet DNA:sta proteiineihin. RNA vaikuttaa geenien ilmentymiseen, siis geeniä vastaavan proteiinin tuottamiseen. Yksisolutekniikalla pystytään mittaamaan kaikkien geenien RNA-tasot jokaisesta solusta erikseen. Yhdestä potilaan kudosnäytteestä voidaan nykytekniikoilla profiloida tuhansia, jopa kymmeniä tuhansia soluja. Näytteestä voidaan luotettavasti profiloida, minkä tyyppisiä soluja se sisältää.

”Vaikka solut näyttäisivät mikroskoopin alla samanlaisilta, niiden tehtävä voi tarkentua täysin erilaiseksi, kun päästään katsomaan geenien ilmentymistä yhden solun tarkkuudella”, sanoo tutkija Päivi Saavalainen.

Saavalainen työskentelee Folkhälsanin tutkimuskeskuksessa ja hän on myös yksisolutekniikkaan erikoistuneen yrityksen SCellexin toimitusjohtaja. Saavalainen, joka on yhdessä Suomen ELIXIR-keskus CSC:n kanssa järjestänyt yksisoluanalytiikan kursseja tutkijoille, pitää yksisolutekniikkaa yhtenä mullistavimmista menetelmistä biotieteissä viimeisten vuosien aikana.

”Esimerkiksi syöpätutkimuksessa on tärkeää saada dataa yhden solun tarkkuudella. Syöpäsolut nimittäin muuttuvat koko ajan, jolloin jokainen solu alkaa olla erilainen. On myös geenimutaatioita, joiden seurauksena tietyt geenit käynnistyvät ja tiettyjen toiminta lakkaa.”

Saavalaisen mielestä yksisoluresoluutio on tärkeä myös terveiden kudosten tutkimisessa, koska voidaan selvittää minkälaisia solutyyppejä kudoksista löytyy.

”Pelkästään perustutkimukseen yksisoluresoluutio on tuonut valtavasti uutta tietoa. Pitkään luultiin, että ihmisellä on noin 200 erilaista solutyyppiä, mutta yksisoluanalyysien avulla niitä on nyt tunnistettu jo yli 500.”

Uutta tietoa syöpäsoluista

SCellexin kehittämän uuden tekniikan avulla kudosten rakenteesta voidaan määrittää, millaisia syöpäsoluja kasvaimessa on ja onko esimerkiksi mutaatio vaikuttanut vain tietyssä osassa kasvainta.

”Nyt saadaan tarkasti selville, onko kasvaimessa esimerkiksi jollekin lääkkeelle resistenttejä syöpäsoluja ja millaisia ne ovat”, sanoo Saavalainen.

Saavalaisen mukaan myös syövän immuuniterapiat ovat kehittyneet huimasti. Niissä autetaan elimistön omia immuunisoluja, T-soluja, tunnistamaan ja tappamaan syöpäsolut. T-solut ovat lymfosyyttien eli imusolujen toinen päätyyppi B-solujen kanssa. Ne tunnistavat vieraita rakenteita ja auttavat tuhoamaan viruksen infektoimia soluja sekä syöpäsoluja, joissa mutaatiot ovat muuttaneet omaa perimää ja siten proteiineja.

”Syöpäsolut yrittävät karata T-soluilta. Ne pitävät muuttuneita rakenteitansa piilossa tai erittävät sytokiinejä, jotka hiljentävät T-solut. Lääkkeillä yritetään saada aikaan, että T-solut pääsisivät tunkeutumaan kudokseen, tunnistaisivat aggressiivisesti syöpäsolut ja tappaisivat ne. Nyt voidaan esimerkiksi selvittää, mitä T-solun vieressä oleva syöpäsolu tekee. Tuottaako se jotakin T-solua hiljentävää geenituotetta ja miten T-solu käyttäytyy?”

Saavalaisen mukaan parhaimmassa tapauksessa ymmärretään eri potilaiden syöpäsolutyypit ja löydetään tehokas lääke, jolle potilas saa hyvän vasteen. Voidaan siis löytää keinoja yksilölliseen hoitoon.

Syöpäsolujen paikka kudosleikkeessä selvitetään koneälymallin avulla.

Spatiaalinen sekvensointi paikallistaa solujen sijainnin

Yksisoluanalytiikkaa tehdään yleensä niin, että solut hellävaroen erotellaan kudoksesta ja siirretään yksittäisinä soluina liuokseen, jonka jälkeen niiden sisältämä RNA sekvensoidaan kustakin erikseen. Tällöin kuitenkin solujen alkuperäinen sijainti ja järjestys kudoksessa vääjäämättä muuttuu eli ei tiedetä, mitkä solut olivat alun perin kudoksessa vierekkäin. Nyt ovat tulleet avuksi uudet ns. spatiaaliset tekniikat, joiden ansiosta soluja ei tarvitse enää erotella yksittäisiksi liuoksiksi vaan kudoksesta höylätään ohuita yhden solun paksuisia kerroksia ja kudosleikkeestä otetaan suoraan RNA:ta irti. Kun RNA:t sekvensoidaan, tiedetään, mistä solusta ja mistä kohtaa kudoksesta RNA on saatu.

”Kudosta voidaan siis sekvensoida siten, että solujen paikka tiedetään ja niiden alkuperäinen järjestys säilyy. Spatiaalinen sekvensointi on tämän hetken kuuma juttu”, sanoo Saavalainen.

SCellex kehittää patentoitua tekniikkaa, joissa solujen paikka selvitetään koneoppimisen malleilla ja mikroskooppisen pienillä värikuulilla. Kuulat ladataan analyysisirun 160 000 pieneen kuoppaan ja niiden sattumanvaraisista yhdistelmistä saadaan kuopille visuaalinen koordinaatti, joka voidaan mikroskooppikuvista laskea koneälymallin avulla. Mikrokuuliin kiinnitetyt synteettiset DNA-koodit yhdistetään sirulle asetetuista kudosleikkeistä vapautuviin RNA-molekyyleihin, jotka siten saavat kuopan koordinaatin.

Mikroskooppikuvien analysoimiseen käytetty koneoppimismalli on kehitetty suomalaisella Aiforia Technologies ohjelmistolla.

”Meillä on käytössä koneälymalli, joka laskee automaattisesti kaikista sirussa olevista ”kuopista” mitä kuulia siellä on. Koneäly tuottaa siis kartan. Sen jälkeen siruun voidaan liittää varsinainen kudosleike, jonka jälkeen värikuuliin liimatut synteettiset DNA-pätkät nappaavat kudoksesta RNA:n. RNA-molekyylit tarttuvat näihin pätkiin ja saadaan tunniste.”

”Kun RNA:t sekvensoidaan isona joukkona, niin datasta voidaan analysoida mihin värikuulayhdistelmään RNA sopii ja verrata sitten alkuperäiseen mikroskooppikuvaan ja koneälylaskelmaan. Näin saadaan järjestettyä RNA-data oikealle paikalleen”, sanoo Saavalainen.

Datasetit ovat valtavan isoja ja laskentaan tarvitaan Suomen ELIXIR-keskuksen CSC:n palveluja. Saavalaisen mukaan koneoppimisen mallit ovat ensiarvoisen tärkeitä.

”Jos näytteessä on kymmeniä tuhansia soluja ja kaikista niistä on kymmenien tuhansien geenien mittaustulokset, niin mikrokuulien lisäksi itse biologinen RNA-data on valtavan monimutkaista. Sen analysoimiseen tarvitaan koneälyä. Koneäly voi löytää sellaista uutta informaatiota, mikä ei onnistu perinteisillä analyysityökaluilla. Luulen, että CSC:n laskentakapasiteetti riittää meidänkin haasteellisten koneälymallien ratkaisemiseen.”

Saavalaisen mukaan yksisolumenetelmä ei ole vielä tarpeeksi kypsä siihen, että sitä voitaisiin käyttää diagnostiikkaan tai lääkehoitojen määräämiseen. Tällä hetkellä se on kuitenkin hyvä työkalu tutkimukseen.

Ari Turunen

16.5.2023

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Päivi Saavalainen, & Tommi Nyrönen. (2023). Single-cell RNA sequencing enabling individual disease treatment. https://doi.org/10.5281/zenodo.8181234

Lisätietoja

SCellex

www.scellex.com

Folkhälsan

www.folkhalsan.fi/fi/

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

https://www.elixir-finland.org

Sensitiivisen datan palvelut tutkimukselle: muutamalla klikkauksella tutkija voi käynnistää turvallisen ja henkilökohtaisen laskentaympäristön

Francesca Morello työskentelee CSC:n sensitiivisen datan palveluiden yhteyshenkilönä. Morello ja hänen kollegansa kehittävät työkaluja ja palveluja sensitiivisen datan analysoimiseen, jakamiseen ja julkaisemiseen. CSC myös ylläpitää Suomen osuutta federoidusta EGA:sta (European Genome-phenome Archive), joka on hajautettu palvelu arkaluonteisten biolääketieteellisten tietojen tallentamista ja jakamista varten.

SD Connect on palvelu, jolla voi kerätä ja tallentaa sensitiivistä tutkimusdataa tutkimusprojektin aktiivivaiheessa. SD Desktopin käyttäjät pääsevät suoraan hallinnoimaan dataansa virtuaalikoneympäristössä. Palveluihin pääsee web-käyttöliittymän kautta käyttäjän omalta tietokoneelta.

”Kun käyttäjä on lähettänyt sensitiivisen datansa CSC:hen, data aina salataan, kun se tallennetaan, siirretään ja prosessoidaan palveluissamme. Salaus puretaan vain, kun data annetaan saataville valtuutetuille käyttäjille SD-palvelussa”, Morello sanoo.

Tätä pilvilaskentaympäristöä on helppo käyttää. Morello on hyvin innostunut siitä, että pääsy työympäristöön ei edellytä erityistä teknistä osaamista.

”Tutkijat pääsevät työtilaan muutamalla klikkauksella. Vaikka SD-palvelut sopivat minkä tahansa tutkimusalan sensitiivisen datan hallinnoimiseen, työskentelemme paraikaa mahdollistaaksemme palveluiden jatkokäytön alkaen täysin automatisoidusta datan salauksesta aina laskentaympäristön kustomoinnin virtaviivaistamiseen.”

Palvelut ovat käytettävissä tutkijoille ja opiskelijoille, jotka ovat kytköksissä suomalaisiin akateemisiin organisaatioihin, tutkimusinstituutteihin ja näiden kansainvälisille yhteistyökumppaneille. CSC:n palveluiden käyttäminen edellyttää rekisteröitymistä CSC:n asiakastilille. Vaikka SD Connect ja SD Desktop on suunniteltu mahdollistamaan yhteistyö eri organisaatioiden välillä, data on aina tallennettu CSC:n pilvipalveluihin Suomessa.

Ihmisperäinen sensitiivinen data ja organoidit

Oulun yliopiston kehitysbiologian professori Seppo Vainio tutkii organoideja. Organoidi on yksinkertainen ja pieni versio elimestä, jonka on kasvatettu kantasoluista. Organoidien tutkimukseen liittyy paljon sensitiivisen datan käsittelyä.

”Organoidit mallittavat joko normaalia tai sairauden elintoimintoihin liittyviä solu ja molekyylitason muutoksia. Oleellista on, että tutkijat ovat kehittäneet keinoja tuottaa myös ihmisistä monikykyisiä soluja, jota voidaan sitten kehitysbiologisin signaalein ohjata erilaisiin kehityssuuntiin. Meillä on siis keinot ja reseptit ohjata solut muodostamaan vaikka munuaisen normaalia syntyä mallintavia organoideja. Voimme mallintaa elinten kuten munuaisen kehitystä. Niin ikään meillä on keinot luoda samanlaisia geneettisiä muutoksia ihmisen alkion kantasoluissa, joita havaitaan ihmisen perimässä.”

Organoidien tutkimus on yksi tieteellinen megatrandi, mutta siihen liittyy paljon sensitiivisen datan käsittelyä.

Seppo Vainion mukaan organoiditutkimus on yksi tieteellinen megatrendi. Nyt on mahdollista mallintaa ihmisen sairauden prosesseja uudella tavalla. Kun useita organoideja yhdistetään, voidaan tutkia myös kudosten ja elinaiheiden vuorovaikutuksia kokeellisesti ihmisessä. Organoidien avulla voidaan tutkia ihmisen sairauksia ja kehittää uusia lääkkeitä ja hoitoja.

”Meillä on ihmisen kantasolukirjastoja Euroopassa. Voimme periaatteessa tehdä jokaisesta ihmisestä oman kantasoluvaraston biopankkiin. Tästä voisimme tuottaa tarpeen mukaan henkilöstä terveyden ja sairauden tutkimukseen henkilökohtaisen sairausmallin.”

Kun tavoite on pyrkiä henkilökohtaiseen terveysteknologiaan ja tietoon, niin kantasolu- tai solubiopankki tarjoaa Vainion mukaan realistiset keinot seurata miten sairaudet kehittyvät. Kaikki tämä edellyttää tutkimusinvestointeja. Vainio toivoo, että Suomen biopankkijärjestelmää voitaisiin kehittää tähän suuntaan.

Yksi kiinnostava kohde ovat iPS-solut. Ihmisen alkion kantasoluja opittiin kasvattamaan 1990-luvun lopulla ja niitä läheisesti muistuttavat indusoidut pluripotentit kantasolut eli iPS-solut kuvattiin vuonna 2007. Näitä iPS-solulinjoja voidaan tuottaa muun muassa potilaan iho- tai verisoluista ja ne voidaan ohjata erilaistumaan haluttuun suuntaan.

”Koska iPS-solut ovat peräisin yksilöistä, hankkeisiin liittyy myös paljon arkaluontoisen potilasaineiston käsittelyä. Tavoite on pyrkiä linkittämään organoideissa tehdyt havainnot yhä paremmin potilasrekisteritietoihin. Tässä kokonaisuudessa sosiaali- ja terveysalan tietolupaviranomainen Findata tarjoaa keinot Suomen runsaslukuisen rekisteritietojärjestelmän hyödyntämiseen. ”

Esimerkiksi FinnGen-tutkimuksen tavoitteena on sairausmekanismien parempi ymmärtäminen ja uusien hoitokeinojen kehittäminen yhdistämällä genomi- ja terveystietoa. Se tarjoaa yli 500 000 suomalaisen geneettisen tiedon. Tieto palautuu sopimuksen mukaan suomalaisiin biopankkeihin, josta geenitieto on vapaasti tutkijoiden käytössä. FinnGen on tunnistanut monia uusia sairauksiin liittyviä geenivariantteja.

”Tutkijat ovat mallintaneet kokeellisesti organoideissa identifioituja variantteja tutkiakseen tarkemmin sairauksiin assosioituneita geenitason muutoksia eli patogeneesiä. Kun tämä tutkimus liitetään sitten jatkossa erilaisten ns. kemikaalikirjastojen ja biomerkkien avulla tehtävään, automaatioon perustuvaan lääkeseulontaan, tämä prosessi luo perustan kiihdyttää organoidien avulla uusien hoitokeinojen kehittämistä.”

Tutkimusorganisaatiot kontrolloivat dataa

Sensitiivisen datan piiriin kuuluvat ihmisistä kerätty data, ekologinen data tai luottamuksellinen data. Henkilötietojen käsittelyä säätelee Euroopan yleinen tietosuoja-asetus GDPR (European General Data Protection Regulation).

”Rekisterinpitäjä on organisaatio tai laillinen edustaja, joka vastaa kaikista päätöksistä, miten dataa käytetään. SD-palvelujen avulla pyrimme tarjoamaan tutkijoille ja heidän organisaatioilleen kaikki työkalut, joilla dataa pääsee hallinnoimaan, kun sitä kerätään, analysoidaan ja käytetään uudelleen,” sanoo Francesca Morello.

Terveys- ja rekisteridatan käsittelyä toisiokäyttöön on tiukasti säädelty kansallisella lainsäädännöllä. SD Desktop on sertifioitu toisiokäytön ympäristö, jonka Suomen sosiaali- ja terveystietojen lupaviranomainen Findata on tarkastanut sääntelyään vastaavaksi. Tässä tapauksessa Findata ja CSC Helpdesk hallinnoivat pääsyä tietoihin ja tiedonsiirtoja.

Morellon mukaan nämä palvelut on suunniteltu siten, että ne tarjoavat tutkijoille ja rekisterinpitäjille kaikki välineet pitää datansa turvassa, mutta palvelut pysyvät joustavina ja helppokäyttöisinä.

Data tallennetaan CSC:n Allas– ja ePouta– alustoille. Metadata voidaan lähettää Suomen ulkopuolelle.

Sopiva erityisesti biolääketieteen tutkijoille

Sekvensointi, tallentaminen ja geenisekvenssien käsittely on aikaa vievä prosessi. Ensimmäisessä vaiheessa DNA-sekvenssit voidaan lähettää sekvensointilaitteistolta SD Connect-palvelun kautta suoraan tutkijan työtilaan. Täällä salattu data voidaan helposti jakaa muille tutkijoille URL-osoitteen avulla. Kun datan keräämisen vaihe on ohi, tutkivat voivat luoda virtuaalikoneen SD Desktopilla ja analysoida SD Connect-palveluun tallennettua dataa striimauksen kautta. He voivat myös, jos esimerkiksi halutaan analysoida dataa yhdessä, myöntää pääsyn yhteistyökumppaneille muista organisaatoista vain lukuoikeuksilla.

Kun tutkijat ovat laatineet tulokset geenianalyyseistaan, he voivat julkaista datan valvottua pääsyä pitkin käyttämällä Suomen federoitua EGA-palvelua. Tällöin data-aineistolle myönnetään pysyvä tunniste ja datan uusiokäytön mahdollisuudesta ilmoitetaan kansainvälisesti EGA:ssa. Data pysyy Suomessa, kun taas luvan saaneet tutkijat pääsevät dataan SD Desktop-palvelun datastriimauksen kautta. Vain yksi kopio data-aineistosta lähetetään CSC:hen ja sitä käytetään tutkimuksen kaikissa eri vaiheissa. Federoitu EGA yhdessä täysin yhteensopivan amerikkalaisen virkaveljensä dbGAP:n kanssa ovat ensisijaiset globaalit resurssit, jotka mahdollistavat pääsyn sensitiivisen ihmisperäiseen biolääketieteelliseen dataan, joka on hyväksytty tutkimuskäyttöön.

Ari Turunen

19.12.2022

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Francesca Morello, & Tommi Nyrönen. (2022). Sensitive Data (SD) services for Research: with a few clicks a researcher can launch a personal secure computing environment. https://doi.org/10.5281/zenodo.8154610

Lisätietoja:

Oulun yliopisto

www.oulu.fi/

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

My CSC portal

https://my.csc.fi/welcome

SD Connect

https://sd-connect.csc.fi

SD Desktop

https://research.csc.fi/-/sd-desktop

Federoitu EGA

https://research.csc.fi/-/fega

Uudelleenkäytettävää, oikein kuvattua ja laadukasta dataa – tutkijayhteisön luomia työkaluja ketterään datanhallintaan

Huolellinen datanhallinta mahdollistaa laadukkaan tutkimuksen nyt ja tulevaisuudessa. Sen hallinnalle on luotu ns. FAIR-periaatteet eli data on löydettävissä, se on saatavissa, se on yhdistettävissä muihin vastaaviin datakokonaisuuksiin ja sitä voidaan käyttää uudestaan. Näiden periaatteiden pohjalta ELIXIR-infrastruktuuri tarjoaa käyttöön hyviä datanhallintatyökaluja, jotka tukevat tutkijaa datanhallinnan eri vaiheissa.

“Hyvään tieteelliseen käytäntöön kuuluu varmistaa datan säilyminen käyttökuntoisena ja hyvin dokumentoituna koko tutkimusprosessin ajan ja siten, että tutkimustulokset ovat todennettavissa tutkimusprosessin jälkeenkin. On tärkeää, että tutkijat ja tietojärjestelmät voivat löytää ja saada käyttöönsä yhteentoimivia ja uudelleenkäytettäviä tutkimusaineistoja. Tämän edistämiseksi vuonna 2016 julkaistiin FAIR-periaatteet”, sanoo CSC:n datanhallinnan asiantuntija Minna Ahokas.

”ELIXIRin tarjoamien ohjeiden ja työkalujen avulla tutkijan on helpompi tehdä datansa löydettäväksi, saavutettavaksi, yhteentoimivaksi ja uudelleenkäytettäväksi ja samalla noudattaa datanhallinnassaan FAIR-periaatteita.”

Yhteistyössä eri jäsenmaiden ELIXIR-keskusten kanssa luotu RDMkit-sivusto pyrkii tukemaan ja yhtenäistämään datanhallinnan käytäntöjä Euroopassa.

RDMkit sisältää ohjeita ja vinkkejä aineiston koko elinkaaren ajalle: datanhallinnan suunnittelusta ja data-analyyseistä aina datan julkaisemiseen ja uudelleenkäyttöön.

”RDMkit on toteutettu niin, että jokainen joka on tekemisissä datan kanssa voi ottaa sen työkalupakikseen. Se tarjoaa ohjeistuksen lisäksi linkit palveluihin, joita tutkija tai tutkimuksen tukipalveluissa työskentelevä tarvitsee datanhallinnan eri vaiheissa”.

Suomen ELIXIR-keskus eli CSC on yksi niistä, joka tuottaa sisältöä ja ylläpitää työkalupakettia.

Ahokas korostaa, että sivustoa on suunniteltu alusta lähtien läpinäkyvästi yhteistyössä tutkijoiden ja datanhallinnan asiantuntijoiden kanssa. Kuka tahansa ELIXIR-infrastruktuuriin kuuluvista voi osallistua kehitystyöhön. Kaikki on dokumentoitu ohjelmakehitys-projekteille tarkoitettuun GitHub-portaaliin.

”RDMkitissä dataa tarkastellaan sen elinkaaren vaiheiden kautta. Datan keräämiseen, kuvailuun tai julkaisemiseen on tarjolla omat ohjeensa.”

RDMkit kehitettiin ELIXIR-CONVERGE –hankkeessa. Datanhallinnan yhtenäistämiseen oli tarvetta, koska tutkimushankkeet ovat pääasiassa kansainvälisiä ja dataa liikutellaan kansallisten rajojen yli.

”RDMkit on ensimmäinen iso kansainvälinen yritys yhtenäistää datanhallinnan käytäntöjä ja ohjeistuksia, jotta saadaan uudelleenkäytettävää, sekä riittävästi, yhtenäisillä standardeilla kuvailtua ja laadukasta dataa. Datanhallinnassa on kyse siitä, että datan keruu, käsittely ja kuvailu suunnitellaan ajoissa: miten ja missä dataa säilytetään ja miten eri versioita hallitaan. Sitten on vielä mietittävä, onko datassa jotakin sellaista, mikä pitäisi säilyttää pitkäaikaisesti. Toisaalta pitäisi myös päättää, mikä osa datasta voidaan hävittää.”

Minna Ahokkaan mielestä on tärkeää tarjota tutkijoille palveluja, jotka auttavat heitä noudattamaan datanhallinnan hyviä käytäntöjä.

”Yritämme välttää tilannetta, että tutkijoille esitetään esimerkiksi rahoitushakujen yhteydessä aina uusia listoja datanhallinnan vaatimuksista, mutta ei osoiteta niihin sopivia palveluita. Jos vaadimme, että tutkimushankkeiden datanhallinnassa noudatetaan FAIR-periaatteita, meidän pitää tarjota riittävästi tukea ja palveluita FAIR-datan tuottamiseen.”

Asiantuntijatukea datanhallintaan

CSC, suomalaiset tutkimusorganisaatiot ja yliopistot ovat luoneet kansallisen datatuki-verkoston. Verkosto toimii CSC:n ja organisaatioiden datatukihenkilöstön yhteistyön tukena. Se tarjoaa foorumin avoimelle keskustelulle, kysymysten esittämiselle ja vertaistuelle.

Esimerkiksi Aalto-yliopistossa on lanseerattu tieteenalakohtaiset ”data-agentit”, jotka ovat datanhallinnan asiantuntijoita ja heillä on tutkijatausta. He huolehtivat yhdessä tutkijoiden kanssa datasta.

RDMkitin julkaisuvaiheessa datanhallintaan kohdistui COVID 19 -pandemian vuoksi aivan uudenlaisia paineita.

”Kun RDMkit oli saatu lähes valmiiksi, maailmaan iski COVID. Silloin totesimme ELIXIR-CONVERGE -hankkeessa, että myös COVID-virukseen liittyvä data ja sen vaatimukset pitää huomioida. Siksi RDMkitiin toteutettiin nimenomaan COVID 19 -datan käsittelyyn liittyvää ohjeistusta sekä Euroopan COVID 19 -dataportaalia koskeva sivu.”

RDMkit ja ELIXIRin datanhallinnan ohjeistukset ovat päätyneet myös osaksi EU:n Horizon Europe rahoitusinstrumentin datanhallinnan ohjeita.

Biotietieteissä suositellaan RDMKit-työkalupakin hyödyntämistä. Se on herättänyt myös maailmanlaajuista kiinnostusta. Yhdysvaltalaisia käyttäjiä on huomattava määrä ja NIH (National Institutes of Health) on kiinnostunut yhteistyöstä ELIXIR-infrastruktuurin kanssa.

IceBear – sovellus rakennebiologian datanhallintaan

RDMkit on yleinen datanhallinnan ohjekokoelma, josta linkataan eteenpäin esimerkiksi IceBearin kaltaisiin työkaluihin.

”IceBear on tehty alun perin kristallografiaa ja rakennebiologian tiedonhallintaa varten”, sanoo professori Lari Lehtiö Oulun yliopiston biokemian ja molekyylilääketieteen tiedekunnasta.

Proteiinikiteitä kuvattuna mikroskoopilla. Kiteistä saatua sirontadataa käytetään molekyylin, kuten proteiinin, rakenteen määrittämisessä. Kuva: Sven Sowa, Biokemian ja molekyylilääketieteteen tiedekunta, Oulun yliopisto.

Lehtiö on myös rakennebiologian tutkimusinfrastruktuurin Instructin Oulun yksikön johtaja. Biocenter Oulun rakennebiologian yksikössä suunniteltiin professori Rik Wierengan ja sovelluskehittäjä Ed Danielin avulla rakennebiologian datanhallintaohjelma IceBear. Sovelluksen kehitystyötä on tehty myös ELIXIRin koordinoimassa EOSC-Life verkostossa, johon myös Instruct kuuluu. EOSC-Life projektin tuella IceBear siirrettiin CSC:n ylläpitämään cPouta-pilvipalveluun.

Biocenter Oulussa kiteytetään proteiineja ja muita makromolekyylejä. Proteiinien aminohappoketju on laskostunut kolmiulotteiseksi rakenteeksi, joka on kullekin proteiinille tyypillinen. Koska mahdollisia erilaisia laskostumisen tapoja on valtavasti, proteiinirakenteita on jouduttu selvittämään laboratorioissa kokeellisesti, kiteyttämällä. Proteiinin kolmiulotteinen rakenne pystytään selvittämään sen perusteella miten röntgensäde siroaa proteiinikiteestä. Kerätystä sirontadatasta voidaan matemaattisella muunnoksella laskea proteiinin elektronitiheyskartta, joka kertoo atomien paikat proteiinissa. Nykyään käytetään rakennetutkimuksessa paljon myös kryoelektronimikroskopiaa, jossa proteiineista valmistettua jäädytettyä näytettä pommitetaan elektroneilla ja miljoonat yksittäiset proteiinien 2D-kuvat yhdistetään kolmiulotteiseksi rakenteeksi.

Apuna proteiinien kiteytyksessä on automaattisia kuvantamislaitteistoja. Proteiinit kiteytetään eri liuoksissa, jolloin joissakin olosuhteissa tapahtuu kiteiden muodostuminen.

”Proteiini kiteytetään pisaraan ja tätä seurataan kuvantamalla. Levyissä voi olla 300 pisaraa ja levyjä monta sataa. Kun niitä kuvataan joka päivä, kuvia tulee aika paljon. Kiteytys tehdään yleensä roboteilla,” sanoo Lehtiö.

Kidenäytteet poimitaan käsin mikroskoopista ja laitetaan nestetyppitankkeihin. Nyt IceBear-ohjelman avulla voidaan samalla sujuvasti pitää kirjaa automaattisesti näytteistä ja niihin liittyvästä tiedosta.

”Usein näytteet lähetetään toiseen infrastuktuuriin, eri synkrotroneihin Eurooppaan. IceBearin avulla tiedetään, mitä näytteelle tapahtui toisessa paikassa. Metadataa liikutellaan eurooppalaisten synkrotronien käyttämien tietokantojen ja IceBearin välillä. Näytteessä on metadataa aika paljon, kuten mikä proteiini oli kyseessä ja millainen rakenne sillä oli, miten se kiteytettiin ja minkälaiset olosuhteet kiteytyksessä olivat.”

Icebearin avulla päästään eroon käsin tehdystä kirjanpidosta. Dataa voidaan lähettää ilman kaavakkeiden täyttöä ja linkit ovat tietoturvallisesti luotu näytteiden viivakoodeihin.

“Kun tämän tekee kerran, se on siinä. Tämän sovelluksen arvo esimerkiksi tutkijoiden ajan säästämisessä näkyy myös vuosien kuluttua”, sanoo Lehtiö.

Ari Turunen

20.10.2022

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Minna Ahokas, & Tommi Nyrönen. (2022). Reusable, accurately described and high-quality data – tools created by the research community for agile data management. https://doi.org/10.5281/zenodo.8154582

Lisätietoja:

RDMkit

https://rdmkit.elixir-europe.org/covid19_data_portal

ELIXIR CONVERGE

https://elixir-europe.org/about-us/how-funded/eu-projects/converge

COVID-19 dataportaali

https://www.covid19dataportal.org

EOSC-Life

https://elixir-europe.org/news/eosc-life-start

IceBear

https://icebear.fi/

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

Antibiooteille vastustuskykyiset bakteerit ovat maailmanlaajuinen ongelma

Antibiooteille vastustuskykyiset bakteerit kantavat resistenssigeenejä ja niistä tulee usein mikrobipopulaatioissa vallitsevia. Bakteerit voivat myös mutatoitua ja saada muilta mikrobeilta geenejä, jotka tekevät niistä antibiooteille vastustuskykyisiä. Suomen Akatemian tutkijatohtori Katariina Pärnänen etsii ja tunnistaa näitä geenejä, jotka on kerätty tietokantoihin eri ympäristöistä ympäri maailmaa.

Antibiootteja eli mikrobien tuottamaa ja toisia mikrobeja, erityisesti bakteereja tappavia lääkeaineita on käytetty infektioiden torjunnassa jo 1930-luvulta lähtien. Kun antibiootteja käytetään, alkaa syntyä näille lääkkeille vastustuskykyisiä bakteereja, varsinkin jos antibiootteja käytetään väärin tai liikaa. Tilanne pahenee koko ajan ja ihmisiä kuolee infektioihin, joihin antibiootit eivät tehoa. Katariina Pärnänen tutkii Turun yliopistossa antibioottiresistenssiä.

”Käytännössä tämä tarkoittaa sitä, että henkilöllä on joku antibiootille vastustuskykyinen bakteeri, joka aiheuttaa infektion. Kun tulehdusta yritetään hoitaa antibiooteilla, niin paranemista ei tapahdu. Nykyään on hyvin tavallista, että antibiootille vastustuskykyiset bakteerit eivät ole vastustuskykyisiä vain yhdelle vaan esimerkiksi 15 eri antibiootille.”

Biofilmi on mikrobien organisoima rakenne, joka on kiinnittynyt orgaaniseen tai elottomaan pintaan. Antiobiooteille vastustuskykyistä bakteeristoa, sauvamaisia ja pyöreitä bakteereja: Escherichia coli, Pseudomonas aeruginosa, Mycobacterium tuberculosis, Klebsiella sekä Staphylococcus aureus.

Ihmisen ja ympäristön terveyteen liittyvä ongelma

Bakteerien resistenssigeenit ovat kasvava maailmanlaajuinen ongelma. Niitä on maaperässä, jätevesissä, kalankasvattamoissa ja eläintiloilla, eikä vain ihmisen suolistossa. Lopulta ympäristönkin resistenssigeenit saatavat päätyä lopulta myös ihmisen suolistoon.

”Minua kiinnostaa kaikki mikrobeissa. Tutkimuksiani edistää, että ymmärrän myös jonkin verran mitä sikatiloilla, kalankasvattamoilla tai Indonesian suurkaupungin läpi virtaavassa joessa tapahtuu. Helsingin yliopistossa tutkin vauvojen suolistomikrobistoa ja miten vauvojen saama äidinmaitokorvike tai imetys ovat yhteydessä resistenssigeenien määrään. Tavallaan tutkimukseni edustaa ”yksi terveys”-suuntausta”, Pärnänen toteaa.

Kun 2000-luvun alussa havaittiin uusia virustauteja ja niiden uhkia, syntyi One Health and Global Health -tutkimussuuntaus: kokonaisvaltainen käsitys ihmisten ja eläinten terveyden ja ekosysteemin suojelemisen tärkeydestä. Lääkärien ja eläinlääkärien aloittama liike edustaa poikkitieteellistä lähestymiskulmaa, jossa on mukana paikallinen, alueellinen, kansallinen ja globaali taso.

”Haluan ymmärtää antibioottiresistenssiä sekä ihmisten terveyteen että eläin- ja ruoantuotantoon sekä ympäristöterveyteen liittyvänä ongelmana. Aiemmin olen tutkinut miten resistenssigeenit siirtyvät äidiltä lapselle ja miten imetyksen pituus vaikuttaa geenien määrään. Nyt olen keskittynyt siihen, minkälaiset tekijät ovat yhteydessä suolistomikrobiston antibioottiresistenssiin. Näitä ovat antibioottien liiallinen käyttö, asuinympäristö sekä terveyshistoria, joka voi paljastaa, kantaako todennäköisesti antibiooteille vastustuskykyisiä bakteereja.”

Suoliston bakteeristo auttaa säätelemään ruoansulatusta ja immuunijärjestelmää. Probiootit ovat hyödyllisiä bakteereja ja niitä käytetään lisäämään terveellisen suolistoflooran, kuten maitohappobakteerien määrää.

Uudet sekvensointitekniikat toivat läpimurron mikrobien tutkimukseen

Ympäristössä olevien bakteereiden ja niiden geenien tutkimus otti suuren harppauksen eteenpäin, kun uuden sukupolven sekvensointimenetelmät tulivat käyttöön. NGS-sekvensointi (Next Generation Sequencing) perustuu massiiviseen rinnakkaissekvensointiin, jossa miljoonia lyhyitä DNA-fragmentteja monistetaan samanaikaisesti. Koska joukko ympäristöstä noukittuja ja sekvensoituja geenejä voidaan analysoida samalla tavoin kuin yksittäisen lajin perimää, tutkimussuuntausta alettiin kutsua metagenomiikaksi. Ensimmäinen metagenomiikkaa hyödyntävä tutkimusartikkeli antttiresistenssistä julkaistiin vuonna 2014.

”Antibioottiresistenssiä on tutkittu pitkään, mutta NGS mahdollisti – ei pelkästään yksittäisten geenien – vaan kaikkien vastustuskykyisen geenien analysoimisen yhdestä näytteestä”, Pärnänen huomauttaa.

Metagenomiikkaan liittyvät tutkimukset ovat osoittaneet, että antibioottien resistenssigeenit ovat yleisiä elinympäristössä. On suuri riski, että nämä geenit siirtyvät bakteereihin, jotka aiheuttavat tulehduksia ihmisissä.

Pärnänen hyödyntää metagenomien sekvenssidataa, jota on myös kerätty laajoihin avoimiin tietokantoihin. Dataa hän analysoi tieteen tietotekniikan keskuksen CSC:n supertietokoneiden avulla. Näin pystytään tunnistamaan eri bakteerilajeja ja niissä olevia resistenssigeenejä.

”Jostakin bakteerilajista voidaan tunnistaa sellaisia geenejä, mitkä esiintyvät sen perimässä vain kerran ja sitten vertailemalla niitä muiden lajien tietokannoissa oleviin geeneihin pystytään sanomaan, mikä bakteerilaji on kyseessä. Resistenssigeeneistä etsitään osumia: sopiiko se tietokannoissa olevaan resistenssigeeniin? Sitten voidaan todeta, että jollakin ihmisellä on ulostenäytteessään kymmenen resistenssigeeniä tai että hänellä on tietty määrä kolibakteereja.”

Resistenssigeenejä on kaikkialla

Yhdessä tutkimuksessa Pärnänen oli mukana analysoimassa resistenssigeenejä ihmisen ulosteista. Tutkimuksessa vertailtiin seitsemän maan jätevesien käsittelylaitosten bakteereja. Puolet maapallon väestöstä kantaa suolistossaan CrAssphage-faagia eli bakteerin loisena olevaa virusta. Tämän faagin geenisekvenssiä käytettiin tutkimuksessa markkerina osoittamaan ulostepohjaista tartuntaa.

”Samoja resistenssigeenejä löytyy kaikkialta maailmasta. Antibioottiresistenssistä puhutaan, että se olisi näkymätön pandemia, koska samat resistenssigeenit leviävät maan rajojen ulkopuolelle. Tietyt geenit ovat tosin yleisempiä jossakin päin maailmaa kuin toiset.”

Intiassa voi olla huomattavasti enemmän näitä geenejä kuin esimerkiksi Pohjois-Euroopassa. Etelä-Euroopan ja Pohjois-Euroopan välillä alkaa olla myös suuria eroja.

”Esimerkiksi virtsatieinfektioita aiheuttavat E. coli-kannat Etelä-Euroopassa voivat olla hyvin resistenttejä.”

Terveelle ihmiselle bakteerit eivät aiheuta vakavaa tautia, mutta aina välillä käy, että suolistoinfektion aiheuttajana on resistentti bakteeri.

”Resistentin bakteerin aiheuttamaa infektiota on vaikea hoitaa. Yleensä nämä ongelmallisimmat resistentit infektiot, joita tavataan Suomessa ovat usein tulleet sellaisille ihmisille, jotka asuvat Suomessa mutta jotka ovat matkustaneet ulkomaille.”

Vuonna 2002 Terveyden ja hyvinvoinnin laitoksen THL:n FINRISKI – väestöaineistoon kerättiin ulostenäytteitä ja määritettiin näytteissä olevien mikrobien sekvenssitiedot.

”Analysoimme yhdessä THL:n tutkijoiden kanssa suomalaisesta populaatiosta saaduista näytteistä, mihin resistenssi mahdollisesti vaikuttaa ja minkälaisia terveydellisiä seuraamuksia on, jos ihmisellä on paljon vastustuskykyisiä bakteereja. Ovatko korkeat antibioottiresistenssigeenien määrät yhteydessä riskiin kuolla seurantajakson aikana?

On ennustettu, että 2050 vuonna antibioottiresistentit infektiot tappaisivat enemmän kuin syöpä. Tuolloin infektiotaudit olisivat yleisin kuolinsyy. Antibiootteja käytetään jo nyt enemmän tuotantoeläimiin kuin ihmisiin ja samalla eläinproteiinin kulutus kasvaa. Pärnäsen mukaan resistenssikriisiä vastaan voidaan taistella siten, että antibiootteja käytetään vain bakteeri-infektioiden hoitamiseen ja vain silloin kun antibiooteista on tutkitusti apua. Myös ruokavalio tai elämäntapa voivat ehkä vähentää resistenssigeenejä suolistomikrobistossa.

”Esimerkiksi kuidun syönti on hiljattain yhdysvaltalaisissa tutkimuksissa yhdistetty resistenssigeenien pieneen määrään kun taas eläinproteiinin määrä ruokavaliossa oli yhteydessä geenien suureen määrään. Voidaan sanoa, että sinun suolistomikrobistosi on sitä mitä syöt.”

Katariina Pärnänen työskentelee apulaisprofessori Leo Lahden tutkimusryhmässä. Ryhmä kehittää koneoppimismalleja, jotka seulovat laajoista datakokoelmista mikrobiryhmiä.

”Antibioottiresistenssi on yksi esimerkki tutkimuksesta, jossa hyödynnetään uusia mittausmenetelmiä ja laskentakapasiteettia tavalla mitä ei ole aiemmin tehty. Tässä tutkimusaiheessa yhdistyvät luontevasti eri mittausympäristöt ihmiskehosta ympäristön mikrobistoon. Tällainen tutkimus mahdollistaa menetelmäkehitykseen ideoita, joista myös eri alojen tutkijat voivat hyötyä,” sanoo Leo Lahti.

Katariina Pärnäsen toiveena on tutkia kaikkien maailman ihmispopulaatioiden suolistomikrobinäytteet, joista on tehty metagenomisekvensoinnit ja jotka ovat tietokannoissa avoimesti saatavilla.

”Olisi kiinnostavaa keskustella CSC:n asiantuntijoiden kanssa, miten tämä olisi teknisesti mahdollista. Tämä myös edistäisi avointa tiedettä, koska tunnistetut resistenssigeenit ja mikrobiomeista löydetyt eliölajit voitaisiin tallettaa myös muiden tutkijoiden käyttöön.”

Ari Turunen

1.9.2022

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Katariina Pärnänen, Leo Lahti, & Tommi Nyrönen. (2022). Antibiotic-resistant bacteria are a global problem. https://doi.org/10.5281/zenodo.8154563

Lisätietoja

Turun yliopisto

www.utu.fi

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org http://www.elixir-europe.org

Yksilöity lääketiede syövän ja virusten torjunnassa

Solujen mallintaminen ja niiden toiminnan simuloiminen parantaa huomattavasti henkilökohtaisia hoitosuunnitelmia. PerMedCoE- hankkeessa yhdistetään kliinistä potilastietoa geenien ja proteiinien ja solujen toimintaan liittyvään tietoon. Tavoitteena on kehittää täsmälääketieteessä käytettäviä työkaluja. Solujen mallintaminen yksityiskohtaisesti on kuitenkin valtava urakka ja vaatii paljon supertietokoneiden laskentatehoa.

Yksilöity lääketiede avaa tulevaisuudessa suuria mahdollisuuksia. Tavoitteena on, että potilaan kliininen data voidaan yhdistää geneettiseen dataan ja näiden tietojen pohjalta voidaan laatia yksilöllisiä hoitosuunnitelmia. PerMedCoE– hankkeessa (HPC/Exascale Centre of Excellence in Personalised Medicine) pyritään parantamaan yksilöidyn lääketieteen mallinnusohjelmistojen yhteensopivuutta eksaskaalan supertietokonejärjestelmiin. Eksaskaalan supertietokoneet ovat seuraavan sukupolven järjestelmiä joiden teoreettinen laskentateho vastaa jopa 10^18 laskutoimitusta sekunnissa. Hankkeeseen osallistuu tutkijoita useasta eurooppalaisesta yliopistosta ja sairaalasta. Projekti keskittyy neljään avoimen lähdekoodiin perustuvaan solutason mallinnusohjelmistoon. Ohjelmistokehityksen lisäksi tutkimushankkeessa pyritään edistämään täsmälääketieteen työkalujen helppokäyttöisyyttä ja toimivuutta useissa eurooppalaisissa suurteholaskentakeskuksissa.

”Tavoitteena on että nämä neljä ohjelmistoa pystyisivät tulevaisuudessa toimimaan useassa supertietokoneessa”, sanoo CSC:n projektipäällikkö Sampo Sillanpää.

”Tällä hetkellä tämä on teknisesti hyvin haastavaa toteuttaa, koska jokainen suurteholaskentaympäristö on omanlaisensa johtuen järjestelmäarkkitehtuurista.”

Ohjelmistojen ja datamassojen saumaton toiminta on tarkoitus saavuttaa yhteisesti sovituilla teknologioilla. PerMedCoE-hankkeessa tämä toteutetaan ns. konttitekniikan ja työvuo-ohjelmistojen avulla. Työvuo on tutkimusprosessin automaatio, jonka aikana dokumentteja, tietoa ja tehtäviä siirretään suoritettaviksi tiettyjen sääntöjen mukaisesti. Konttitekniikan avulla voidaan määrittää vakioitu ympäristö, jossa tieteellisiä ohjelmistoja ajetaan jokaisessa hankkeeseen osallistuvassa suurteholaskentaympäristössä. Kun ohjelman koodi kirjastoineen ja asetuksineen asetetaan konttiin, sitä voidaan siirrellä koneelta ja konesalista toiseen.

”Ohjelmistot ja data on tavallaan paketoitu omaan laatikkoonsa, jotta niitä voidaan siirtää ympäristöstä toiseen. CSC:llä on useita konttitekniikan asiantuntijoita, joten työkaluja pystytään siirtämään alustalta toiselle”, Sillanpää sanoo.

”Kontteja hyödyntämällä asiantuntijat pystyvät rakentamaan käyttäjäystävällisiä työnkulkuja, eli työvoita. PerMedCoE-hankkeessa työvuot koostuvat useammasta rakennuspalikasta, joista jokainen toteuttaa tietyn täsmälääketieteen laskentatehtävän. Yhdessä rakennuspalikassa voidaan tehdään esikäsittelyä datalle, toisessa varsinainen analyysi ja viimeinen antaa tuloksen loppukäyttäjälle. Käyttäjän ei siis välttämättä tarvitse huolehtia miten useasta rakennuspalikasta rakennettu automatisointi toimii, vaan keskittyä tulosten tulkintaan.”

COVID-19 mallintaminen solutasolla

Hankkeessa rakennettujen teknologioiden hyödyllisyyttä arvioidaan erilaisten käyttötapausten avulla. Työvoiden avulla analysoidaan, mitä häiriöitä taudit voivat aiheuttaa solutasolla tai miten lääkeaineet toimivat. Mallien avulla voidaan tutkia solujen aineenvaihduntaa tai signaalinvälitystä.

”PerMedCoE-käyttötapauksissa hyödynnetään julkisesti saatavilla olevia genomidata-aineistoja. Nyt voimme tutkia koronaviruspotilaista otettuja näytteitä ja etsiä genomidatasta sellaisia markkereita, jotka ilmentävät, mitkä potilasryhmät ovat erityisen alttiita taudin vaaralliselle muodolle.”

Projektissa mallinnetaan ihon epiteelikudosta, joka reagoi koronavirustartuntaan kutsumalla erilaisia immuuneja soluja vaikuttamaan virukseen. Näin voidaan mahdollisesti paremmin tunnistaa sellaisia potilasryhmiä, jotka ovat alttiita koronan vakavalle tautimuodolle.

“Ajatuksena on, että pystytään rinnakkain ajamaan useita malleja yksittäisille potilaille. Näin voidaan tehokkaasti analysoida riittävän suuria datamääriä, jotta mallinnustuloksia voitaisiin käyttää yksilöidyn lääketieteen apuna”, sanoo vanhempi datatieteilijä Jesse Harrison CSC:stä.

COVID 19-käyttötapauksen mallinnuksessa käytetään solutason RNA-sekvenssidataa. RNA-sekvensointi yhden solun tarkkuudella (scRNA-seq) voi paljastaa geenien välisiä säännöllisiä vuorovaikutusyhteyksiä, solujen syntyperälinjat, solujen eroavaisuuksia sekä solun viitekehyksen ympäristössään.

COVID-19-tautia ja eri solupopulaatioiden käyttäytymistä voidaan tutkia moniskaalautuvien mallien ja yhden solun dataa käyttämällä. MaBoSS on ohjelmisto, joka mahdollistaa solupopulaatioiden simuloimisen ja mallintamisen stokastisesti (Boolen mallinnus) ja solunsisäisiä mekanismeja, joiden säätelyyn taudit vaikuttavat. PhysiBoSS yhdistää MaBosS-ohjelmiston vapaan lähdekoodin PhysiCell-ohjelmistoon, joka simuloi isoja solujärjestelmiä. 3D-kudoksia voidaan tutkia standardeilla pöytäkoneilla. PhysiBoSS-ohjelmisto avulla tutkijat voivat analysoida yksittäisten solujen geneettisiä muutoksia väestötasolla.

Toinen tärkeä projektin käyttötapaus on syöpädiagnostiikka. Tavoitteena on luoda mallinnustyökaluja syöpäkasvainten kasvun ennustamiseen ja potilaskohtaisten hoitojen kehittämiseen. Aineistona käytetään Wellcome-instituutin ja Massachusettsin syöpäkeskuksen keräämää aineistoa. Tietokantaan on kerätty yli tuhat erilaista kasvainkudoksen solulinjaa.

”Projektissa pyritään esimerkiksi tunnistamaan uusia lääkeyhdistelmiä, jotka voisivat olla syöpähoidossa hyödyllisiä” Jesse Harrison sanoo.

Tämä johtaisi toivottavasti potilaskohtaisten syöpähoitojen tarkempaan kohdistamiseen ja diagnostiikan nopeutumiseen.

”Jotta nämä tavoitteet täyttyisivät läheisempää yhteistyötä tarvitaan suurteholaskentakeskusten ja lääketieteellisen organisaatioiden kanssa. Tämä siksi, koska nyt puhutaan isoista datamassoista ja suurten potilaskohtaisen datan analysointi ei ole omalla pöytäkoneella mahdollista.”

PerMedCoE:n tulokset ja työkalut on tarkoitettu kaikille tutkijoille.

“Kun projekti päättyy kesällä 2023, meillä on päivitettyjä versioita avoimen lähdekoodin pohjalta kehitetyistä mallinnustyökaluista ja ne saatetaan tutkijayhteisön saataville. Hankkeessa luodaan myös uutta osaamista tukemaan täsmälääketieteen työkalujen käyttöä CSC:n laskentaympäristöissä.”

Miten solut toimivat eri tasoilla, yksittäisestä solusta laajoihin solupopulaatioihin? CSC – Tieteen tietotekniikan keskus ja Barcelonan superlaskentakeskus (BSC), yhdessä kymmenen muun akateemisen ja kaupallisen toimijan kanssa, aloittivat lokakuussa 2020 Euroopan komission huippuyksikköhankkeen HPC/Exascale Center of Excellence for Personalised Medicine (PerMedCoE). Hankkeessa kehitetään solutason mallinnusohjelmistoja suurteholaskentaan soveltuviksi. Suurteholaskennan avulla biologinen data kuten genomiikka ja proteomiikka voidaan tuoda osaksi täsmälääketiedettä, koska datan analysointi nopeutuu huomattavasti. Esimerkiksi sairauden diagnooseja pitäisi käytännössä pystyä tekemään tuntien tai päivien sisällä. PerMedCoE on osa ELIXIR Suomen kehitysohjelmaa.

Syövän voittaminen

EU rahoittaa monia projekteja, jotka tulevaisuudessa mahdollistavat yksilölliset potilashoidot. Syöpä on yksi esimerkki taudista, joka on erittäin yksilöllinen, oli kyse sitten rinta-, keuhko-, maksa-, tai eturauhassyövästä.

Esimerkiksi Horisontti Eurooppa -puiteohjelman Conquering Cancer: Mission Possible näyttää Suomen molekyylilääketieteen instituutin (FIMM) tutkijan Esa Pitkäsen mukaan suuntaa tulevaisuuden syöpätutkimukselle ja -hoidoille. Kunnianhimoinen ohjelma tavoittelee syöpien syntyyn johtavien mekanismien ymmärtämistä, uusia menetelmiä syöpien aikaiseen havaitsemiseen, sekä henkilökohtaisen eli yksilöidyn syöpälääketieteen läpimurtoja.

”Kaikille näille tavoitteille yhteistä on monipuolisen ja laajan terveysdatan hyödyntäminen uusien laskennallisten menetelmien avulla. Koneoppimiseen perustuvien tekoälyalgoritmien avulla onkin jo saavutettu rohkaisevia tuloksia esimerkiksi digitaalisen patologian alalla. Seuraavat harppaukset tehdään yhdistelemällä useita eri tietolähteitä yksilöllisten syöpäseulonta- ja hoitosuositusten antamiseksi”, Pitkänen uskoo.

Ohjelmassa syöpäpotilaat halutaan mukaan syöpähoitojen kehitykseen esimerkiksi antamalla potilaille mahdollisuuksia lähettää tietoturvallisesti omaa terveysdataansa tutkijoiden käyttöön. Samalla potilaat saavat myös uutta tutkimustietoa omasta sairaudestaan.

”On tärkeää, että hoitomuotojen kehittyessä pidetään huolta siitä, että ihmisille taataan tasa-arvoinen mahdollisuus hyötyä uusista hoidoista taustasta riippumatta. Olen iloinen siitä, että tämä on huomioitu ohjelman suosituksissa. Lisäksi lasten ja nuorten syöpiin kiinnitetään erityistä huomiota.”

Ari Turunen

23.8.2022

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Sampo Sillanpää, Esa Pitkänen, & Tommi Nyrönen. (2023). Personalised medicine against cancer and viruses. https://doi.org/10.5281/zenodo.8154548

Lisätietoja:

HPC/Exascale Centre of Excellence in Personalised Medicine

https://permedcoe.eu

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Tulevaisuudessa algoritmi voi tunnistaa glaukooman silmänpohjakuvista

Glaukooma eli vanhalta nimeltään silmänpainetauti on näköhermon etenevä sairaus, joka aiheuttaa vaurioita näköhermonpäähän ja hermosäiekerrokseen. Riski sairastua glaukoomaan suurenee iän myötä. Glaukoomaa esiintyy yli 50-vuotiailla noin 2%:lla ja yli 75-vuotiailla yli 5 %:lla. Maailmassa on arviolta yli 60 miljoonaa glaukoomaa sairastavaa potilasta, heistä noin 6 miljoonan arvioidaan olevan näkövammaisia.

Haasteena taudissa on, että glaukooma on usein alkuvaiheessa täysin oireeton tai vähäoireinen. Koska vaurioita ei voida korjata, tauti tulisi löytää mahdollisimman varhain. Hoidon tavoitteena on ehkäistä glaukoomasta johtuvaa näkövammaisuutta. Suurimmalla osalla potilaista tautimuutokset etenevät hitaasti vuosien aikana. Pienellä osalla potilaista tauti voi johtaa vaurioihin jo lyhyessä ajassa.

Glaukooman havaitsemisen ja etenemisnopeuden tunnistamiselle olisi tärkeää, että terveydenhuollon järjestelmien avulla löydettäisiin mahdollisimman varhain suuren riskin tapaukset. Glaukooman varhaisen havaitsemisen avuksi on nyt kehitteillä tekoälymalleja.

Tutkija ja projektipäällikkö Ara Taalas on erikoistunut datatieteeseen, tekoälyyn ja koneoppimisen algoritmeihin lääketieteessä. Yksi hänen tutkimuskohteistaan on kehittää tehokkaita oppivia algoritmeja glaukooman havaitsemiseen Suomen molekyylilääketieteen instituutin (FIMM) ja Terveystalon yhteisessä projektissa. Aiemmin Taalas on mallintanut kantasolujen erilaistumisprosesseja ja tehnyt lääkeainesuunnittelua.

Terveystalon erikoisalajohtajan ja ylilääärin Matti Seppäsen mukaan glaukooman diagnoosi ja luokittelu perustuvat näköhermon pään, hermosäiekerroksen ja kammiokulman tutkimiseen, silmänpaineen mittaamiseen sekä näkökenttätutkimukseen.

”Glaukooman tarkkaa syntymekanismia ei tunneta, mutta todennäköisesti glaukoomavaurioiden taustalla ovat vauriot hermosolujen rakenteissa.”

Todennäköisesti noin 30-50 prosentilla potilaista silmänpaine on niin sanotulla normaalialueella (10-21 mmHg). Potilailla on yksilöllinen alttius glaukoomavaurioiden kehittymiseen eri painetasoilla. Osalla potilaista syntyy glaukoomavaurioita alhaisemmalla painetasolla, osalla potilaista muutokset voivat olla vähäisiä vaikka painetaso olisi suurempi.

”Nykyisin glaukoomadiagnoosiin tarvitaan silmälääkärin tutkimus ja useita lisätutkimuksia. Näköhermon päätä voidaan tutkia mm. biomikroskopian ja stereopapillakuvauksen avulla. Hermosäiekerrosta voidaan arvioida esim. värisuodatetun silmänpohjakuvauksen tai hermosäiekerroksen valokerroskuvauksen (ns. OCT-tutkimus) avulla. ”

Tutkimuksissa glaukoomaepäily voi herätä esimerkiksi näköhermonpään muodon perusteella. Näköhermonpään rakennetta voidaan arvioida ns. cup/disc –suhteen mittauksella, jossa näköhermon keskuskuopan suuruutta verrataan näköhermonpään ulkoreunan suuruuteen.

”Hermosäiekerroksen vauriot voivat tulla esiin hermosäiekerroksen valokerroskuvauksessa ohentuneena hermosäiekerroksena. Silmänpohjan värisuodatetussa valokuvauksessa voidaan myös saada esiin hermosäiekerroksen puutoksia. Glaukoomadiagnoosi perustuu usein useaan eri tutkimukseen ja tällä hetkellä ei ole saatavilla yksittäistä tutkimusmenetelmää, jonka avulla glaukooman seulontaa väestötasolla olisi päästy toteuttamaan. Tekoälysovellukset voivat tulevaisuudessa tuoda seulontaan ja diagnostiikkaan merkittävää apua.”

Esa Pitkänen Molekyylibiologian instituutista FIMM:stä (Helsingin yliopisto) kertoo glaukooman tutkimisesta algoritmien avulla.

Algoritmi tunnistaa kuvioita hermokerroksista

Ara Taalaksen mielenkiinnon kohteena tekoälymallia kehitettäessä on mm. silmänpohjan hermokerrosten kuvautuminen kuvantamistutkimuksissa. Algoritmin avulla pyritään havaitsemaan silmänpohjakuvista niitä muutoksia, jotka voivat viitata hermosäiekerroksen vaurioon. Mallin avulla pyritään selvittämään, voivatko silmänpohjan hienosyiset verkottuneet muutokset muuttuessaan tummemmiksi ja monotonisiksi olla yhteydessä hermosäiekerroksen vaurioon.

”Tämä on yksi tekijöistä, joihin malli on kohdennettu. Jatkossa mallille opetetaan lisää silmänpohjan hermosäikeiden kuvioita. Tällaisten algoritmien tavoitteena on pyrkiä löytämään keinoja, jotka auttavat kehittämään päätöksentukijärjestelmiä lääkärin työhön. Pitkälle kehittynyt keinoäly voi löytää muutoksia, joita kokenutkaan kliinikon silmä ei välttämättä havaitse.”

Ara Taalaksen laatima tekoälymalli toimii niin, että silmänpohjankuva puretaan kolmeksi isoksi lukumatriisiksi, jotka vastaavat punaista, vihreää ja sinistä kanavaa. Punaisella kanavalla silmänpohjan kudoksen rakenne erottuu vahvemmin kuin muilla kanavilla. Malli kiinnittäää kaikilla värikanavilla huomion näköhermonystyyn eli papillaan. Tämän lisäksi punainen kanava kiinnittää huomiota papillaa ympäröivään kudokseen osaksi siksi, että punaisella kanavalla papillaa on vaikeampaa erottaa ympäröivästä kudoksesta. Verisuonet eivät siis kiinnitä mallin huomiota. Malli ilmoittaa punaisella, jos silmänpohjakuvassa on jotakin huomionarvoista. Kuvassa vasemmalla punainen, keskellä sininen ja oikealle vihreä värikanava.

Silmän rakennetta ja toimintaa mittaavissa tutkimuksissa esiintyy vaihtelua, joka johtuu käytössä olevasta tutkimusmenetelmästä, arvioijan kokemuksesta, tutkittavasta sekä taudin vaikeusasteesta. Näköhermon pään arvioimisella ei saavuteta aina riittävää tarkkuutta nykyisillä menetelmillä. Näkökenttätutkimus voi olla normaali, vaikka näköhermossa ja hermosäiekerroksessa esiintyisi vaurioita. Tämä johtuu siitä, että rakennevauriot tulevat yleensä ennen kuin näkökenttäpuutokset esiintyvät. Mikäli jatkossa pystytään kehittämään sovelluksia, jotka arvioivat aiempaa tarkemmin ja tehokkaammin rakenteellisia muutoksia, voidaan sillä varhaistaa glaukooman diagnostiikka.

Taalaksen mukaan eräänä sovelluskohteena mallille olisi, että tekoälymalli olisi käytettävissä aina kun tehdään näöntarkastus.

”Väestötutkimuksissa on todettu, että jopa puolet glaukoomaa sairastavista on tällä hetkellä diagnosoimatta. Nykyisillä seulontamenetelmillä ei ole päästy riittävän kustannusvaikuttavaan tulokseen ja yleisen väestöseulonnan esteenä on riittävän hyvien menetelmien puuttuminen.Jos keinoälysovellusten avulla pystytään riittävällä tarkkuudella tunnistamaan ne potilaat, joilla on keskimääräistä suurempi alttius sairastua glaukoomaan, voitaisiin oireettomasta väestöstä löytää sairaus helpommin jo niin varhaisessa vaiheessa että sen hoito olisi mahdollisimman tehokasta.”

Yhtenä tulevaisuuden visiona on, että esimerkiksi optikkokäynnin tai terveydenhoitajan tutkimuksen yhteydessä voitaisiin ottaa silmänpohjakuvaus ja samassa yhteydessä keinoäly analysoisi potilaan silmänpohjakuvan. Jos keinoäly ilmaisisi potilaalla olevan tavallista suuremman riskin glaukoomaan sairastumiseen, voitaisiin potilas ohjata jo varhaisessa vaiheessa jatkotutkimuksiin.

Tekoälysovellusten avulla työnjako tullee merkittävästi muuttumaan optisella alalla ja silmäsairauksien diagnostiikassa. Tämä tarjoaa myös avaimia merkittävästi lisääntyvän potilasmäärän hoitoon. Väestön ikärakenteen muuttumisen myötä glaukoomaa sairastavien potilaiden määrä Suomessa kaksinkertaistuu nykytasosta vuoteen 2030 mennessä.

Taalas on Suomen ELIXIR-keskuksen CSC:n laskentapalvelujen käyttäjä. Hän kehittää malleja yhteistyössä FIMM:in Machine Learning in Biomedicine-ryhmän tutkijoiden kanssa, ja samaa lähdekoodia pystytään käyttämään ristiin CSC:n ja Terveystalon laskentapalvelimilla.

”Suomessa ollaan datanhallinnassa nyt korkealla tasolla, mutta potilaista ei ole yksittäisillä terveydenalan toimijoilla tyypillisesti kaikenkattavaa kuvaa – potilasdataa on usein hajautuneena useille eri toimijoille. Kun asiakas vaihtaa organisaatiota, data ei aina liiku perässä, mikä voi vaikeuttaa hoidonohjausta. Tutkijan kannalta olisi ihanteellista, mikäli meillä olisi valtakunnallisesti keskitetty paikka, josta kansalaisen potilashistoria löytyisi kokonaisuudessaan.”

Myös datan kuvaaminen pitäisi saada standardoiduksi.

”Potilastietojärjestelmien rakenne vaikuttaa vahvasti syntyvän datan käytettävyyteen. Vapaatekstikentät ovat usein järjestelmän käyttäjälle miellyttäviä, mutta tuottavat tiedon hyödynnyksessä runsaasti päänvaivaa data-analyytikolle. Analyytikko joutuu usein tekemään runsaasti työtä tiedon standardoimiseksi, ja virheellisten kirjausten tunnistamiseksi. Modernit potilastietojärjestelmät ovat tässä mielessä menneet eteenpäin aiemmasta maailmasta, ja rakenteisuus korostuu niiden tietorakenteissa.”

Ari Turunen

23.11.2021

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Lila Kallio, Arho Virkki, & Tommi Nyrönen. (2021). Patient data creating better artificial intelligence models. https://doi.org/10.5281/zenodo.8135413

Lisätietoja:

Suomen molekyylilääketieteen instituutti (FIMM), Helsingin yliopisto

www.fimm.fi/fi

Terveystalo

www.terveystalo.com

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-finland.org

http://www.elixir-europe.org

Bioinformatiikka mullistaa terveydenhuollon: Datan tehokas käsittely nopeuttaa diagnooseja ja mahdollistaa yksilölliset lääkehoidot

Ihmisen geeneistä ja proteiineista saatu data mahdollistaa sairauksien nopean diagnoosin sekä hyvät ja yksilölliset potilashoidot. Riskiryhmään kuuluvat voidaan seuloa paremmin ja lääkityksen tehoa voidaan parantaa kun tiedetään potilaan geeniperimä. Haasteena on, miten data käsitellään ja minne se tallennetaan.

Uusien datan analyysimenetelmien ja tietokoneiden lisääntyneen laskentatehon ansiosta geeni- ja proteiinidatan käsittely saadaan nopeutettua useista päivistä jopa alle puoleen tuntiin. Tämä edellyttää, että data on esikäsiteltyä eli siitä on poistettu toisteisuus ja että se on nopeasti ja tietoturvallisesti saatavissa.

Bioinformatiikan mittausmenetelmät ovat kehittyneet huimasti ja ne tuottavat valtavasti dataa. Nyt voidaan ymmärtää kokonaisen biologisen järjestelmän toiminta. Tällöin kaikkia geenejä tai niiden tuottamia proteiineja tutkitaan samanaikaisesti. Näitä ns. omiikkoja ovat DNA-sekvenssin selvittäminen (genomiikka) ja proteiinien rakenteiden tietokonemallinnus (proteomiikka), solukudoksessa ilmentyvät geenit (transkriptomiikka)sekä aineenvaihduntatuotteet (metabolomiikka). Näiden menetelmien avulla voidaan tutkia molekyylien vuorovaikutuksia ja löytää elimistön tilan muutoksista merkkejä tautien tunnistamiseksi.

”Nyt pystytään tekemään todella paljon, mutta geenidatan ja kliinisen datan yhdistäminen vaatii vielä paljon datan tallennus- ja laskentakapasiteettia ja kaiken tiedon käsittelyä tietoturvallisesti,” sanoo Suomen molekyylilääketieteen instituutin (FIMM) teknologiakeskuksen johtaja Katja Kivinen.

+1 million genomes -hankkeessa sekvensoidaan miljoonan europpalaisen genomi vuoteen 2022 mennessä.Ihmisen genomissa on noin 20-25 000 proteiineja koodaavaa geeniä DNA:ssa. Proteiineja on ihmisessä noin 250 000 -1 000 000. Ihmisen kehossa on tuhansia metaboliitteja eli aineenvaihduntatuotetta. Lähde: Li Yu, Kefeng Li and Xiaoye Zhang. Oncotarget, Advance Publications 2017

Tautien riskiseulonta

Datan oikeaoppinen esikäsittely ja mallintaminen ovat edellytys tulevaisuuden tutkimukselle, joka lupaa entistä tehokkaampia ennusteita taudeista ja jopa yksilöllistä täsmälääkitystä. Kivinen antaa kaksi esimerkkiä: tautien riskitekijöiden esiseulonnan ja lääkehoidot.

Nature Medicine -lehdessä julkaistiin keväällä 2020 artikkeli, joka perustui Finngen -hankkeessa tehtyihin data-analyyseihin. Professori Samuli Ripatin tutkimusryhmä Suomen molekyylilääketieteen instituutista pystyi genomitiedon perusteella tunnistamaan suomalaisen väestöryhmän, jolla oli 60% todennäköisyys sairastua elämänsä jossakin vaiheessa sydän- ja verisuonisairauksiin tai diabetekseen. Tutkimusaineistossa oli 135 000 suomalaista näytteenantajaa. Yksittäisistä riskitekijöistä saatu tieto yhdistettiin ns. perimänlaajuiseksi riskipistemääräksi.

”Kun geneettinen tausta selvitetään, lääkärit voivat kohdentaa sekä ennaltaehkäiseviä toimenpiteitä että hoitoja tarpeen mukaan ja yhteiskunta säästää aikaa ja rahaa”, sanoo Kivinen.

”Tulevaisuudessa väestölle tehtävät seulonnat voidaan kohdentaa nykyistä paremmin. Osalle väestöstä esimerkiksi kutsu rintasyöpäseulontaan tulee perinnöllisen riskin puolesta aivan liian aikaisin, toisille puolestaan aivan liian myöhään. Kun perinnölliset riskitekijät otetaan huomioon, voidaan seulontoihin kutsua optimaaliseen aikaan syövän varhaisen havaitsemisen kannalta ja samalla minimoida toistuvista mammografioista aiheutuvaa tarpeetonta säteilyannosta.”

Genomiikka William Crochotin kuvauksen mukaisesti

Yksilölliset lääkehoidot tulevat

Ihmiset reagoivat lääkkeisiin eri tavoin, osalla lääkehoidon teho jää puutteelliseksi ja osalle se aiheuttaa haittavaikutuksia. Syynä poikkeavaan vasteeseen voivat olla fyysiset ominaisuutemme, muu lääkitys ja geneettinen perimämme. HUS e-care for me –projektin pilottivaiheessa kehitetään parempia hoitomenetelmiä leukemiaan ja muihin verisyöpiin. Kesällä 2019 aloitetussa projektissa yhdistetään Suomen molekyylilääketieteen instituutissa tuotetusta potilaskohtaisesta biologisesta datasta kliinisiin tietoihin syövän tyypistä ja leviämisasteesta ja etsitään tekoälyn avulla kullekin potilaalle sopivin lääkitys syövän leviämisen pysäyttämiseksi.

”Joskus voi käydä niin, että lääke ei tehoa tai se on lakannut tehoamasta. Leukemiapotilaiden verinäytteistä otetaan soluviljelmät ja sitten analysoidaan, mitkä lääkeaineiden yhdistelmät toimivat.”

Samasta verinäytteestä tehdään genomi- ja transkriptomi -sekvensointi. Transkriptomi antaa tietoa mahdollisten geenimuutosten aiheuttamista muutoksista geenien toiminnassa.

”Jos lääkeaine ei enää toimi, voidaan selvittää minkälaisia geneettisiä muutoksia eli mutaatioita on tullut. Toimivatko jotkut geenit tai eivät mutaation seurauksena? Entä miten mutaatio vaikuttaa aineenvaihduntareitteihin? Nyt voidaan suoraan verikokeista katsoa, mikä lääke sopii parhaiten eri verisyöpäpotilaille.”

Sairauksien diagnosointi nopeutuu huimasti

Yksikölliset lääkehoidot ovat mahdollisia, jos dataa on potilaasta tarjolla ja se on tallennettu ja esikäsitelty oikein. Suomen ELIXIR -keskus CSC ja Barcelonan supertietokonekeskus (BSC) yhdessä yhdentoista muun akateemisen ja kaupallisen toimijan kanssa, aloittivat lokakuussa 2020 European HPC Center of Excellence for Personalised Medicine (PerMedCoE) -hankkeen. Hankkeessa kehitetään algoritmeja, joilla pystytään merkittävästi lyhentämään analyysin vaatimaa laskenta-aikaa. Geeni- ja proteiinidatan analysointi nopeutuu, mikä helpottaa ja nopeuttaa sairauksien tunnistamista ja oikeiden hoitojen löytämistä. Nykyisin genomianalyysi voi kestää viikkoja tai jopa kuukausia. Superlaskennan ja oikeiden ohjelmistojen myötä esimerkiksi sairauksien diagnosointi onnistuu jatkossa tuntien tai päivien sisällä.

Tällaiset projektit ovat tärkeitä Suomen molekyylilääketieteen instituutin tutkimusryhmille, jotka ovat koko ajan tekemisissä valtavien datamäärien kanssa.

”Datan määrä kasvaa kiihtyvällä tahdilla entistä tehokkaampien laitteiden ja menetelmien myötä, sanoo Katja Kivinen. ”Tällä hetkellä datan tallennustilasta on jatkuva pula ja datan esikäsittely kestää liian kauan, jotta pääsisimme purkamaan muodostuvaa sumaa ja lähettämään valmiit datat eteenpäin tutkimusryhmille. Tietoturvallinen datan tallennus- ja käsittely-ympäristö on elintärkeä ihmisdataa käsitellessä. Kaupalliset pilvipalvelut tarjoavat turvallisia käyttöympäristöjä, mutta ovat liian kalliita useimmille tutkijoille. Lisäksi osa datoista vaatii tarkasti räätälöidyn esikäsittely- ja analyysiympäristön ja soveltuu huonosti kaupallisten pilvipalveluiden tarjoamiin vaihtoehtoihin.”

Datan käsittelyyn saadaan apua CSC:n ja FIMM:n työnjaolla. Pilottivaiheessa genomidata siirretään FIMM:istä CSC:lle huippunopean ja turvallisen valopolkuyhteyden ansiosta. Datan esikäsittely ja laadunvarmistus analyysia varten on nopeaa, koska data sijaitsee CSC:llä. CSC toimii jatkossa myös datan valtakunnallisena jakajana takaisin tutkimusryhmille.

”Aiemmin sen selvittäminen, minkälaisia genomisia muutoksia ihmisen genomissa on, on vienyt meiltä 2-3 päivää per genomi. Yhteistyön ansiosta olemme saaneet käyttöön sekventointilaitteemme valmistajalta optimoidun laskentapalvelimen, joka tiivistää yhden genomin prosessoinnin 20 minuuttiin. Tämä auttaa meitä purkamaan genomidatan käsittelyyn kertyneen jonon FIMM:issä ja vapauttamaan bioinformaatikoidemme aikaa muihin töihin – esimerkiksi erilaisten datojen integraation suunnitteluun ja mahdollistamiseen.”

CSC on kehittänyt FIMM:istä tulevan genomidatan jakamiseen suomalaisten tutkimusryhmien käyttöön yhteisen käyttöliittymän CSC:n Allas-palveluun. Tutkimusryhmät saavat viestin, kun heidän genomidatansa on valmis ja siirtävät sen omalle projektialueelleen CSC:n ePouta -ympäristössä. Pilottivaiheen jälkeen portaalin toimintaperiaatetta on tarkoitus tarjota laajemmin kaikille omiikka -dataa tuottaville tutkimusryhmille suomalaisissa yliopistoissa.

”Käyttöliittymä on meille elintärkeä mm. siksi, että datamäärän kasvun ja toisaalta tietoturvavaatimusten kiristymisen myötä meidän on yhä vaikeampi ylläpitää FIMMissä datan tallennus- ja prosessointiympäristöä.. Meidän on pakko alkaa siirtää enenevässä määrin raakadataa tai käsiteltyä dataa CSC:lle, josta tutkimusryhmät voivat ottaa sen käyttöönsä.”

Toinen tärkeä kehityskohde Kivisen mukaan ovat mikroskooppien tuottaman datan talllentamisen ja siihen liittyvät kuvantamispalvelut.

”Kuvien prosessointi tapahtuu yleensä itse instrumenttiin liitetyllä palvelimella, jossa on prosessointiin tarvittavat ohjelmistot. Prosessoinnin siirtäminen pilvipalveluun ei aina ole varteenotettava vaihtoehto varsinkaan koko maassa liian hitaan siirtonopeuden vuoksi. Kuvien prosessointi saattaa siis jatkossakin tapahtua ”paikan päällä”, mutta prosessoidun datan jakamisen tulisi mielestäni siirtyä genomidatan tapaan CSC:n jaettavaksi.”

Ari Turunen

10.11.2020

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Katja Kivinen, & Tommi Nyrönen. (2020). Bioinformatics to revolutionise healthcare: Efficient data processing speeds up diagnoses and enables personalised drug treatments. https://doi.org/10.5281/zenodo.8135131

Lisätietoja:

Suomen molekyylilääketieteen instituutti FIMM

https://www.fimm.fi/en/

Cleverhealth

https://www.cleverhealth.fi/fi/ecare-for-me

+1 million genomes

https://ec.europa.eu/digital-single-market/en/european-1-million-genomes-initiative

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

ELIXIR Compute Platform -laskentaympäristö bio- ja terveystieteille

ELIXIR on rakentanut tutkijoille monipuolisen laskenta-alustan, jossa on useita tutkijoille tärkeitä palveluja. Käyttöluvan saatuaan tutkija voi alustalla hyödyntää laskennan lisäksi useita datalähteitä sekä tallentaa, siirtää ja analysoida dataa. Kaikki palvelut yhdistyvät saumattomaksi työnkuluksi.

ELIXIR Compute Platform (ECP) rakennettiin vuosien 2015-2019 aikana biolääketieteiden tarpeisiin. ECP on maantieteellisesti hajautettu alusta, jossa ELIXIR keskukset toimivat yhdessä biologisen tiedon hallinnan palveluiden tuottamiseksi. Keskukset toimivat itsenäisesti, mutta niitä yhdistää käyttäjien tunnistaminen ja valtuutus (AAI), jolla pilvipalvelut ja laskenta sekä tallennus- ja tiedostonsiirtopalvelut voidaan koordinoida. Tutkija kirjautuu järjestelmään, joka tunnistaa tutkijan sähköisen identiteetin ja samalla antaa eri tasoisia käyttöoikeuksia biolääketieteelliseen dataan. Tutkijat voivat tämän jälkeen luoda tietoturvallisen analyysiympäristön käyttämilleen ohjelmistoille. Data on eurooppalaisella pilvilaskenta-alustalla. Käyttöympäristö myös auttaa tutkijaryhmiä luomaan skaalautuvia palveluja.

Tuhannet tutkimuslaboratoriot tuottavat massiivisia määriä dataa. Datan monimutkaisuus myös kasvaa, mikä on suuri haaste. Dataa pitää hallinnoida siten, että kaikki käyttäjät ymmärtävät ja käsittelevät sen samalla tavalla. Tehokas datanhallinta edellyttää federaatiota, jolla on hallussaan infrastruktuuri, jossa käyttäjä pääsee siirtämään, vaihtamaan, käsittelemään ja analysoimaan dataa. Siksi ECP kehitettiin yhteistyössä eri ELIXIR-keskusten ja eurooppalaisten tutkimusinfrastruktuurien kanssa. ECP:n tutkijoille tarkoitetut palvelut rakennettiin yhteistyössä neljän eri tieteellisen käyttäjäyhteisön kanssa. Näitä olivat merien mikrobien, viljely- ja metsäkasvien, ihmisten geenien ja harvinaisten sairauksien tutkijat.

ECP:ssä olevia palveluja tarjoavat eri ELIXIR-keskukset. ELIXIRin AAI-palvelu (Authentication and Authorisation Infrastructure) mahdollistaa sen, että käyttäjien tunnistaminen ja käyttöoikeuksien myöntäminen on sähköistä. Pääsystä dataan päättää aina datan tai laskentapalvelun omistaja, mutta AAI:n avulla pääsy dataan nopeutuu ja datan käyttöpolitiikka ja analysointi on selkeää ja suoraviivaista käyttäjälle.

Datan siirtoon käytetään suuritehoista verkkoa ja ohjelmistojen avulla sen päälle rakennettuja rajapintoja, eräänlaisia dataputkilinjoja (data pipeline). Niillä hoidetaan datan siirto paikasta toiseen sekä datan prosessointi ja analysointi. Datavirrat jaetaan pienempiin osiin ja niitä prosessoidaan rinnakkain, jolloin saadaan lisää laskentatehoa ja siirto tapahtuu ilman pullonkauloja ja viiveitä. Analyysejä voidaan suorittaa hajautetusti. Jos data on sensitiivistä tarvitaan tietoturvafederaatiota.

Datatiedostojen siirtäminen eri paikkojen välillä on ECP:n keskeisiä toiminnallisuuksia. Tällä hetkellä on 1800 erilaista biologista tietokantaa, jotka tallentavat tiedot erilaisiin formaatteihin ja standardeihin sekä kuvaavat ja luokittelevat talletetun datan eri tavoin. ECP:ssä eri lähteistä saatu data on kuvailtu yhteismitallisesti. Datan siirtoon käytetään suurtehoista verkkoa ja ohjelmistojen avulla sen päälle rakennettuja rajapintoja, dataputkilinjoja (data pipeline). Niillä hoidetaan datan siirto paikasta toiseen sekä datan prosessointi ja analysointi.

ECP:ssä oli vuonna 2019 käytössä 50 000 teratavua tallennuskapasiteettia. Se tarjosi 80 000 erillistä laskentaydintä, prosessointia tekevää yksikköä. Vuodesta 2017 vuoteen 2019 tallennuskapasiteetti kaksinkertaistui ja hajautetun laskennan resurssit lisääntyivät 33%. Vuonna 2019 ECP:llä oli 3100 käyttäjää.

Merien metagenomiikka

Mikrobiyhteisöt vaikuttavat ihmisten ja eläinten elämään ja ovat tärkeitä eri ekosysteemeille. Kuitenkin vain pieni osa mikrobeista on luokiteltu ja analysoitu. Mikrobiyhteisöjen genetiikan tutkiminen on synnyttänyt uuden biotieteen alan, metagenomiikan. Joukko ympäristöstä noukittuja ja sekvensoituja geenejä voidaan analysoida samalla tavoin kuin yksittäisen lajin genomia eli perimää.

Valtameret ovat maailman suurin yhtenäinen ekosysteemi. Planktonin merkitys maailman ilmastolle on vähintään yhtä merkittävä kuin sademetsien. Kuitenkin vain pieni osa niistä organismeista, jotka luovat tämän ekosysteemin, on luokiteltu ja analysoitu. Planktoneiden muodostamat ekosysteemit sisältävät valtavasti elämää: yli 10 miljardia organismia on jokaisessa litrassa valtameren vettä sisältäen viruksia, prokaryootteja, yksisoluisia eukaryootteja ja polttiaiseläimiä. Nämä ainutlaatuiset organismit sisältävät bioaktiivisia yhdisteitä, joille on käyttöä lääketeollisuudessa, elintarvikkeina, kosmetiikassa, bioenergiassa ja nanoteknologiassa. Vuosina 2009-2013 kansainvälinen tutkimusmatka Tara Oceans keräsi 210 mittauspaikasta maailman valtameristä 35 000 biologista näytettä. Se on laajin planktonista kerätty kokoelma.

ELIXIR rakensi pysyvän julkisen datavarannon, jotta voitaisiin parantaa merestä saatujen metagenomiikkanäytteiden tunnustamista ja kartoitusta. Tunnistamiseen tarvittavat työkalut ja datan prosessoinnin dataputket tehtiin mahdollisiksi siirtää eri alustoille. Näin voidaan saada käyttöön uusia biokemiallisia materiaaleja, kuten entsyymejä ja lääkeainemolekyylejä. Työkaluja ja dataputkia voidaan käyttää eri ELIXIR-keskusten (Norja, EMBL-EBI, Suomi, Tsekki, Ranska) kautta.

Ihmisdatan kontrolloitu siirtäminen yli rajojen

Euroopan genomiarkisto EGA on yksi maailman laajimmista julkisista datavarastoista, joihin on tallennettu potilasdataa biolääketieteellisistä projekteista. Arkistoon on tallennettu erilaisia tietoaineistoja eri datan tuottajilta. EGA tallentaa ihmisistä kerättyä geno- ja fenotyyppidataa erikseen kysyttävällä suostumuksella. ELIXIR Compute Platform mahdollistaa EGA:ssa olevan luottamuksellisen ihmisdatan siirtämisen luvan saaneille yksittäisille käyttäjille.

ECP:n kautta tutkijat voivat hakea pääsyoikeutta EGA:n sensitiivisiin datakokoelmiin. Ensin käyttäjä tunnistetetaan sähköisesti, ja pääsyoikeus joko hyväksytään tai hylätään hakulomakkeen tietojen perusteella. Jos palvelu edellyttää monivaiheista tunnistautumista, käyttäjä uudelleenohjataan tunnistuspalveluun, joka suorittaa ylimääräisen tunnistuksen käyttämällä toista turvatekijää.

Tutkijoilla on sen jälkeen pääsy EGA:n datavarastoihin ja he voivat prosessoida sensitiivistä dataa. ECP:n kautta tutkijat voivat myös tallentaa dataa EGA:n arkistoon. ECP:n ansiosta voidaan varmistaa datan kuvailu, pääsy dataan ja yhteentoimivuus. Jotta data siirtyy turvallisesti, luotiin arkkitehtuuri, jossa on käytössä kaksi protokollaa. Oauth.2.0 ja OpenID Connect (OIDC) ovat teollisuuden käyttämiä käyttäjäntunnistusprotokollia.

Viljely- ja metsäkasvien genomisen ja fenotyyppisen datan integrointi

FAO:n mukaan kasvitaudit aiheuttavat vuosittain maailman ravinnontuotantoon noin 20-40% leikkauksen. Massiivinen viljely- ja metsäkasvien sekvensointi mahdollistaa kasvitautien aiheuttajien tutkimisen. Kasvien sekvensointi ja genotyypitys mukaan lukien patogeenit ja taudit tuottavat laajoja määriä perinnöllistä vaihteludataa. EURISCO (European Search Catalogue for Plant Genetic Resources ) sisältää informaatiota 1,9 miljoonasta viljelykasvista ja sen villeistä sukulaisista. Näytteet on kerätty lähes 400 eri organisaatioon.

ECP mahdollistaa genotyyppi-fenotyyppi-analyysin viljelykasveille perustuen laajimpiin saatavilla oleviin julkisiin datavarantoihin. Tämä data on tuotu yhteen maantieteellisesti eri paikoissa sijaitsevista tutkimuslaitoksista. Keskeinen toiminnallisuus on hakurobotti, joka vastaanottaa hakuja käyttäjiltä ja siirtää integroidut, eri datalähteistä kerätyt hakutulokset takaisin käyttäjälle. Käyttäjät voivat siirtää valitun datan pilvi-infrastruktuuriin analyyseja varten.

ELIXIR-infrastruktuurin integroiminen harvinaisen tautien tutkimiseen

Noin 30 miljoonaa ihmistä 25 EU-maassa sairastaa jotakin harvinaista tautia, arvioi EURORDIS (European Organisation of Rare Diseases). Se tarkoittaa 6-8% koko EU:n asukkaista. Kansainvälinen harvinaisten tautien tutkimuskonsortio on asettanut tavoitteeksi kehittää 200 uutta hoitomuotoa harvinaisille taudeille vuoteen 2020 mennessä.

ELIXIR julkaisi kustomoidun kokoelman työkaluja ja palveluja, joiden tarkoitus on auttaa uusien hoitomuotojen kehittämisessä. Kokoelma on saatavilla ELIXIR biotools-palvelun kautta (bio.tools). Harvinaisten tautien tutkijat voivat jättää sisään raakadatan, ajaa geenikartoituksen ja noukkia gvcf-tiedostot (genomic variant call format) analyysiä varten. Se määrittelee bioinformatiikassa käytetyn tekstitiedoston, kun geenisekvenssivariaatioita tallennetaan.

Potilaaseen liittyvä metadata (sairauden, hoidot, hoitotulokset), potilasnäytteet biopankeissa ja kaikki EGA:n data on haettavissa ECP:n kautta.

Ari Turunen

2.12.2019

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, & Tommi Nyrönen. (2019). ELIXIR Compute Platform for life and health sciences. https://doi.org/10.5281/zenodo.8131182

Lisätietoja:

Kataja, Teemu (2018): Designing and developing a data processing pipeline for archiving sensitive human data.

https://www.theseus.fi/handle/10024/142007

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Bioinformatiikan uudet menetelmät ja tekniikat edellyttävät jatkuvasti päivittyvää kurssitarjontaa ja analyysiohjelmistoja

Biolääketieteen menetelmät kehittyvät koko ajan. Uudet mittausinstrumentit tuottavat valtavasti dataa, jota pitäisi osata analysoida oikein. Jatkuvassa muutoksessa ja kehityksessä oleva biolääketiede tarvitsee myös asiantuntijoita, jotka osaavat kouluttaa alan tutkijoita uusiin analyysimenetelmiin.

ELIXIR-Suomen koulutuskoordinaattori Eija Korpelainen on jo vuosia opettanut tutkijoita käyttämään datankäsittelyohjelmistoja- ja menetelmiä.

”Bio- ja lääketieteen opintoihin ei kuulu kovin paljon data-analyysia. Nykyaikaisten mittausmenetelmien hyödyntäminen tutkimuksessa vaatii kuitenkin vahvaa osaamista data-analyysissa, joten koulutan tutkijoita analysoimaan dataa. Koska esim. geenien säätelydataa analysoidaan eri menetelmillä kuin geenien aktiivisuusdataa, tarvitaan paljon erilaisia kursseja. ELIXIR järjestää myös koulutusta kouluttajille.”

Näiden kurssien sisältöjä ja opetusmateriaaleja on saatavilla ELIXIRin TeSS-koulutusportaalissa. Siellä on nähtävissä ELIXIRin eri jäsenorganisaatioiden tarjoamaa bioinformatiikan kurssitarjontaa. Mukana on myös kurssitarjontaa ja –materiaalia ELIXIR-organisaatioiden ulkopuolelta.

ELIXIR EXCELERATE scRNA-seq -kurssi. Suomen ELIXIR-keskus CSC järjestää keskimäärin 15 bioinformatiikan kurssia vuodessa. scRNA-seq -menetelmästä kävi vuoden 2019 toukokuussa puhumassa 10 kansainvälistä asiantuntijaa. Esitelmät videoitiin ja niitä on katsottu puolessa vuodessa (kesäkuu-lokakuu 2019) yli 3000 kertaa.

Suurikapasiteettinen sekvensointi

Kursseja pitää päivittää koko ajan johtuen bioinformatiikan menetelmien nopeasta kehityksestä. Tämä asettaa paineita myös CSC:ssä kehitetyn Chipster-analyysiohjelmiston kehitykselle, sillä uusia analyysityökaluja täytyy lisätä jatkuvasti. Korpelainen mukaan jopa ohjelmiston nimi pitäisi päivittää:

”Chipster-nimi viittaa mikrosiruihin, jolla analysoidaan geenien aktiivisuutta. Nykyään geenien aktiivisuutta voidaan tutkia sekvensoinnilla. Suurikapasiteetttinen sekvensointi, HTS (high throughput sequencing) viittaa uusin laitteisiin ja menetelmiin, joilla sekvensointi tehdään entistä nopeammin ja tehokkaammin.”

HTS-tekniikoilla voidaan tutkia monia asioita. Sekvenoimalla esim. genomin proteiineja koodaavia alueita eli eksomeita voidaan selvittää sairauksiin liittyviä geenivariantteja.

Chipster-alusta sisältää yli 400 analysointityökaluja ja laajan kokoelman referenssidataa. Chipster-ohjelmistolla käyttäjät voivat analysoida, visualisoida ja jakaa dataa interaktiivisesti.

”Mittausteknologia muuttuu koko ajan. Data on myös erityyppistä, joten sitä pitää analysoida eri tavoin. Tämän vuoksi Chipsteriinkiin pitää lisätä uusia työkaluja jatkuvasti” sanoo Eija Korpelainen.

Chipster on tieteenala-agnostinen alusta, sillä siihen voidaan integroida mitä tahansa analyysityökaluja. Esimerkiksi CSC:llä on Chipsteristä erillinen versio kielitieteen analyyseihin.

Yksittäisen solun sekvensointi

Nature-lehti valitsi yksittäisen solun sekvensoinnin vuoden tieteelliseksi menetelmäksi 2013, ja se on mittausteknologioiden kehittyessä tullut jokaisen tutkijan saataville. Yksittäisen solun RNA-sekvensointi (scRNA-seq) voi paljastaa monimutkaisia ja harvinaisia solupopulaatioita. Se mittaa kaikkien geenien aktiivisuudet jokaisessa solussa erikseen, joten saadaan tarkempi kuva solujen eroavaisuuksista.

Yksittäisen solun RNA-sekvensointia voidaan hyödyntää analysoidessa kuinka transkriptomi (solun sisältämien lähetti-RNA -molekyylien joukko) muuttuu. Ensimmäinen tällainen analyysi julkaistiin vuonna 2009 ja siinä kuvailtiin soluja varhaisissa kehitysvaiheissa.

”Ekspressioprofiilien avulla voidaan esimerkiksi löytää syöpäsoluja ja saada tietoa lääkeresistenssistä tai syöpähoitojen vasteesta.”

Chipster-ohjelmistossa on tarjolla paljon scRNA-seq- analyysityökaluja.

http://bit.ly/scRNA-seq

Kurssitarjonta muuttuu koko ajan

scRNA-seq ja HTS-tekniikat ylipäätään ovat hyviä esimerkkejä siitä, miten nopeasti tutkimus menee uusien keksintöjen kautta eteenpäin. Jotta tutkijat saisivat kaiken hyödyn irti uusista tekniikoista, niiden tuottamaa dataa on osattava analysoida uusimpia menetelmiä käyttäen. Koulutusta siis tarvitaan paljon, ja ELIXIRin tarjoama kurssitarjonta on tästä hyvä osoitus.

”Joudumme päivittämään koko ajan olemassa olevia kursseja ja tekemään uusia”, sanoo Eija Korpelainen ja kertoo, että bioinformatiikan kehittyvien menetelmien seuraaminen on haastavaa mutta kiinnostavaa.

”On mielenkiintoista jutella eri asiantuntijoiden kanssa ja lukea artikkeleita, joissa on puolueettomasti vertailtu eri menetelmiä. Bio/lääketieteen data-analyysi on nykyään niin haastavaa, että se on houkutellut paljon tilastotieteilijöitä juuri tälle alalle.”

Ari Turunen

25.11.2019

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Eija Korpelainen, & Tommi Nyrönen. (2019). New bioinformatics methods and measurement technologies call for continuously updated courses and analysis software. https://doi.org/10.5281/zenodo.8131176

Lisätietoja:

http://bit.ly/scRNA-seq

https://tess.elixir-europe.org

http://chipster.csc.fi

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Sydän- ja verisuonitautien riskiarviointi kaikille kansalaisille

Sydän- ja verisuonitaudit ovat yleisin kuolinsyy maailmassa. Suomessa yli kolmannes kuolemista johtuu sydän- ja verisuonitaudeista. Nyt tavoitteena on saada terveysdatan perusteella arvio jokaisen sairastumisriskistä Suomessa ennen lääkärillä käyntiä.

Andrea Ganna, Suomen molekyylilääketieteen instituutin (FIMM) ryhmän vetäjän ja Harvardin lääketieteellisen koulun opettaja, haluaa perustaa maanlaajuisen yksilöllisen riskiarvioinnin, joka olisi perustana, joilla voisi suunnitella julkisen terveydenhallinnon toimenpiteitä. Arviointi perustuu kansalaisten terveys, väestö- ja geenitietoon. Arviointi, joka hyödyntää teköälyä, parantaa ehkäisevien hoitojen kohdentamista nykyistä halvemmalla kustannustasolla.

“Pohjoismailla ja erityisesti Suomella on tähän ainutlaatuinen mahdollisuus ja miljöö, sillä nämä maat ovat keränneet terveys- ja väestödataa vuosia. Mutta tapa, jolla dataa on aiemmin kerätty, on jossain määrin vanhentunut. Datasta on katsottu vain tiettyjä riippuvuussuhteita ja yhteyksiä. Kuitenkin uudet menetelmät, kuten tekoäly, ovat tulossa ja antavat mahdollisuuden suurempaan ja kunnianhimoisempaan visioon.”

Andrea Ganna ja hänen tutkimusryhmänsä kehittävät tekoälyyn (AI) perustuvia lähestymistapoja yksittäisen ihmisen terveyshistorian mallintamiseksi.

“Jokaisella henkilöllä on tietynlainen terveys- ja lääkintähistoria. Haluamme tietää, onko muilla samantyyppisiä seurantatietoja. Heitä voi olla tuhansia. Me hyödynnämme näiden ihmisten terveystietoja ja selvitämme, mitä heille tapahtui. Näin autamme alentamaan sairastumisriskiä. Voimme käyttää kaikkea tätä dataa aiempaa paljon kokonaisvaltaisemmalla tavalla auttaaksemme julkista terveyshallintoa ja antaaksemme potilaille ja lääkäreille enemmän tietoa päätöksenteon tueksi.”

Riskiarvointi ennen lääkärikäyntiä

Andrea Ganna on kiinnostunut epidemiologiasta, genetiikasta ja tilastotieteestä. Hän on keskittynyt hyödyntämään suuria epidemiologisia aineistoja tunnistaakseen yhteiskunnallis-väestötieteellisiä, metabolisia ja geneettisiä tunnusmerkkejä, jotka ovat yleisten ja monimutkaisten tautien taustalla. Bostonissa ollessaan hän työskenteli laajojen eksomi- ja genomisekvenssidata-aineistojen parissa.

Gannan mukaan sydän- ja verisuonitaudit sopivat täydellisesti tekoälyn tekemiin analyyseihin, koska näiden tautien hoito on ennaltaehkäisevää.

“Tarkka korkean riskin yksilöiden tunnistaminen on yksi kulmakiviä kardiometabolisten sairauksien ennaltaehkäisyssä”, hän sanoo.

”Kuitenkin tällä hetkellä kardiometabolisten sairauksien riskitekijöiden arviointi edellyttää potilailta käyntiä lääkärillä lipidimittauksessa.”

Lipidi on yleisnimitys kaikille veressä kiertäville rasvoille ja rasvan kaltaisille aineille. Keho varastoi ravinnosta saatua rasvaa tulevaan käyttöön. Runsasrasvainen ruokavalio saa rasvan kiinnittymään valtimoiden seinämiin, mistä aiheutuu sydän- ja verisuonitauteja sekä valtimotauteja. Lipidimittauksessa saadaan selville, millaisia rasvoja testattavalla on elimistössään. Lipidimittaus on tehokas, mutta ongelma on, että osa väestöstä ei tiedä kuuluvansa riskiryhmään.

Ganna haluaa mullistaa sairausten ennaltaehkäisyn tarjoamalla riskiarvioinnin potilaalle ennen kuin hän menee lääkärin vastaanotolle.

“Jotkut eivät yksinkertaisesti mene lääkärille ja paljon ihmisiä puuttuu. Mutta koska kaikki lääkitykseen ja diagnooseihin liittyvä data on jo kerätty, voimme tunnistaa korkean riskin potilaat ennen kuin he menevät lääkärille. Voimme tehdä sydän- ja verisuonitautien riskikartan koko maasta mukaanlukien kaikki yksittäiset henkilöt.”

Riskilaskelma tehdään mallintamalla sairauksien ja lääkitysten pitkittäisseurannasta saatua dataa yhdessä geeni-, perhe- ja väestödatan kanssa.

“Yritämme ymmärtää, kuinka genetiikka vuorovaikuttaa sellaisen datan kanssa, joka saadaan lääkityksistä, diagnooseista, väestöstä ja perheestä. Tämä voi antaa ennennäkemättömän kokonaisvaltaisen näkökulman yksilön terveydentilaan.”

Ganna antaa esimerkin.

“Kun katkaiset jalkasi, menet lääkärille. Kuitenkin tänä päivänä lääkäri katsoo vain jalkaasi, vaikka samalla käynnillä voisit saada hyötyä myös muusta tiedosta. Me voimme informoida lääkäriä muista riskeistä, joita potilaalla on perustuen kerättyyn dataan. Voimme laskea ennalta potilaan muut riskit, kuten esimerkiksi, jos hänellä on korkea riski sydän- ja verisuonisairauksiin. Siten, samalla käynnillä, lääkäri voi myös antaa neuvoja tai ohjata potilaan asiantuntijalle.”

Genetiikka on hyödyllistä

Suomalaisia koululaisia. Ehkä kaikkein tärkein väestöryhmä on nuoret, jotka eivät käy usein lääkärillä. Genetiikka on erityisen arvokasta, koska genetiikan avulla voidaan tavoittaa riskit varhaisemmalla iällä kuin muilla riskifaktoreilla. FinnGen-tutkimus hyödyntää näytteitä, joita on kerätty biopankkeihin koko maasta. Tutkimus perustuu yhdistämällä genomitietoa digitaaliseen terveysdataan, joka saadaan kansallisista terveydenhuollon rekistereistä.

Ganna päätti tulla Suomeen laajan geeniprojektin, FinnGenin takia.

Elokuussa 2017 alkaneessa projektissa taltioidaan puolen miljoonan suomalaisen genomit. Hankkeessa hyödynnetään kaikkien suomalaisten biopankkien keräämiä näytteitä. Perimästä saatava data yhdistetään kansallisissa terveydenhuollon rekistereissä olevaan tietoon. FinnGen on yksi ensimmäisiä näin laajassa mittakaavassa tehtyjä erittäin yksilöllistettyjä lääketieteen projekteja. Julkisten ja yksityisten organisaatioiden yhteistyö on poikkeuksellista.

“Suomessa on sopiva lainsäädäntö, joka antaa pääsyn maanlaajuiseen populaatiodataan. Minulle tämä on ainutlaatuinen kattaus.”

Ganna ja hänen tutkimusryhmänsä integroivat rekistereissä olevan tiedon ja biopankkeihin tallennetun laajan tutkimustiedon auttaakseen tunnistamaan yksilöryhmiä, jotka voisivat eniten hyötyä olemassaolevista farmakologisista toimenpiteistä.

“Ehkä tärkein ryhmä on nuoret yksilöt jotka eivät käy lääkärissä kovinkaan usein. Nykyiset riskitekijät eivät toimi hyvin tässä ryhmässä. Genetiikka on erityisesti arvokasta, koska sen avulla voidaan löytää sairastumisen riskitekijät aikaisemmalla iällä verrattuna muihin riskitekijöihin. Ensimmäinen askel on ymmärtää, miten ihmiset hahmottavat tämän tiedon. Meidän täytyy varmistaa että lääkärit käyttävät dataa oikealla tavoin ja mitä sillä voidaan tehdä.”

Syvä- ja koneoppiminen

Terveydentilan seurantatiedot mahdollistavat niiden yksilöiden tunnistamisen, joilla on korkea riski sairastua sydän-ja verisuonisairauksiin, mutta vain jos käytettävissä oleva tieto on maanlaajuista.

Gannan tavoitteena on integroida kansalliset ja alueelliset rekisterit syvä- ja koneoppimiseen.

“Perinteisillä menetelmillä on etunsa, sillä ne ovat suhteellisen yksinkertaisia ja helppoja tulkita, mutta ne eivät skaalaudu. Viimeisten 20 vuoden aikana yli 500 miljoonaa lääketieteellistä diagnoosia on tehty suomalaisista. Puhumme valtavista datajoukoista. Joka vuosi tehdään miljoonia uusia lääkemääräyksiä ja diagnooseja. Tämän skaalaamiseksi ja hyödyntämiseksi tarvitaan syväoppimisen menetelmiä.

Keinotekoiset neuroverkot ovat tehokkaita koneoppimisen algoritmeja, joita voidaan hyödyntää hahmontunnistamisessa. Takaisinkytkeytävät neuroverkot (recurrent neural network) voivat hyödyntää niiden sisäistä muistia syötejonojen käsittelyssä. Tämä tekee niiistä soveltuvia sellaisiin tehtäviin, kuten segmentoitumattomaan tunnistamiseen. Ganna haluaa laajentaa nämä neuroverkot käyttämäänsä dataan.

”Voidaan ajatella, että terveydentilaa kuvaavien tapahtumien muutosjono, jota yritämme mallintaa, on ”tekstiä”, jossa jokainen sana on erilainen koko elämän aikana ollut tauti, lääkitys, väestötieteellinen tapahtuma jne. Nämä ovat luonnollisesti sovitettu mallintamaan muutosta kuvaavaa tapahtumaketjua, esimerkiksi niitä käytetään ennustamaan seuraavaa todennäköisintä sanaa tekstiviestissä.”

Syväoppimisen menetelmät edellyttävät suurta supertietokoneinfrastruktuuria.

”CSC on luonut turvallisen ympäristön laskentaan. Ilman turvallista superlaskennan ympäristöä, emme voisi toteuttaa tätä projektia. Onnistuaksemme me tarvitsemme yhtäältä tutkimusta ja kehitystyötä ja toisaalta tehokasta laskentaympäristöä.”

Henkilökohtainen data on suojeltu

Potilasdata on tärkeää tutkimukselle, mutta henkilökohtainen data on myös suojeltua. Esimerkiksi Suomen molekyylilääketieteen instituutissa kehitetty VEIL.AI anonymisoi potilasdatan perinteisiä menetelmiä tehokkaammin, nopeammin ja informaatiota paremmin säilyttäen. Tarvittaessa sovelluksen avulla voidaan tuottaa myös synteettistä, täysin anonyymia eli siis yksittäisestä henkilöstä erillään olevaa tilastollista dataa.

“Meillä on tarve taata yksilöiden yksityisyys, mutta samalla meidän täytyy integroida paljon henkilökohtaista dataa, jotta voisimme todella hyötyä tekoälystä ja syväoppimisen lähestymistavoista ja jotta voisimme kohdentaa tulokset parempiin julkisen terveydenhuollon toimenpiteisiin. Luomalla synteettisiä terveystiedon historioita autetaan kunnioittamaan yksityisyyttä, mutta samaan aikaan pystytään yhdistämään paljon persoonakohtaista tietoa ei pelkästään Suomessa vaan Pohjoismaiden välillä.”

“Toivon, että rutiininomaisesta terveydenhuollossa kerätty persoonakohtainen data voi auttaa ja hyödyntää kaikkia. Toivon, että tämä tieto voi auttaa lääkäreitä tekemään parempia päätöksiä ja myös motivoimaan potilaita elämäntapamuutoksiin. Siten kaikki auttavat kaikkia.”

Ari Turunen

30.9.2019

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Andrea Ganna, & Tommi Nyrönen. (2019). Risk assessment of cardiovascular diseases for all citizens. https://doi.org/10.5281/zenodo.8131074

Lisätietoja:

FIMM

Suomen molekyylilääketieteen instituutti (FIMM) on kansainvälinen tutkimuslaitos, jonka toiminta keskittyy sairauksien molekyylitason mekanismien selvittämiseen genetiikan ja lääketieteellisen systeemibiologian menetelmin. Tavoitteena on tutkimustiedon siirtäminen terveydenhuollon käyttöön mm. henkilökohtaista lääketiedettä edistämällä.

www.fimm.fi

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Verisuonten mallintamisella täsmähoitoa laskimosairauksiin

Lauri Eklund tutkii verisuonten kasvun ja toiminnan häiriöitä. Tavoitteena on mm. kehittää laskimosairauksiin täsmähoitoja.

Laskimosairaudet ovat kroonisia ja eteneviä verisuonimuutoksia joiden syy on usein tuntematon. Esimerkiksi laskimoverenkierron häiriöt ovat yleisiä, näkökykyä heikentäviä häiriöitä silmän verkkokalvossa. Laskimoepämuodostumat puolestaan ovat harvinaisia synnynnäisiä verisuonten kehityshäiriöitä. Professori Lauri Eklundin tutkimusryhmän tavoitteena on tunnistaa fysiologisia mekanismeja, jotka säätelevät verisuonien erilaistumista laskimoiksi. Ryhmässä tutkitaan myös solu- ja molekyylitason häiriöitä laskimoepämuodostumissa.

”Hiussuonten muodostumisen ja valtimoiden erilaistumisen perusmekanismit tunnetaan suhteellisen hyvin, sitä vastoin laskimoiden erilaistumiseen liittyy vielä monia avoimia, kiinnostavia biologisia kysymyksiä. Lisäksi verisuonisairauksien molekyylitason mekanismien paljastaminen on välttämätöntä, jotta voitaisiin kehittää täsmällisiä lääkkeitä sairauksien syitä vastaan.”

Eklund tutkii Biocenter Oulussa ja Oulun yliopiston biokemian ja molekyylilääketieteen tiedekunnassa laskimojen kehittymistä sääteleviä mekanismeja geneettisesti muunnelluissa hiirissä sekä soluviljelmissä, joissa mallinnetaan potilaista löydettyjä mutaatioita ja verisuonten muodostukseen liittyviä ilmiöitä.

Laskimoverenkierron häiriöt silmän verkkokalvossa voivat johtaa näkökyvyn heikkenemiseen tai jopa sen menettämiseen. Eklundin tutkimusryhmä on vastikään löytänyt ensimmäisen kasvutekijän, joka tarvitaan laskimoiden muodostumiseen hiiren verkkokalvolla. Kasvutekijä on proteiini, joka stimuloi solujen kasvua tai erilaistumista. Kasvutekijät toimivat myös solujen välisinä viestimolekyyleinä.

”Kyseessä on vielä huonosti tunnettu kasvutekijä nimeltä angiopoietiini-4 (Angpt4). Se säätelee TIE2 -reseptorityrosiinikinaasin toimintaa verisuonten sisäpintaa verhoavissa endoteelisoluissa.”

Verkkokalvon laskimoita, hiussuonia ja hermotukisoluja. Verisuonten kehityksen, uudismuodostuksen ja läpäisevyyden säätelyssä avainasemassa ovat angiopoietiini (Angpt 1-4) kasvutekijät sekä niiden endoteelisolukalvoreseptori Tie2. Tie2-reseptoriin sitoutuva Angpt4 vaikuttaa erityisesti silmän laskimoverisuonten muodostumiseen. Kuvassa hiiren verkkokalvon verisuonia ja siihen liittyviä soluja. Biocenter Oulussa hyödynnetään kehittynyttä mikroskooppikuvantamista, jonka avulla voidaan esimerkiksi analysoida solu- ja molekyylitapahtumia normaalissa kehityksessä sekä löytää syitä sairauksille ja kehityshäiriöille. Laser-skannaus konfokaalimikroskooppikuva. Harri Elamaa)

TIE2-reseptori ja häiriöt solujen viestinsiirrossa

TIE2/Angiopoietiini-soluviestinvälitysreitin tunnistaminen laskimoiden normaalissa kehittymisessä on Eklundin mukaan erittäin kiinnostava löytö.

”Samaisen TIE2-reseptorin päällelukkiutumiseen johtavat somaattiset mutaatiot aiheuttavat ihmisissä esiintyvistä laskimoepämuodostumista merkittävän osan. Toinen yleisesti muuttunut geeni on PIK3CA, joka vastaa PI3K-lipidikinaasin aktivoivaa alayksikköä.

Sekä TIE2 että PI3K ovat kinaasientsyymejä, jotka säätelevät proteiinien toimintaa fosforylaatiolla. Solut käyttävät tätä mekanismia normaalissa viestinsiirrossa.

”Yhteistyössä Miikka Vikkulan ryhmän kanssa (de Duve-instituutti, Bryssel, Belgia) olemme osoittaneet, että solukalvoreseptori TIE2 ja solun sisäinen viestinsiirtäjä PI3K ovat samassa viestinvälitysketjussa. Mutaation aikaansaama kinaasiosan päälle kytkeytyminen joko TIE2:ssa tai PI3K:ssa aiheuttaa samanlaisia solu- ja verisuonimuutoksia. Mutaatioiden vaikutukset ovat aktivoivia, jolloin TIE2/ PIK3 signaalireitti virheellisesti lukkiutuu päälle.”

Yhdessä nämä havainnot viittaavat Eklundin mukaan siihen, että Angpt4-/TIE2/PI3K -signaalireitillä on laskimoiden muodostumisessa erityinen rooli. Laskimoepämuodostumilla on myös yllättävä yhteys syövän kehittymiseen. DNA:ssa on tiettyjä kohtia (ns. hotspot) joissa tapahtuvat mutaatiot rikastuvat tietyissä sairauksissa.

”Samat hot spot– mutaatiot lipidikinaasi PI3K:n aktivoivan alayksikön geenissä (PIK3CA) aiheuttavat merkittävän osan laskimoepämuodostumista, mutta myös monia syöpiä. On erittäin kiinnostavaa, mutta samalla puutteellisesti ymmärrettyä, kuinka samat PIK3CA -mutaatiot aiheuttavat erilaisia pahanlaatuisia syöpiä epiteelisoluissa ja ”vain” laskimoiden liikakasvua endoteelisoluissa.”

Osa verisuonten kehityshäiriöistä on lähinnä kosmeettisia ”syntymämerkkejä”, jotka myös paranevat itsestään. Tällaisia ovat synnynnäiset hemangiooma-ongelmat, ”mansikkaluomet”, joiden alun perin liiallinen endoteelisolujen jakautuminen ja kapillaariverisuoniston muodostuminen vähenee lasten vanhetessa. Hemangioomat ovat itse asiassa yleisin itsestään parantuva, hyvänlaatuinen kasvain, joka tavallisesti huomataan muutaman viikon iässä. Noin puolella potilaista se on hävinnyt kokonaan viiden vuoden ikään mennessä.

”Se, mitkä tekijät saavat aikaiseksi endoteelisolujen liiallisen jakautumisen loppumisen, on kiinnostava ja vielä puutteellisesti tunnettu ilmiö”, sanoo Eklund.

Osa tutkittavista sairauksista ovat harvinaisia, mutta ne voivat auttaa ymmärtämään tautimekanismeja ja paljastaa yleisiä verisuonten kasvuun ja toimintaan liittyviä säätelymekanismeja.

”Vaikka verisuonten kehityshäiriöissä kyseessä ovat pääsääntöisesti harvinaissairaudet, laskimoiden epänormaalin kasvun lisäksi kehityshäiriöitä voidaan nähdä myös imu- ja hiussuonistoissa. Kuten laskimoepämuodostumista, valtaosa niistäkin voi olla geenimutaatioiden aiheuttamia, mutta eri soluviestinvälitysreiteissä. Ottaen huomioon eri tyyppiset verisuonten kehityshäiriöt, ne yhdessä ovat suhteellisen yleisiä.”

Viallisen molekyylin tunnistamisen jälkeen on mahdollista kehittää molekulaarisia täsmähoitoja.

”Näitä ovat esimerkiksi pienet synteettiset molekyylit, jotka sitoutuvat vain kohdemolekyyliin eivätkä häiritse muita elimistön tapahtumia. Lääkkeen teho kasvaa ja sivuvaikutukset vähenevät.”

Eklundin mukaan tautimekanismien tunnistaminen voi myös johtaa siihen, että lääkkeitä voidaan käyttää sellaisiin sairauksiin, mihin niitä ei alun perin suunniteltu. Tällainen on esimerkiksi PIK3CA-estäjä Alpelisib.

”Se on alun perin kehitetty syöpälääkkeeksi, mutta se tehokkaasti estää myös laskimoepämuodostumien syntyä solu- ja eläinmalleissa. Sekä syövässä että laskimoepämuodostumissa sairautta aiheuttava geenimuutos on sama, mutta mutaatio tapahtuu eri solutyypissä”.

Koska lääkeyrityksillä ei yleensä ole taloudellista kiinnostusta kehittää lääkkeitä pienille potilasryhmille, tallainen lääkkeiden ”uusiokäyttö” on Eklundin mukaan usein ainoa mahdollisuus, että harvinaisista sairauksista kärsivät potilaat saavat lääkinnällisiä hoitoja.

Sairautta aiheuttavien mekanismien tunnistaminen harvinaisissa sairauksissa voi myös paljastaa yleisiä mekanismeja ja soluviestintäreittejä.

”Itse asiassa monet soluviestinvälitysreitit ja mekanismit, jotka ovat väärin säädeltyjä verisuonisairauksissa tarvitaan myös verisuonten normaalissa kehityksessä. Yksi tällaisista on myös tutkimamme Angiopoietiini / TIE2 / PI3K -reitti.”

Kuvassa Angpt/Tie2soluviestinvälitysreitti. Angpt1 on Tie2- reseptorin aktivoiva kasvutekijä. Tärkeä viestintäreitti on PI3K/AKT, joka lisää verenkierron stabiilisuutta säätelemällä mm. FOXO1 transkriptiotekijää. Verisuonten endoteelisoluissa Angpt2 on Tie2 reseptorin aktivaatiota vähentävä kasvutekijä , joka voi lisätä verisuoniston versomista ja läpäisevyyttä . Angpt4:n toiminta on toistaiseksi ollut puutteellisesti tunnettua. Lauri Eklundin tutkimusryhmä on osoittanut Angpt4-kasvutekijän merkityksen laskimoverisuonten muodostumiselle hiiren verkkokalvomallissa.

Normaali verisuonten kehitys ja uudismuodostus syöpäkasvaimissa

Kaikkein varhaisimmat suonirakenteet alkioissa muodostuvat ns. angioblasteista, jotka voivat erilaistua verisuonten endoteelisoluksi. Kehityksen ja kasvun aikana uusia verisuonia muodostuu jo olemassa olevista versomalla tapahtumassa, jota kutsutaan angiogeneesiksi.

Angiogeneesi säätelee alkionkehitystä ja sitä tarvitaan mm. kudosvaurioista paranemisessa. Versoamista seuraavassa kypsymisvaiheessa erilaistuu valtimoiden, laskimoiden ja hiussuonten hierarkkinen verkosto, jota tarvitaan kudosten tasapainotilan säilyttämiseen elimistössä.

Terveellä aikuisella angiogeneesiä ilmenee esimerkiksi kuukautisten aikana ja haavan parantuessa. Uudismuodostus ja muutokset verisuonten rakenteissa ja toiminnassa liittyvät myös moniin sairauksiin.

Syöpäkasvaimet ovat riippuvaisia verisuonista, jotka ruokkivat kasvainta hapella ja ravinteilla. Rakenteellisesti muuttuneet verisuonet voivat vauhdittaa etäpesäkkeitä muodostavien solujen siirtymistä muihin kudoksiin verisuonten välityksellä ja siten vaikuttaa kasvaimen muuttumiseen pahanlaatuiseksi.

”Kasvaimen neoangiogeneesi tarkoittaa verisuonten kasvua kiinteään kasvaimeen sitä ympäröivästä kudoksesta. Osa niistä kasvutekijöitä, joita tarvitaan kehityksen aikana vaikuttavat myös haitallissa neoangiogeneesissä. Tällaiset kasvutekijät ovat kiinnostavia lääkeaineen kehityskohteita. Yksi niistä on tutkimamme angiopoietiini-2, joka voi vaikuttaa verisuonirakenteisiin monella tapaa.”

Soluväliaine on kolmiulotteinen verkosto solujen ja verisuoniston ulkopuolisia ja sen rakennetta ja biokemiallista toimintaa tukevia makromolekyylejä, kuten kollageeniä, kasvutekijöitä ja glykoproteiineja. Kollageenit ovat suurin proteiiniryhmä soluväliaineessa ja ylipäätään ihmisen kehossa.

Hiiren ihon kollageenia ja punaisia verisoluja. Kollageeni on sidekudoksen yleisin säiemäinen proteiini. Kollageenia esiintyy muun muassa luussa, rustossa, jänteissä, ihossa sekä elinten ympärillä. Noin 40 % elimistön proteiinien kokonaismassasta on kollageenia. Verisuonistossa säiemäinen kollageeni tukee laskimoita ja valtimoita. Verisuonten sisäpintaa verhoavien endoteelisolujen ympärillä on lisäksi ohut, levymäinen sidekudoskerros, jota kutsutaan tyvikalvoksi. Tyvikalvo mm. sitoo kasvutekijöitä ja sillä on tärkeitä tehtäviä verisuonten muodostumiseen ja toimintaan liittyen. (Multifotonimikroskooppikuva hiiren ihosta. Veli-Pekka Ronkainen & Ritva Heljasvaara)

Oulussa on pitkät perinteet soluväliaineen ja kollageenin tutkimuksessa ja Eklundin yksi tavoite on tutkia miten verisuonten sisäpinnan endoteelisolut ja verisuonia ympäröivät sileät lihassolut ja perisyytit vuorovaikuttavat soluväliaineen kanssa. Perivaskulaarisen soluväliaineen tehtävien parempi ymmärtäminen voisi auttaa selittämään verisuonten poikkeavuuksia verisuonten kehityshäiriöissä ja myös syövissä.

Sairauksien molekulaaristen mekanismien tutkiminen soluviljelmämalleissa

Hiiren verkkokalvon laskimo (keskellä). Laskimosairaudet ovat yleisiä verisuonimuutoksia. Laskimoiden vajaatoiminta alaraajoissa aiheuttaa suonikohjuja ja näkökyvyn heikkenemistä silmän verkkokalvolla Laskimoepämuodostumat puolestaan ovat harvinaisia, pääosin somaattisista mutaatioista johtuvia synnynnäisiä verisuonten kehityshäiriöitä. Tutkimuksessa saatua uutta tietoa käytetään normaalin kehityksen ymmärtämisessä, tautien mallinnuksessa ja etsittäessä lääkinnällisiä hoitokeinoja verisuonisairauksien parantamiseksi. (Laser-skannaus konfokaalimikroskooppikuva. Minna Kihlström)

Endoteeli on verisuonen yksikerroksinen sisäkerros, joka verhoaa sydämessä, veri- ja imusuonissa niiden sisäpintaa. In vitro -tutkimuksessa voidaan hyväksi käyttää elimistöstä eristettyjä endoteelisoluja joita voidaan lisätä kasvatusmaljoilla laboratoriossa. Siten niillä voidaan tehdä erilaisia kokeita, joita ei voida tehdä elimistössä.

”Malleissa voimme esimerkiksi tutkia uusien kasvutekijöiden vaikutusta: kasvaako solujen elinkyky? Alkavatko ne erilaistua tai muodostaa verisuonirakenteita?

Soluviljelymalleissa tutkitaan myös mutaatioita, joita on löydetty sairaista ihmisistä. Voidaan esimerkiksi selvittää millä tavalla solut muuttuvat, kun ne tuottavat mutatoitunutta geenin muotoa. Kolmiulotteisissa viljelmissä endoteelisoluista voidaan kasvattaa verisuonta muistuttavia rakenteita.

Eklundin mukaan kudosten ulkopuolissa soluviljelmämalleissa geneettiset ja solujen ympäristön manipulaatiomahdollisuudet ja tutkimusmenetelmät ovat lähes rajoittamattomat.

”Soluviljelmissä voidaan usein hyvin monimutkaisia kokonaisuuksia pilkkoa osiin, niin että niitä on mahdollista ymmärtää paremmin. Hyötynä soluviljelmämalleissa on, että niissä voidaan käyttää ihmisperäisiä soluja. Joissakin tapauksissa kehityt hoidot eivät vaikuta samalla tavalla muissa eliöissä ja siten esimerkiksi hiiressä saadut tulokset eivät välttämättä sellaisenaan siirry potilaisiin. Soluviljelmäkokeet myös vähentävät koe-eläinten määrää ja niihin ei liity samanlaisia tutkimuseettisiä näkökohtia. Esimerkiksi ihmisen laskimoiden endoteelisoluja saadaan synnytyksen jälkeen napanuorasta vapaaehtoilta luovuttajilta.”

Verisuonirakenteiden muodostumista mallinnetaan Eklundin tutkimusryhmässä kolmiulotteisessa ympäristössä.

”Ne matkivat kudoksia paremmin kuin kaksiulotteiset viljelmät muovisilla elatusastioilla, mutta niistäkin puuttuu mm. verisuonille luonnollinen virtaus. ”

Lauri Eklundin tutkimusryhmä on aloittanut yhteistyön Tampereen yliopiston FICAM-keskuksen ja oululaisen FinnAdvance start-up -yrityksen kanssa EU-rahoittamassa hankkeessa.

Tarkoituksena on kehittää ihmisperäisillä soluilla ja soluväliaineella päällystettyjä virtauskammioita, jotka ovat suunniteltu vastaamaan normaaleja verisuonia tai sairaudessa muuttuneita rakenteita. Laitteissa on tavoitteena tutkia mm. mitä veren virtauksen muutokset saavat aikaan verisuonistossa ja erityisesti verisuonten epämuodostumissa, missä virtaus on merkittävästi muuttunut.

Eläinmalleja tarvitaan kuitenkin tulosten varmentamiseksi.

”Jos mutkia suoristetaan liikaa yksinkertaistetuilla malleilla, tulokset voivat olla epäluotettavia. Sen vuoksi vielä tarvitaan eläinmalleja, joissa löydökset voidaan varmentaa monimutkaisemmassa ja elimistöä vastaavassa kudosympäristössä. Tallaisessa tutkimuksessa hiiri on tämän hetkisestä nisäkäsmalleista paras. Paras siksi, koska monet geneettiset muokkaukset kuten sairautta aiheuttavan geenimutaation ilmentäminen, on hiiressä mahdollista toteuttaa. ”

Tutkimusta rahoitetaan Suomen Akatemiasta ja EU H2020-MSCA-ITN -ohjelmasta.

Ari Turunen

5.9.2019

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Lauri Eklund, & Tommi Nyrönen. (2019). Targeted treatment for venous diseases with vascular system modelling. https://doi.org/10.5281/zenodo.8131049

Lisätietoja:

Biocenter Oulu

Biocenter Oulu kuuluu osana suomalaisten biokeskusten muodostamaan Biocenter Finlandin, joka kordinoi merkittävien kansallisten tutkimuksen infrastruktuurien toimintaa. Se on myös jäsenenä eurooppalaisissa tutkimusinfrastruktuureissa. Näitä ovat transgeenisten hiirten (Infrafrontier), biologisen kuvantamisen (Euro-BioImaging), ja proteiinirakennetutkimuksen (Instruct) infrastruktuurit.

https://www.oulu.fi/biocenter/

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Biocenter Oulu: teknologiapalveluja biolääketieteelliseen tutkimukseen

Biocenter Oulu tarjoaa palveluja proteiinien, solujen ja geenien tutkimisessa sekä transgeenisten eläinten luomisessa. Yksi vahvuusalueista on valo- ja elektronimikroskooppinen kudosten ja solujen kuvantaminen.

Biocenter Oulun infrastruktuuri-yksikön johtajan, professori Lauri Eklundin mukaan geneettisesti muokatut mallieläimet ja erityisesti muuntogeeniset hiiret ovat auttaneet tutkijoita ymmärtämään nisäkkäiden normaaliin kehitykseen ja kudosten toimintaan liittyviä ilmiöitä enemmän kuin mikään muu eliö. Ne sopivat myös ihmisellä esiintyvien tautien malliorganismeiksi.

”Useat kuvantamisprojektit Oulussa liittyvät geneettisesti muokattujen hiirten tutkimukseen. Oulussa kuvannetaan hiiren alkioita ja elimiä kokonaisina tai kudosleikkeistä yksittäisten solujen tarkkuudella. Olemme ottaneet käyttöön myös menetelmiä, joilla kuvataan soluja ja makromolekulaarisia rakenteita elävissä hiirissä, joissa kudoksia voidaan kuvata tarkalla resoluutiolla mikroskopiaikkunoiden kautta.”

Tätä tarkoitusta varten on rakennettu intravitaalikuvantamislaboratorio, joka mahdollistaa solujen tutkimisen nukutetussa eläimessä. Laboratoriossa voidaan tehdä myös pieniä kirurgisia toimenpiteitä.

”Täällä myös tehdään tuotetusta kuvadatasta 3D-mallinnusta optisten leikkeiden avulla. Motorisoitujen mikroskooppien avulla voidaan myös muodostaa pinta-alaltaan suuria kudosleikekuvia, jotka ovat mosaiikkimaisia kuvakoosteita kudoksista.”

Biocenter Oulun valomikroskopian ydinpalvelussa on erikoistuttu ns. mesoskooppiseen kuvantamiseen. Mesoskooppinen kuvantaminen auttaa ymmärtämään solujen välisiä vuorovaikutuksia monimutkaisessa kudosympäristössä tai jopa kokonaisissa eliöissä. Mesoskoppisen mittakaavan näytteet ovat tilavuudeltaan ja pinta-alaltaan tavallista suurempia: kokoluokka on muutamasta millimetristä pariin senttimetriin. Sellaisia ovat esimerkiksi hiirten alkiot, kolmiulotteiset elimiä muistuttavat organoidit ja kokonaiset pienet malliorganismit, kuten kärpäset ja kalat.

”Teknisesti mesoskooppinen kuvantaminen edellyttää mikroskopiaan sopivaa kudosviljely-ympäristöä, tarkoitukseen kehitettyä 3D -kuvantamislaitteistoa, kudosten kirkastusmenetelmiä sekä edistynyttä kuva-analyysi- ja prosessointikapasiteettia, sanoo Eklund.

Solujen ja kudosrakenteiden tapahtumien paikantaminen

Valolevymikroskoopilla kuvattu, alkiovaiheessa oleva hiiren munuainen (14.5 päivää). Kuva: Veli-Pekka Ronkainen.

Biocenter Oulussa on käytössä erilaisia mikroskooppeja, joiden ansiosta saadaan monipuolisesti kuvannettua ja paikannettuja useita erilaisia tapahtumia soluissa ja kudoksissa. Kolmiulotteisiin malleihin saadaan myös liitettyä ajallinen ulottuvuus (4D kuvantaminen) elävissä näytteissä. Voidaan laatia kuvasarjoja, joista voidaan seurata, miten solut erikoistuvat ja kasvavat esimerkiksi alkioiksi tai elimiä muistuttaviksi organoideiksi.

”Professori Seppo Vainion tutkimusryhmän työn ansiosta voimme esimerkiksi kasvattaa elintä muistuttavan organoidin muutaman päivän aikana munuaisen eri solutyypeistä. Tämä osaaminen on kiinnostanut myös kansainvälisesti. Moni tutkija on tullut hakemaan oppia Oulusta.”

Konfokaali- ja valolevyfluoresenssimikroskoopit soveltuvat kolmiulotteisten ja elävien näytteiden kuvantamiseen. Ne skannaavat näytteet nopeasti niitä vahingoittamatta. Elektronimikroskoopeilla voidaan puolestaan löytää muutoksia solun ja soluvälitilan rakenteista, jotka ovat valomikroskopian resoluution ulottumattomissa. Tämä teknologia vaati kuitenkin näytteiden paikalleen kiinnittämistä (fiksaamista).

Vaikka valoaaltojen avulla ei saada sellaisia suurennoksia kuin elektronimikroskoopilla, laserherätevalon ja fluoresoivien leimamolekyylien kekseliäällä käytöllä ja kuvadatan käsittelyllä päästään valomikroskopiassa sellaiseen tarkkuuteen, jolla voidaan tutkia yksittäisiä soluja, soluelimiä ja makromolekyylirakenteita.

Jotta muutoin näkymättömät kohteet saataisiin 3D mikroskopiassa näkyviksi ne usein värjätään fluoresoivaksi. Fluoresoiva proteiini kiinnitetään tutkittavaan molekyyliin elävissä solussa tavallisesti geneettisesti. Fluoresoivat yhdisteet (fluoroforit) absorboivat eli ottavat vastaan herätevalon energiaa ja vapauttavat osan tästä energiasta pidempinä valon aallonpituuksina. Tätä kvanttimekaanista ihmisenkin silmällä havaittavaa ilmiötä kutsutaan fluoresenssiksi.

Haluttuja proteiineja voidaan myös etsiä soluista ja kudoksista käyttämällä vasta-aineita, joihin on liitetty fluoresoiva merkkiaine. Vasta-aine tunnistaa tietyn proteiinin ja kiinnittyy siihen. Kiinnittymisen jälkeen merkkiaine havaitaan mikroskoopilla. Käytettävä merkkiaine valitaan sen mukaan millaisella mikroskoopilla näytettä aiotaan tutkia.

”Käytössämme on mm. spektraarisilla detektoreilla ja jatkuvalla laservalolla varustettuja mikroskooppeja, jotka mahdollistavat usean fluoresoivan leiman tutkimisen samanaikaisesti. Näin voidaan tutkia monimutkaisia vuorovaikutuksia.”

Fluoresenssimikroskopiassa merkkiaineena käytetään fluoresoivia molekyylejä ja elektronimikroskopiassa esimerkiksi kultaa.

”Oulussa on myös käytössä ns. label free– kuvantamismenetelmiä, jotka eivät edellytä erityisiä leimoja tai varjoaineita. Tällaisia ovat mm. multifotoni- teknologialla näkyvä sidekudoksen kollageeni tai fotoakustisen mikroskopian avulla kuvattavat elimistön omat molekyylit, kuten hemoglobiini. Jälkimmäisessä teknologiassa yhdistämällä erilaisia herätelasereita voidaan kudoksista saada rakenteellista ja toiminnallista tietoa, esimerkiksi verisuonten rakenteesta ja veren hapetusasteesta. Nämä teknologiat ovat suureksi avuksi kuvattaessa eläviä kudoksia, jonne merkkiaineita on vaikea saada.”

Elektronimikroskopiassa Oulussa on erikoistuttu kudosten ultrastruktuuripatologiaan ja immunoelektronimikroskopiaan, joilla tutkitaan esimerkiksi geenimuokattujen hiirikudosten rakenteita tai viljeltyjä soluja. Näillä tekniikoilla saadaan tietoa hyvin pienistä yksityiskohdista sekä tutkittavien proteiinien täsmällisestä sijoittumista solu- ja kudosrakenteisiin.

Immunoelektronimikroskopiassa metallileimattu vasta-aine liittyy tutkittavaan proteiiniin, jolloin voidaan määrittää proteiinin paikka erittäin tarkasti. Näin voidaan saada uutta tietoa esimerkiksi solujen rakenteista ja proteiinien välisistä yhteyksistä.

”Hienorakenteen tutkiminen elektronimikroskooppisten menetelmien avulla on ollut erityisen hedelmällistä soluväliaineen molekyylien tutkimuksessa, joita ei valomikroskoppisessa tutkimuksessa voida nähdä. Uutena tutkimuskohteena ovat myös solunulkoiset vesikkelit, ”eksomit”, joita voidaan kuvantaa elektronimikroskopian avulla.”

Data-analyysin haasteet

Multifonimikroskopialla kuvannettuja hiiren aivojen verisuonia ja verisuoniin liittyvä soluja. Kuva: Veli-Pekka Ronkainen ja Mika Kaakinen.

Perinteisen kuvantamisen ongelmia ovat olleet huono erotuskyky, pieni kuvantamissyvyys ja kuvadatan tehokkaan analytiikan puute. Elektronimikroskopiassa näytteiden valmistaminen vaatii erikoisosaamista ja biologisen tiedon esiin saaminen kuvista vaatii tutkijoilta harjaantumista.

Oulussa on kehitetty kuvia automaattisesti tulkitsevaa ja oppivaa konenäköä. Tässä Biocenter Oulu on tehnyt yhteistyötä professori Janne Heikkilän, Oulun yliopiston konenäön ja signaalianalyysin tutkimuskeskuksesta. kanssa.

”Suurten näytteiden kolmi- ja neliulotteisessa kuvantamisessa datan tallennus, siirto ja analyysit ovat haasteellisia. Kun data siirtyy mikroskoopista käyttäjälle, sitä pitäisi pystyä analysoida. Analyysit voivat vaatia paljon laskentatehoa. Jos alkuperäinen data säilytetään kaukana, ongelmana sujuvalle kuva-aineistojen käsittelylle voi olla tiedonsiirtonopeudet.”

Lauri Eklundin mielestä Suomen ELIXIR -keskus CSC:n tarjoama infrastruktuuri on kansallisesti toimivin ratkaisu raakadatan varastointipaikaksi ja avoimen datan uudelleenkäytölle.

Vaikka metadataa liitetään kuvadataan, datanhallintaan liittyy vielä paljon ongelmia.

”Jotta kuvadata olisi uudelleen käytettävissä, sen pitäisi olla tiettyjen standardien mukaista, kuratoitua ja annotoitua. Tutkimuksen infrastruktuurit tarvitsevat kuvadatalle ”kirjastonhoitajia” ja kuvainformaatikkoja.”

Ari Turunen

20.5.2019

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Lauri Eklund, & Tommi Nyrönen. (2019). Biocenter Oulu: technology services for biomedical research. https://doi.org/10.5281/zenodo.8176718

Konfokaalimikroskopia: 3D

Tavanomaisessa valo- ja fluoresenssimikroskoopissa valo valaisee koko näytteen läpi, valoaalto himmenee ja diffraktion vuoksi valo siroaa kudoksissa ja aiheuttaa kuvannettavan kohteen sumentumisen, ja huonon syvyysterävyyden paksuissa näytteissä

Konfokaalimikroskooppi puolestaan skannaa kapean lasersäteen avulla yhtä pientä osaa optista näytekerrosta kerrallaan, poistaa ei-fokustasossa olevaa valoa, ja saavuttaa paremman tarkkuuden näytteistä jotka ovat liian paksuja perinteiselle fluoresenssimikroskopialle.

Konfokaalimikroskoopissa lopullinen kuva muodostetaan pienistä kohdistetuista alueista. Kolmiulotteisia kuvia saadaan rekonstruoimalla kaksiulotteiset kuvat näytteen eri syvyyksistä. Kolmiulotteisella mallinnuksella yhdistämällä useita optisia leiketasoja voidaan visualisoida rakenteita, joita ei voi nähdä perinteisellä valomikroskopialla.

”Uusien teknologioiden käyttöönotossa on hyödynnetty Oulun yliopiston monitieteisyyttä. Esimerkiksi valolevymikroskopiassa ja fotoakustisessa mikroskopiassa kehitystyötä on tehty Oulun yliopiston optoelektroniikan ja mittaustekniikan laboratorion dosenttien Matti Kinnusen ja Teemu Myllylän kanssa, ennen kuin teknologiat ovat olleet kaupallisesti saatavilla. Tämä tuo tutkijoille kilpailuetua ”, sanoo Lauri Eklund.

Valolevyfluoresenssimikroskopia ja aikasarjat elävien näytteiden kuvaamiseksi

Valolevyfluoresenssimikroskopian (light sheet) avulla voidaan kuvantaa valolle herkkiä näytteitä tai nopeita biologisia prosesseja mikroskooppisesti suuressa elävässä organismissa. Näyte valaistaan herätevalolla vain yhdessä tasossa kerrallaan ja näytteestä syntyvä signaali kerätään toisella objektiivilla. Mikroskoopissa on jatkuva optinen jaksotus: kun näytettä siirretään valotasolla, yksittäiset optiset tasot voidaan taltioida 3D-kuviksi. Isoja 3D-näytteitä voidaan skannata nopeammin mutta hieman huonommalla resoluutiolla kuin konfokaalimikroskoopilla.

”Biocenter Oulu oli Suomessa ensimmäinen laboratorio, joka otti käyttöön tämän teknologian. Oulussa valolevymikroskopialla voidaan kuvata mesoskooppisia kudoskirkastettuja, mutta myös eläviä kolmiulotteisia näytteitä, jolloin kuviin saadaan aikaulottuvuus. Näin voidaan kuvata esimerkiksi geneettisesti leimattujen yksittäisten solujen kasvaminen kokonaisiksi alkioiksi tai organoideiksi tietyssä ajassa”, sanoo Eklund.

Heidelbergissä kehitetyn uuden valolevyfluoresenssimikroskoopin ansiosta, vuonna 2015 EMBL:n laboratoriossa Heidelbergissa tutkijat ensimmäistä kertaa pystyivät tarkkailemaan hiiren alkion kehittymistä muutaman ensimmäisen päivän aikana kun se alkoi kehittyä hedelmöityneestä munasolusta alkioksi.

Yhdysvalloissa (Howard Hughes Medical Institute) julkistettiin vuonna 2018 monia kuvakulmia hyödyntävä mikroskooppi, jossa voidaan tarkastella alkion kasvua yksittäisen solun tasolla. Tutkijat seurasivat solualkioita ja tarkastelivat, mitkä geenit kytkeytyivät päälle ja mitkä solut liittyivät toisiinsa.

Kaksi valotasoa valaisivat alkiota ja kaksi kameraa tallensivat varhaista elinten kehittymistä. Algoritmit jäljittivät alkion paikan ja koon. Algoritmit kartoittivat kuin valolevy liikkuu näytteessä ja sitten ratkaisee, miten saada parhaimmat kuvat, mutta samalla huolehtii kuitenkin siitä, että alkio on kiintopisteessä. Koska alkio muuttuu koko ajan, mikroskoopin pitää alituisesti mukautua ja tehdä ratkaisuja hyvin nopeasti, mitä sadoista kuvista ja aikaikkunoista otetaan huomioon.

”Tulevaisuuden kehittyneet mesoskooppiset menetelmät voivat hyödyntää ei-diffraktoituvaa herätevaloa (Bessel Beam ja Airy Beam). Poiketen tavallisesta valosta, näissä herätevaloissa intensiteetti pysyy vakiona paksuissa kudosnäytteissä. Lisäksi herätevalon asymmetrinen muoto ja uudelleen muotoutumisominaisuus parantavat kuvantamisresoluutiota ei-homogeenisissä ja valoa paljon sirottavissa kudosnäytteissä.”

Uudelleenmuotoutumisessa tarkoitaan sitä, että vaikka herätevalon säde osuu osittain esteeseen se palautuu ennalleen, toisin kuin tavallinen valo.

Lauri Eklundin mukaan elävien näytteiden nopean kolmiuloitteisen kuvantamistekniikoiden kehittymisen myötä tallennetun kuvatiedon määrä on kasvanut valtavasti. Samoin tarve kuvadatan kvantitatiivisille analyysiohjelmistoille on suuri.

”Uusista tekniikoista saadaan kaikki hyöty irti, jos osataan myös kuvankäsittely. Erityisesti mesoskooppisessa kuvantamisessa näytteiden suuri koko edellyttää tehokkaita kuva-analytiikan ja prosessoinnin työkaluja jotka esimerkiksi voivat poistaa kuvista taustahälyä ja mahdollistavat tarkkojen 3D-mallennusten tekemisen. Älykkäillä tietokoneohjelmistoilla voidaan lisäksi analysoida solujen käyttäytymistä ja tunnistaa solujen ominaisuuksia. Voidaan esimerkiksi erottaa solytyyppejä, määrittää solujen jakautumisen aktiivisuutta ja analysoida solujen liikkumis- tai elinkykyä.”

Lisätietoja:

Biocenter Oulu

https://www.oulu.fi/biocenter/

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Suomalaisen väestön perimästä apua sydän- ja verisuonisairauksien hoitoon

Professori Samuli Ripatin ryhmä Suomen molekyylilääketieteen instituutissa ja Helsingin yliopiston lääketieteellisessä tiedekunnassa tutkii sydän- ja verisuonitautien syntymekanismeja geenitekniikan avulla. Suomalaisen populaation geeniperimä tarjoaa tähän hyvät mahdollisuudet.

Suomessa on noin 40 perinnöllistä tautia, jotka ovat tunnusomaisia suomalaiselle populaatiolle. Tautiperimään kuuluvat taudit johtuvat tietyistä mutaatioista, jotka ovat Suomessa muuta maailmaa yleisempiä ns. pullonkaulaefektin takia. Viimeisten 10 000 vuoden kuluessa Suomen alueelle on muuttanut suhteellisen pieni määrä uudisasukkaita. Tämän uuden populaation yksilöt edustivat pientä ja kapeaa geeniainesta, mikä sai aikaan joidenkin tautigeenien alueellisen rikastumisen.

Pullonkaulaefektistä on nyt hyötyä kun tautien geneettistä perimää selvitetään.

”Suomi on Euroopan skaalassa suurin pullonkaulaväestö. Tänne on tullut vähän ihmisiä vuosituhansien aikana. Sellaiset geenimuunnokset, jotka ovat muuttajien mukana Suomeen tulleet, voivat olla Suomessa sata kertaa yleisempiä, kuin muualla. Näin ei ole sellaisilla populaatioissa, joissa väestö on päässyt sekoittumaan. Pysyvää asutusta tuli ensin rannikkoseudulle. Ja vasta paljon myöhemmin sisämaahan ja pohjoiseen”, sanoo Samuli Ripatti.

Ripatin mukaan 1500-luvun aikana tapahtunut sisäinen muuttoliike oli toinen pullonkaula, jonka ansiosta nähdään isoja eroja Suomen väestössä idän ja lännen välillä. Vaikka populaatioisolaatteja on muuallakin, suomalaisen tautiperimän tutkimuksen tekee ainutlaatuiseksi se, että monen harvinaisen taudin geneettinen tausta on selvitetty. Tätä tietoa voidaan hyödyntää myös muita tauteja tutkittaessa.

”Nyt pystymme ymmärtämään monen geneettisesti periytyvän taudin syntyperiaatteet, jolloin tutkimustietoa voidaan soveltaa muualla. Vaikka taudit ovat erilaisia, niissä on samalla tavalla toimivia geneettisiä mekanismeja. Tämän dynamiikan ymmärtäminen on iso asia ja tarjoaa mahdollisuuksia uusien hoitojen kehittämiseen.”

Esimerkiksi Parkinsonin tautia tutkittaessa voidaan selvittää, olisiko tauti yleisempää jossakin osassa Suomea. Jos näin on, voi tämän osan maata tutkiminen tuottaa uutta geneettistä tietoa.

Populaatioiden geneettinen vaihtelu

Ripatti on kiinnostunut populaatiogenetiikasta ja suomalaisten geneettisestä vaihtelusta. Vuodesta 2013 hän on toiminut biometrian professorina Helsingin yliopiston lääketieteellisessä tiedekunnassa. Biometria on tilastotieteen ala, joka on keskittynyt biologisten aineistojen analysointiin. Ripatin tutkimusryhmä yhdistää tilastolliset menetelmät ihmisen perimän sekvenssitason mittauksiin.

”Sekvensoinnilla saadaan tietoa geneettisestä vaihtelusta, joka voi olla pienessä populaatiossa harvinaista. Vaihtelun perusteella voidaan nähdä tiettyjen tautiriskiä muokkaavien geneettisten muutosten yleisyys jollakin Suomen alueella tai osoittaa altistuminen tiettyyn tautiin.”

Näin populaation geenidatasta voidaan yrittää seuloa arvokasta tietoa terveysvaikutuksista. Voidaan löytää henkilöt, joilla on korkea riski sairastua ja samalla etsiä keinoja tautien ehkäisemiseen.

”Me katsomme asiaa kansantautien näkökulmasta. Tutkimme Suomessa yleisiä tauteja, joita ovat esimerkiksi sydän- ja verisuonitaudit ja diabetes.”

Vaikka näihin tauteihin vaikuttavat esimerkiksi ruokavalio ja muut elämäntavat, myös perinnölliset tekijät ovat merkittäviä. Siksi tauteja kutsutaankin Suomessa kansantaudeiksi. Ripatin ryhmä on Suomen pullonkaulaefektin ansiosta tunnistanut geenimuunnoksia, erityisesti sydän- ja verisuonitaudeille altistavia geenejä sekä verestä mitattuja sairautta ennakoivia ja merkkiaineita sääteleviä geenejä. Ripatti ottaa esimerkiksi korkean kolesterolitason.

”Ne joilla on korkeat kolesterolitasot, voidaan ottaa tutkimuksiin ja heidän perimänsä sekvensoida tehokkaasti ja helposti. ”

Sydän- ja verisuonisairaudet aiheuttavat kolmanneksen kuolinsyistä maailmassa. Eniten siihen sairastuneita on Keski-Aasiassa ja Itä-Euroopassa. Suomi oli 1960-luvulla maailman kärkisijalla keski-ikäisten miesten sepelvaltimotautikuolleisuudessa. 2000-luvulle tultaessa miesten kuolleisuus oli vähentynyt noin viidennekseen korkeimmasta tasosta.

Alueelliset erot sydän- ja verisuonitautien sairastavuudessa ja kuolleisuudessa ovat kuitenkin Suomessa suuret. Tautien esiintyminen on Länsi- ja Etelä-Suomessa muuta maata selvästi vähäisempää. Tämä suuri alueellinen ero kiinnostaa tutkijoita. Länsi-Suomen väestöstä on löytynyt ns. sammuneita geenejä, jotka suojaavat diabetekselta ja sydän- ja verisuonitaudeilta.

Sammuneet geenit

Yksi kiinnostavia tutkimuskohteita on geenin muuttaminen tai muuttuminen toimintakyvyttömäksi. Tällaisia geenejä kutsutaan sammuneiksi geeneiksi. Professori Aarno Palotien johtamassa tutkimuksessa analysoitiin yli 80 harvinaista, mutta Suomessa muuta maailmaa yleisempää muutosta, joka hiljentää koko geenin. Aineisto saatiin yli 30 000 suomalaisen geeniperimästä.

Suomalaisilla on itse asiassa muita kansoja enemmän geenejä, jotka sammuttavat yksittäisen geenin toiminnan.

”Proteiinituotannon katkaisevat geenivariantit ovat ihmispopulaatioissa aika harvinaisia. Kuitenkin Suomeen uudisasukkaiden mukana tulleet proteiinituotannon katkaisevat geenivariantit ovat meillä muuta Eurooppaa yleisempiä ja siksi niiden tänne aikanaan saapuneiden varianttien terveysvaikutusten tutkiminen on Suomessa paljon helpompaa kuin muualla.”

Länsi-Suomen väestöstä on löydetty sellaisia poistogeenejä, joiden toimintakyvyttömyys ei aiheuta terveydellisiä ongelmia. Päinvastoin, ne suojaavat kantajaansa diabetekselta tai sydän- ja verisuonitaudeilta.

”Suomesta on löytynyt geenimuunnos, joka suojaa diabetekselta. Variantin kantajilla oli vähemmän diabetestä muihin verrattuna. Geenimuunnoksen kantajia on Pohjanmaalla enemmän kuin muualla maailmassa. Tästä voi olla hyötyä lääketeollisuudelle, jos pystytään matkimaan molekyylivalmisteilla tällaisen geenin toimintaa.”

Toinen esimerkki on lipoproteiini (a)n toimintaa ehkäisevä geeni. Sydäntautiriskiä voidaan arvioida mittaamalla verestä lipoproteiini (a). Lipoproteiini (a) eli LPA on LDL-kolesterolia kuljettavan lipoproteiiniperheen jäsen. Aineistosta löytyi esimerkiksi geenimuutoksia, joiden kantajilta puuttuu lähes kokonaan LPA-geenin tuottama lipoproteiini (a). Ihmiset, joilta lipoproteiini a puuttuu, sairastuvat muita harvemmin sydän- ja verisuonitauteihin.

”LPA-geenistä löytyy pari varianttia, jotka sulkevat pois sen toimintaa. LPA-proteiinia on tällöin veressä vähemmän, jolloin matalan tiheyden kolesteroli kiertää verenkierrossa vähemmän. Tällöin syntyy vähemmän verisuonitauteja. Proteiinitason alentaminen farmakologisin keinoin olisi mahdollista.”

Suomessa on tutkittu myös USF-1-geenin toimintaa. Ihmisillä geeni vaikuttaa veren rasva-arvoihn ja kolesteroliin. Kun geenin toiminta poistettiin hiirellä, veren hyvä HDL-kolesterolipitoisuus nousi.

Näytekokoelmat suomalaisista genomeista

SISu-hankkeen (Sequencing Initiative Suomi) ansiosta tiedot suomalaisten geneettisestä vaihtelusta on koottu yhteen tietokantaan.

”Sekvensoitu näyteaineisto on kerätty suomalaisista potilaista ja vapaaehtoisista. Aineistosta on laskettu tilastotietoa siitä, kuinka yleinen kunkin geneettisen variantin yleisyys on Suomessa. Kun on kerätty tarpeeksi iso tietokanta, niin saadaan selville minkälainen on ylipäätään suomalainen genominen variaatio.”

SISu-tietokannassa on tällä hetkellä perimän proteiineja koodaavat variantit reilulta 10000 suomalaiselta ja kaikkiaan koko perimäkin on sekvensoitu jo monelta tuhannelta suomalaiselta.

”SISu-tietokannan sekvenssidata antaa meillä mahdollisuuden täydentää meidän muita edullisemmilla genomisiruilla mitattuja aineistoja tilastollisilla imputaatioalgoritmeilla. Nyt pystymme aika tarkasti sanomaan minkälaisia geenivariantteja suomalaisilla on. Esimerkiksi jos yksi tuhannesta kantaa Suomessa tiettyä geenivarianttia, niin tällöin keskimäärin ainakin 20 henkilöltä pitäisi löytyä variantti nykyisestä tietokannasta.”

Tietokannasta on jo nyt apua potilaiden diagnostiikassa.

”Variaatiodata on tietokannassa ja dataa hyödynnetään koko ajan, erityisesti kliinisessä genetiikassa. Lähtökohta on, että sairaalan potilaan hoitoon saadaan lisäselvitystä tietokannasta. Jos siis epäillään, että geenissä oleva variantti saattaa olla taudin syynä, niin lääkäri tarkistaa tietokannasta kuinka usein suomalaisissa tätä varianttia esiintyy. Jos se on yleinen, ei ole todennäköistä, että se olisi harvinaisen taudin syynä. Jos se on harvinainen ja sen vaikutus geenin toiminnalle on merkittävä, niin todennäköisyys variantin merkitykselle myös taudin puhkeamisessa kasvaa. Tämä on hyvin konkreettinen kliininen käyttö tietokannalle.”

FinnGen taltioi puolen miljoonan suomalaisen perimät

Joidenkin geenimuunnosten yliedustusta havaitaan niissä väestöissä, jotka ovat kohdanneet pullonkaulailmiön. Pienessä populaatiossa geneettistä vaihtelua ylipäätään vähemmän.

SISu-projektin dataa on kerätty tutkimusprojekteista ja potilaista. Projekti on kuitenkin keskittynyt pelkästään genomidataan, jolloin datan hyödyntämismahdollisuudet terveystutkimuksessa ovat rajalliset.

”Kaikista meistä pitäisi saada kerättyä talteen biopankkinäyte”, sanoo Ripatti. ”Ne, joilla on alttius sairastumiseen, pitäisi seuloa tarkemmin.”

Samuli Ripatin mielestä on suuri puute, että genomitietoa ei vielä ole saatavissa terveystarkastusten yhteydessä. Se pitäisi olla osana jokaisen rutiinitarkastusta, jotta voitaisiin tehdä konkreettisia päätöksiä hoidolle.

”Suomessa olisi tähän hyvät edellytykset. Meillä on hyvin toimiva työterveyshuolto ja perusterveydenhuolto sekä hyvä osaaminen geenitutkimuksessa.”

SISu:n jatkoksi alkoi elokuussa 2017 FinnGen-projekti, jossa taltioidaan puolen miljoonan suomalaisen genomit. Hankkeessa hyödynnetään kaikkien suomalaisten biopankkien keräämiä näytteitä. Perimästä saatava data yhdistetään kansallisissa terveydenhuollon rekistereissä olevaan tietoon.

”Työkalut riskiarviontien tekemiseen ovat olemassa ja tilastollisia malleja on kehitetty usealle taudille. Perimästä saadun datan tulkitseminen osana rutiiniterveydenhoitoa on lähivuosien tavoite. FinnGen osaltaan mahdollistaa tämän.”

Ripatti ryhmineen osallistuu tilastollisten algoritmien kehittämiseen, implementoimiseen ja testaamiseen.

”Kehitämme ennustealgoritmeja, jossa arvioidaan esimerkiksi sydän- ja verisuonitautien riskiä potilaalla. Yhdistämme genomidatan ja elintapatekijät, jonka perusteella tehdään ennuste. Haemme siis keinoja, jotka motivoivat potilasta muuttamaan elintapojaan.”

Ripatin ryhmä täydentää tilastollisilla algoritmeilla myös genomista tietoa. Suomen populaatiohistoriasta johtuen täällä pystytään ennustamaan paremmin ja tarkemmin kuin juuri missään muualla maailmassa puuttuvat genotyypit sirudatoihin. Algoritmi toimii hyvin suomalaisessa datassa, koska suomalaisten genomit ovat keskimäärin enemmän samankaltaisia kuin muualla. Laskennallisesti täydennetään sekvenssidatalla geenisiruilla kerättyä dataa.

”Jos oleelliset variaatiokohdat skannaavalla geenisirulla on 500 000 geenimerkkiä ja meillä on näiden mittausten lisäksi tiedossa geenisekvensseistä 30 miljoonaa genomivarianttia, me voimme täydentää geenisirulla tehdyn mittauksen kokonaiseksi genomisekvenssiksi hyvillä tilastollisilla laatumittareilla. Näin saadaan luotua riittävän luotettavia kokonaisia genomeja lisää huokeammin. Koko genomin sekvensointi on toistaiseksi huomattavasti kalliimpaa.”

Datan analysointiympäristöä parannettava

Genomidatan säilyminen tulevaisuudessa ja sen analysointiympäristön suunnittelu on iso asia, jossa ELIXIR-infrastruktuurilla on keskeinen rooli.

”Meillä on olemassa tietovaranto, jota luvan saanut tutkija voi hyödyntää. Tietovarannon ollessa suuri, täytyy tutkijalle tarjota tietoturvallinen ja tehokas data-analyysiympäristö, jossa dataa voi tutkija analysoida.”

Tietosuojan takia parhain ratkaisu olisi esimerkiksi etätyöpöytä. Eri maiden populaatiodatasta tällä hetkellä on satoja kopioita eri tutkimusryhmien levypalvelimilla ympäri maailmaa. Se on suunnaton määrä dataa.

”Toisaalta meillä täytyy tulevaisuudessa olla genomidatan analysointiin soveltuvia ratkaisuja, jotka mahdollistavat valtavien aineistojen tehokkaan ja hajautetun tallennuksen ja analysoinnin. Tätä haastetta eivät nykyiset paljon vaatimattomampien datamäärien aikanaan kehitetyt suljetut etätyöpöytäratkaisut ratkaise vaan tarvitaan avoimia, tehokkaasti pilvipalveluita ja kansainvälistä yhteistyötä hyödyntäviä laskentaympäristöjä. Tämän miettiminen on ihan keskeistä.”

Ari Turunen

5.11.2018

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Samuli Ripatti, & Tommi Nyrönen. (2018). Help from the Finnish genome for the prevention of cardiovascular diseases. https://doi.org/10.5281/zenodo.8118771

Lue myös:

Massiivinen datanhallintaprojekti: suomalaisten perimä kerätään talteen

Lisätietoja:

FIMM

www.fimm.fi

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Sairauksien ennustemallit tarkentuvat laskennallisten menetelmien ansiosta

Laskennallisilla menetelmillä voidaan data-aineistosta nykyään päätellä keillä on riski sairastua esimerkiksi diabetekseen tai syöpään. Laura Elo tutkimusryhmineen kehittää menetelmiä, joiden avulla etsitään erilaisia sairauksien ennustemerkkejä. Yhdistämällä kliinistä dataa geeniperimästä saatuihin tietoihin saadaan myös arvokasta tietoa sopivasta lääkehoidosta.

Ihmisen biologian tutkimus tuottaa paljon uudenlaista dataa tutkijoiden tulkittavaksi. DNA:n sekvensointi tuottaa yksilön geneettisen profiilin. RNA:n sekvensointi puolestaan antaa mittausdataa geenien aktiivisuudesta. Se kertoo, mitkä geenit milloinkin ilmenevät ja muun muassa tuottavat proteiineja soluissa.

Kudosnäytteestä voidaan mitata tuhansia eri molekyylejä ja niiden välisiä vuorovaikutuksia. Voidaan esimerkiksi tutkia geenin erilaisia aktiivisia muotoja, transkripteja. Kun pyritään selvittämään proteiinien toimintaa tai niiden poikkeamia tautien yhteydessä, puhutaan proteomiikasta. Apuna käytetään massaspektrometreja, joilla mitataan molekyylimassa.

Turun biotekniikan keskuksen bioinformatiikan tutkimusjohtaja Laura Elo ja hänen tutkimusryhmänsä kehittävät mallinnusmenetelmiä, joiden avulla seurantatutkimuksissa kerättyä mittausdataa voidaan hyödyntää sairastumisriskin määrittämiseen yksilökohtaisesti.

”Aloitin urani matemaatikkona aikana, jolloin bioinformatiikka oli vielä marginaalista. Sitten innostuin laskennallisesta biologiasta ja lääketieteestä”, Elo kertoo.

Laskennallisen mallinnuksen tuloksena luotu verkko, jonka solmut kuvaavat yksilöitä ja solmujen väliset kaaret yksilöiden välisiä suhteita.

Yksi tärkeä tutkijoiden aineisto on eri populaatioista kerätty data. Tutkimuksissa käytetään Turun alueen Auria-biopankkiin tallennettua dataa sekä muualta Suomesta ja muista maista saatua dataa. Lisäksi sairaaloiden sähköisissä järjestelmissä on paljon potilaiden hoidosta kerättyä dataa, jota voidaan luvanvaraisesti käyttää tutkimuksessa. Näytteistä kerätty data ei kuitenkaan yksin riitä selvittämään tautien syntyä ja kehittymistä. Tarvitaan laskennallisia menetelmiä ja malleja, jotta datamassoista voidaan saada ymmärrettäviä tulkintoja. Tarkoituksena on kehittää toimivia malleja lääkäreiden käyttöön.

”Lähes kaikki tutkimuksemme liittyy lääketieteeseen ja lääkäreiden tarpeisiin. Tarkoituksenamme on tarjota toimivia työkaluja lääkäreille. Kaikesta tästä datamäärästä ei saada tarpeeksi hyötyä, jos sitä ei pystytä mallintamaan ja tulkitsemaan. Työmme avulla potilaille pystytään toivottavasti tulevaisuudessa tarjoamaan hoitomenetelmiä, jotka ovat yhä enemmän yksilöllisesti kohdennettuja.”

Tehokas hoito on aina yksilöllistä, koska lääkkeet ja hoitomenetelmät tehoavat eri yksilöihin eri tavoin. Potilaan hoitovasteeseen vaikuttaa joukko tekijöitä, joista saadaan tietoa mm. laboratoriomittauksista. Kliinisten, potilaan terveydentilaan liittyvien muuttujien lisäksi on paljon esimerkiksi geeni- ja proteiinitason tekijöitä, jotka vaikuttavat hoitomenetelmien tehoon. Yksilöstä saadun datan analysoimisessa matematiikka tulee apuun.

Lääketieteellisen bioinformatiikan keskuksessa kehitetään laskennallisia data-analyysityökaluja ja matemaattisia mallinnusmenetelmiä biolääketieteen tutkimuksen tarpeisiin. Erityispainopiste on modernin bioteknologian tuottamien laajojen mittausdatojen analysointi ja tulkinta (mm. syväsekvensointi ja massaspektrometria). Tavoite on parantaa monimutkaisten sairauksien, kuten diabeteksen ja syövän, diagnostiikkaa, ennusteita ja hoitoa tiiviissä yhteistyössä lääkäreiden ja lääketieteen tutkijoiden kanssa.

”Biologia on monimutkaista. Näennäisesti yksi sairaus voi molekyylitasolla ilmetä eri ihmisissä monin eri tavoin, ja eri potilaille tehoaa erilainen hoito. Toisille tietty lääkehoito voi aiheuttaa pahoja haittavaikutuksia, toisille lääke ei tehoa. Laskennallisilla menetelmillä pystymme ennustamaan lääkkeiden haittavaikutuksia ja näkemään kenelle lääke sopii. Me matemaatikot voimme auttaa lääketieteilijöitä tunnistamaan näitä tekijöitä”, Elo sanoo.

Mallin sopiminen myös uuteen dataan olennaista

Toimivat matemaattiset mallit edellyttävät raaka-aineekseen suuria datamääriä. Esimerkiksi osa malleista on kehitetty Yhdysvalloista saadusta kliinisestä potilasdatasta, mutta ne sopivat myös Turun yliopistollisen sairaalaan potilasdataan.

”Kun saadaan riittävän iso määrä genomidataa ja kliinistä dataa, ne voidaan yhdistää ja päästään mallinnusvaiheeseen. Yhdistely on mahdollista vain, jos datan kuvaus, metadata, on kunnossa.”

Mallien kehittämisessä pitää ottaa huomioon monia asioita. On tärkeää arvioida mallin ennustuskykyä etukäteen. Mallit yleensä ylisovittuvat (over-fitting) dataan, jolla ne luodaan. Tällä tarkoitetaan sitä, että malli sopii dataan liian hyvin. Ennustemalli siis toimii yhdellä datalla, mutta ennuste ei olekaan enää hyvä uudella datalla. Mallin todentamiseksi tarvitaan validointia. Se onnistuu esimerkiksi käyttämällä potilasaineistoa toisesta sairaalasta tai maasta. Mallin tarkistaminen käyttämällä muuta potilasdataa on tärkeää, jotta malli voidaan ottaa yleisesti käyttöön. Tässä apuna ovat eri biopankkien data.

”Jos mallin tekee samasta datasta, sen voi saada toimimaan lähes täydellisesti, mutta uusiin yksilöihin se ei välttämättä toimi. Pyrimme siis löytämään datasta sellaisen kombinaation, päätössäännön, joka ennustaa lopputulosta mahdollisimman tarkkaan mutta kuitenkin niin, että se yleistyy uusiin datoihin.”

Laura Elon ja hänen tutkimusryhmänsä työ mallintamisen parissa on jatkuvaa kokeilua ja muutosta.

”Kehitämme malleja ja pyrimme näyttämään ensin tietyissä aineistoissa, että malli toimii. Sen jälkeen validointia jatketaan ja etsitään mahdollisimman monia uusia aineistoja, joissa mallin tuottamia ennusteita voi testata. Aina voi kehittää mallin joka toimii yhdessä aineistossa. Mutta vasta kun monessa aineistossa on todettu, että ennustemalli toimii luotettavasti, se voidaan antaa lääkäreiden päätöksenteon tueksi. Mitä laajemmin mallia pystytään testaamaan sen paremmin voimme arvioida, toimiiko se vain tietylle populaatiolle vai onko se yleispätevä.”

Malleihin lisätään uusia tekijöitä ja analysoidaan, miten ne vaikuttavat ennusteisiin. Esimerkiksi lineaarisia, yksinkertaistavia malleja on helppo hahmottaa ja tulkita sairaaloissa. Välillä molekyylien vuorovaikutukset ovat kuitenkin niin monimutkaisia, että lineaariset mallit eivät toimi ja tarvitaan muita ratkaisuja.

”Mitä enemmän uusia muuttujia lisätään malliin, sitä kriittisemmäksi tulee mallin validointi. Tärkeä kysymys on ymmärtää, mitkä muuttujat yksinään ovat merkittävimpiä ennustamiselle ja miten niiden kombinaatiot erilaisilla painoarvoilla ennustavat parhaiten. Pitää löytää tasapaino malliin: sen pitää olla riittävän kompleksinen pystyäkseen ennustamaan, mutta mallia ei saa ylisovittaa dataan.”

Yksilöidyn lääketieteen tavoitteena on tunnistaa tekijöitä, joiden avulla voidaan löytää jokaiselle yksilölle juuri hänelle sopivin hoitostrategia.

Munuaissyövän ennustemalli

Laura Elo on ryhmineen ollut mukana munuaissyövän ennustemalleja kehittämässä. Munuaissyöpä saa alkunsa munuaisen kuorikerroksen epiteelisoluista. Munuaissyövän ennuste on huono, sillä 40% potilaista kuolee siihen viiden vuoden kuluessa.

Uuden laskennallisen menetelmän avulla voidaan löytää ennustemerkkejä potilasnäytteistä. Tutkimuksessa havaittiin, että 152 geenin ilmentymä pystyy ennustamaan munuaissyöpää sairastavien potilaiden elinaikaa leikkauksen jälkeen.

”Munuaissyövän ennuste on yleensä hyvä, jos syöpäpesäke on paikallinen. Keskimäärin puolelle potilaista kehittyy kuitenkin etäspesäkkeitä leikkauksen jälkeen. Tavoitteena on, että pystyttäisiin mahdollisimman aikaisin näkemään onko potilaan ennuste hyvä vai huono, jotta voidaan valita paras hoitostrategia.”

Ennustemallin kehittämisessä hyödynnettiin kahta eri aineistoja. Yli 400 munuaissyöpäpotilaan geeni-ilmentymätiedot saatiin kansainvälisestä Cancer Genome Atlas (TCGA) -tietokannasta. Tutkimusryhmä vahvisti mallin toimivuuden käyttämällä riippumatonta japanilaista 100 potilaan aineistoa.

Etäispesäkkeitä levittävä ja hormonaaliselle hoidolle vastustuskykyinen eturauhassyöpä on potilaan menehtymiseen johtava pahanlaatuinen sairaus. Solunsalpaajalääke doketakseli otettiin käyttöön yli vuosikymmen sitten. Kuitenkin noin 10–20 prosenttia potilaista saa hoidosta sivuvaikutuksia, jotka pakottavat keskeyttämään hoidon. Kansainväliset tutkijaryhmät loivat Prostate Cancer DREAM 9.5 Challenge -kilpailua varten matemaattisia malleja, jotka ennustavat eturauhassyövän solunsalpaajahoidon sivuvaikutuksia. Tutkijat kehittivät kilpailua varten kaikkiaan 61 mallia, joista seitsemän osoittautui toimiviksi ja palkittiin kilpailussa. Turun yliopiston ja Turun yliopistollisen keskussairaalan yhteisen tutkimusryhmän kehittämä malli oli yksi kilpailun voittaneista malleista. Lisätietoja: *Journal of Clinical Oncology Clinical Cancer Informatics*: http://ascopubs.org/doi/abs/10.1200/CCI.17.00018

Ykköstyypin diabeteksen syntymekanismien tunnistaminen solutasolla

Laura Elo etsii potilasaineistosta erilaisia biomarkkereita, jotka voivat ennustaa sairauksien puhkeamisen tai kertoa jotakin hoitovasteesta. Biomarkkeri on tekijä tai ominaisuus, joka ilmentää biologisen tilan muutosta esimerkiksi geeneissä tai proteiineissa. Suomessa on pitkään yritetty selvittää tyypin 1 diabeteksen syntymekanismeja. Ykköstyypin diabetes johtuu insuliinia tuottavien solujen tuhoutumisesta. Haima ei tuota elimistön tarvitsemaa insuliinihormonia, jolloin verensokeri kohoaa.

”Suomessa ykköstyypin diabetesta sairastetaan suhteessa väkilukuun eniten maailmassa. Sekä geeniperimällä että ympäristötekijöillä on sairauden syntyyn jokin osuus. Etsimme diabetekseen sairastuneista biomarkkereita, jotka voisivat kertoa jotakin taudin kehittymisestä.”

Koska Suomessa on maailmassa eniten suhteessa asukaslukuun ykköstyypin diabetesta, on myös diabeteksen tutkimus täällä merkittävää. Jo vuonna 1994 Suomessa aloitettiin DIPP (Diabetes Prediction and Prevention) eli diabeteksen ennustamiseen ja ehkäisemiseen tähtäävä kunnianhimoinen ja laaja tutkimusprojekti. Vastasyntyneiltä etsitään verinäytteistä tyypin 1 diabetekselle altistavia perintötekijöitä. Lapset, joilla todetaan geneettinen riski sairastua diabetekseen, kutsutaan seurantatutkimukseen. Näytteitä otetaan joka kolmas kuukausi ja 2-vuotiaasta eteenpäin puolen vuoden tai vuoden välein. Seulontaan osallistuvat Turun, Tampereen ja Oulun yliopistolliset keskussairaalat.

”Niitä lapsia, joilla on geneettinen riski sairastua, on seurattu 15 ikävuoteen saakka. Tavoitteena on, että pystyttäisiin tunnistamaan sairauden syntyyn vaikuttavia tekijöitä solutasolla jo ennen kuin se pystytään nykykeinoin diagnosoimaan. ”

Laura Elo tekee yhteistyötä professori Riitta Lahesmaan kanssa. Lahesmaan ryhmässä tutkitaan valkosoluja ja yritetään ymmärtää, mitkä asiat tekevät soluista diabetesta aiheuttavia. Näin voitaisiin tulevaisuudessa estää diabeteksen syntyminen sekä parantaa siihen sairastuneet.

Uudet työkalut

Koneoppimisessa algoritmit pystyvät tekemään ennusteita ja soveltamaan niitä analysoimalla datamassoja.

Laura Elo haluaa jatkossa keskittyä tautien syntymekanismeihin ja sairastumisen riskitekijöihin. Eri tekijöiden monimutkaisten vuorovaikutusten tilastollinen mallintaminen edellyttää monia uusia menetelmiä ja mittausteknologioita, joita tutkijat kehittävät ja kokeilevat.

Tilastollisen mallinnuksen lisäksi Elo ryhmineen soveltaa koneoppimisen eri tekniikoita ennustavien mallien tekemiseen. Kone opetetaan seulomaan datasta olennaisia tekijöitä. Kone voi esimerkiksi oppia ennustamaan binäärisesti taudin lääkehoidon seuraamukset: hyvä vaste/huono vaste.

”Uudet työkalut ja menetelmät on tuotava mahdollisimmat lähelle potilasta. Pohdimme koko ajan sitä, mitä pitää tehdä, jotta mallia voidaan hyödyntää potilaiden hoidossa. Mitä ja miten pitäisi mitata? Onko jotain, joka voitaisiin tehdä paremmin? Mallin on oltava riittävän yksinkertainen ja helppokäyttöinen, että se päätyy klinikalle lääkärin päivittäiseen työhön. Tärkeää on tietää, miten lääkärit niitä käyttävät.”

”Olennaista tässä työssä on, että tämä on tieteiden välistä. Miten paljon enemmän laskennan avulla voidaankaan saada informaatiota kuin että samaa aineistoa käytäisiin vain käsin läpi. Laskennasta on tullut osa lääketiedettä.”

Turun biotekniikan keskuksella on oma tietokoneklusteri, jonka laskentakapasiteettia täydentää yhteys Suomen ELIXIR-keskuksen CSC:n ePouta-pilvipalveluun.

”ELIXIRin tarjoama laskentakapasiteetti ja työkalut helpottavat muiden organisaatioiden tuottaman datan hyödyntämistä. Eurooppalaisen datan hyödyntäminen on tärkeää, mutta datan pitäisi olla standardoitua. Datan saaminen yhteensopivaksi on ison infrastruktuurin tehtävä.”

Ari Turunen

8.10.2018

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Laura Elo, & Tommi Nyrönen. (2018). Disease prediction models are becoming more accurate thanks to the computational methods. https://doi.org/10.5281/zenodo.8118762

Lisätietoja:

Turun yliopiston Lääketieteellisen Bioinformatiikan keskus:

http://elolab.utu.fi

Suomen ELIXIR-keskuksen CSC:n tarjoamat bioinformatiikan palvelut:

https://research.csc.fi/biosciences

Biotools, ELIXIRin tarjoama valikoima bioinformatiikan työkaluja:

https://www.elixir-europe.org/services/tools/biotools

ELIXIR tekee yhteistyötä genomitiedon hyödyntämiseksi yhdysvaltalaisen GA4GH:n (Global Alliance for Genomics and Health) kanssa.

https://www.ga4gh.org

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Puolet lääkeaineista vaikuttaa vain kolmeen proteiiniperheeseen

Jopa 50% hyväksytyistä lääkeaineista vaikuttaa kolmeen proteiiniperheeseen, tumareseptoreihin, G-proteiinireseptoreihin ja ionikanaviin.

Lääkeaineet vaikuttavat tavallisesti solujen reseptoreihin tai elimistön entsyymeihin, jotka ovat molemmat proteiineja. Monet lääkeaineet sitoutuvat myös entsyymireseptoreihin ja solukalvolla oleviin kantajaproteiineihin. Lääke voi esimerkiksi sitoutua entsyymin aktiiviseen kohtaan, jolloin se estää entsyymin säätelemän kemiallisen reaktion. Useimmiten entsyymeinä, jotka katalysoivat lääkkeen aiheuttavan kemikaalisen reaktion, ovat sytokromi P450-entsyymit.

Suurin osa lääkkeiden kohdeproteiineista kuuluu vain kymmeneen proteiiniperheeseen, jopa puolet vain kolmeen perheeseen. Tiettyyn perheeseen kuuluvilla proteiineilla on samalla tavalla laskostunut kolmiulotteinen rakenne, toiminta ja merkittävä samankaltaisuus aminohapposekvensseissä, mikä kertoo yleensä yhteisestä muinaisesta historiasta. Saman perheen proteiinit ovat peräisin yhdestä alkuperäisestä kantamuodosta, joka on evoluution myötä muokkaantunut ja erikoistunut ympäristön paineessa myös alkuperäisestä roolistaan poikkeaviin toiminnallisiin rooleihin solujen prosesseissa.

Tumareseptorit ja hormoniperäiset sairaudet

Vasemmalta oikealle: estrogeenireseptori, androgeenireseptori, D-vitamiinireseptori ja keltarauhashormonireseptori. Nämä proteiinit ovat rakenteeltaan ja molekyyliseltä toiminnaltaan samanlaisia, vaikka vaikuttavat elimistössä täysin erilaisiin toimintoihin. Reseptorit kuuluvat samaan tumareseptorien proteiiniperheeseen. Tämä tarkoittaa mm. sitä, että reseptoreilla on sama esihistoriallinen alkuperä. Jokaisen reseptorin kanssa vuorovaikuttava pieni molekyyli, esimerkiksi testosteroni androgeenireseptorissa näkyy rakenteen yläosassa harmaana pallo-tikku mallina. Protein Data Bankissa eli PDB-proteiinitietokannassa on yli 100 000 proteiinirakennetta, jotka jakautuvat proteiiniperheisiin. Proteiiniperheen jäsenet ovat yleensä kolmiulotteiselta rakenteeltaan samankaltaisia, ja siksi ne myös toimivat samantapaisesti.

Proteiiniperheet keksittiin, kun alettiin tuntea muutaman proteiinin rakenne ja aminohapposekvenssit. Silloin havaittiin että, proteiinit muodostuvat useita itsenäisiä rakenteellisesti erottuvia alueita, jolla on jokin erikoistehtävä. Näitä alettiin kutsua domeeneiksi.

Uusia proteiiniperheitä on löydetty eri sairauksien syntymekanismeja tutkittaessa. Esimerkiksi tumareseptorit löydettiin rintasyöpää tutkittaessa. Pitkään oli tiedetty, että kolmannekselta rintasyöpään sairastuneilta naisista, joilta oli poistettu munasarjat tai lisämunuaiset, kasvaimen kasvu loppui. Rintasyövän molekylaarinen perusta oli kuitenkin vielä mysteeri. Vuonna 1947 lääketieteen tutkija Elwood Jensen alkoi selvittää tätä. Jensen löysi estrogeeni-reseptorin ja havaitsi, että kun estrogeenireseptori aktivoituu, kun siihen sitoutuu sen luontainen estrogeeni, estradioli. Tämän jälkeen aktivoitunut estrogeenireseptori matkustaa solun tumaan, missä se osallistuu geenien toiminnan säätelyyn.

Tumareseptorien perheeseen kuuluva proteiinimolekyyli, estrogeenireseptori, on erittäin tärkeä ihmiselle. Jos sen toiminnassa tapahtuu muutoksia, niillä on suuri merkitys solujen terveyteen. Estrogeenireseptorilla on diagnosoitu olevan tärkeä rooli rintasyövän synnyssä. Normaalisti estrogeenit säätelevät estrogeenireseptorin aktiivisuutta solussa. Estrogeenireseptorin muuttunut muoto on koko ajan aktiivinen, eivätkä solun normaalit estrogeenipitoisuuteen perustuvat säätelymekanismit siten toimi oikein. Tämä voi johtaa syövän, eli säätelemättä kasvavien normalista poikkeavien solukkojen syntyyn.

Elwood Jensen osoitti, että rintasyöpäpotilaat, joilla oli alhainen estrogeenireseptoripitoisuus syöpäsoluissaan eivät hyötyneet munasarjojen poistosta. Munasarjat tuottavat suuren osan naisten aktiivisesta estrogeenista. Reseptoripitoisuus osoittaa, kenen kannattaa mennä leikkaukseen ja kenen kannattaa jättää se väliin. 1970-luvun puolivälissä Jensen ja hänen kollegansa Craig Jordan havaitsivat, että syöpäpotilaat, joiden kasvaimien muuttuneissa soluissa oli suuri määrä estrogeenireseptoreja ovat myös todennäköisesti niitä, jotka hyötyvät tamoksifeenista. Se on antiestrogeeni eli se kumoaa estrogeenin vaikutusta soluissa. Ne potilaat, joilla oli vähäisiä määriä reseptoreja, voitiin puolestaan heti siirtää muihin hoitoihin. Vuoteen 1980 mennessä Jensenin kehittämästä testistä, jolla mitataan reseptorien määrää rintasyöpänäytteistä, oli tullut standarditesti rintasyöpäpotilailla.

Estradioli kuuluu estrogeneenihormoonien ryhmään.

Estrogeenireseptori ja tamoksifeeni. Estrogeeni on kehon oma solujen estrogeenireseptorin toimintaa aktivoiva hormooni. Rintasyöpäsolussakin estrogeeni toimii myös aktivoivana tekijänä, mikä voi pahentaa tautia lisäämällä syöpäsolujen kasvua. Tamoksifeeni on nk. antiestrogneeni. Sitä käytetään syövän hoidossa estämään estrogeenin toimintaa. Tamofikseeni on pieni lääkeainemolekyyli, joka matkii estrogeenin muotoa ja sitoutuu tiukasti estrogeenireseptoriin. Kun se sitoutuu, se muuttaa reseptorin pinnalla olevan, signaalien välitykseen osallistuvan aminohapposilmukan muodon, joka on kuvattuna vihreänä. Alemmassa rakenteessa näkyy lääkesidos. Koska lääkemolekyyli on suurempi kuin estrogeenihormoni, se pakottaa silmukan ei-aktiiviseen muotoon ja estää siten kasvainta kasvamasta. Kuva: Protein Data Base

Löydöt paljastivat soluissa toimivan proteiinien superperheen, tumareseptorit, joihin estrogeenireseptori kuuluu. Tumareseptoriperheeseen kuuluvat mm. estroneegireseptorit alfa ja beta, androgeenireseptori, keltarauhashormonireseptori ja D-vitamiinireseptori. Tumareseptoreille on yhteistä, että ne aktivoituvat solukalvon läpäisevän viestimolekyylin eli ligandin, tumareseptorihormonin, sitouduttua niihin ja matkustavat tämän jälkeen tumaan vaikuttamaan solun prosesseihin. Hormonit, jotka aktivoivat tumareseptorien suurperheeseen kuuluvia jäseniä ovat mm. testosteroni, estradioli, progesteroni eli keltarauhshormoni, glukokortikoidit, mineralokortikoidit ja D-vitamiini ja lääkeainesuunnittelun avulla luodut luonnollisten ligandien rakennetta matkivat molekyylit. Esimerkiksi Norjan vuoden 2016 hiihtomaajoukkueen Therese Johaugin huulivoiteessa saattoi olla klostebolia, joka on androgeenireseptorin ligandi. Klosteboli toimii anabolisena eli lihassolujen proteiinien kasvua edistävänä tekijänä.

Ihmisen elimistöön lääkeiden tai muun reitin kautta tulevat pienet molekyylit voivat siten vaikuttaaa tumareseptoreihin niitä aktivoimalla tai sammuttamalla, ja siten vaikuttavat solun geenien toimintaan. Tumareseptorien löytäminen on muuttanut vallankumouksellisesti biokemiallisen endokrinologian tutkimuksen. Endokrinologia on erikoisala, joka tutkii ja hoitaa hormoneja tuottavien elinten sairauksia. Sairaudet voivat johtua hormonien liikatuotannosta tai niiden puutteesta, lisäksi hormoneja tuottavissa kudoksissa voi ilmetä sekä hyvän- että pahanlaatuisia kasvaimia. Ennen tumareseptoreiden keksimistä ihmiskehon hormoonien toiminta oli täysi mysteeri, nyt toimintaa osataan jo hieman muokata.

G-proteiinit ja solujen signaalinvälitys

Jotta organismi voisi toimia, signaalien pitää välittyä kehon soluissa ja niistä muodostuneissä elimissä. Elimistö kokonaisuutena lähettää ja vastaanottaa signaaleita sähkövirtojen ja tiettyjen molekyylien avulla. Martin Rodbell ja Alfred Gilman selvittivät , miten signaalinvälitys tapahtuu solukalvon läpi molekyylien yhteistoiminnan kautta. Vuonna 1970 Martin Rodbell osoitti, että signaalinsiirto tapahtuu kolmessa vaiheessa: signaalin vastaanotto, siirto ja vahvistus. Siirto tapahtuu siten, että solun pinnan proteiinista välitetään käsky vaihtaa solukalvon toisella puolella sijaitsevaan proteiiniin sitoutunut guanisiinidifosfaatti (GDP) guanosiinitrifosfaattiin (GTP). Tämä ilmiö on tiedonsiirtoa molekyylitasolla.

Vuonna 1980 Alfred Gilman tutki leukemiasoluja ja havaitsi, että ne eivät vastanneet hormonien välittämään ulkoiseen signaaliin. Syynä oli reseptoriproteiinin mutaatio, joka aiheutti sen, että hormonien signaalinvälitys estyi. Gilman eristi proteiinin normaaleista soluista ja näillä proteiineilla hän pystyi korjaamaan vaurioituneen solun. Molekyylit, jotka ovat mukana signaalinvälityksessä ovat suuri perhe proteiineja, jotka sitoutuvat guanosiinitrifosfaattiin. Kun ne ovat sidoksissa GTP:hen, ne ovat ”päällä” ja kun ne ovat sidoksissa GDO:hen, ne ovat ”pois päältä.” Gilman kutsui niitä G-proteiineiksi (guanine nucleotide-binding proteins).

G-proteiinit ovat kenties tärkeimpiä signaalinvälitykseen osallistuvia molekyylejä. Ne liittyvät joidenkin syöpämuotojen lisäksi diabetekseen, alkoholismiin sekä monien muiden sairauksien molekyylaarisiin syntymekanismeihin.

Solukalvossa olevien G-proteiineihin kytkeytyneiden reseptorien proteiiniperhe kuljettaa signaalit solun G-proteiineille solukalvon sisäpuolella. G-proteiinit puolestaan ottavat vasteen vaihtamalla GDP:n GTP:ksi. Seuraus tästä aktivoitumisesta on esimerkiksi solun sisäpuolella solulimassa pilkkomistyöhön vapautuva entsyymi, solukalvossa sijaitsevan ionikanavan avautuminen tai sulkeutuminen.

Tällä mekanismilla toimii esimerkiksi silmässä rodopsiini, joka on avulla havaitsemme silmillämme valon eli näemme. Kolmasosa tunnetuista lääkeaineista vaikuttaa G-proteiineihin kytkeytyneisiin reseptoreihin. Katekoliamiinit (mm. adrenaliini, noradrenaliini ja dopamiini), peptidit, glykoproteiinihormonit sekä rodopsiini ovat esimerkkejä ligandeista, jotka sitoutuvat näihin reseptoreihin. Alfred Gilman ja Martin Rodbell saivat 1994 Nobelin lääketieteen palkinnon G-proteiinien keksimisestä. Kemian Nobel myönnettiin vuonna 2012 Robert Lefkowitzille and Brian Kobilkalle G-proteiineihin kytkeytyneiden proteiinien toiminnan selittämisestä.

Proteiinit suorittavat työtään syklisesti ja tarkasti vaihtamalla muotoja ja molekyylejä signaalien perusteella. G-proteiinin ja G-proteiinikytkettyjen reseptorien muodot ovat jatkuvassa dynaamisesti muuttuvassa biokemiallisessa tasapainoreaktiossa keskenään. G-proteiinien herkässä tasapainossa tapahtuvat muutokset voivat aiheuttaa sairauksia. Esimerkiksi kolerabakteerin myrkky lukitsee G-proteiinit yhteen muotoon ja vaikuttaa hermoihin, jotka ohjaavat suolan ja nesteen imeytymistä suolistossa.

Ionikanavareseptorien aktiivisuus addiktion hoidossa

Beta-amyloidi on peptidi. Amyloidiplakkia kertyy Alzheimerin tautia sairastavan aivoihin.

Ionikanavat kuuluvat integraalisiin solukalvon proteiineihin eli proteiineihin, jotka ovat osa solukalvon rakennetta. Ne voivat olla ligandivälitteisiä, reseptoriohjattuja ja jänniteohjattuja.

Jotkin ionikanavat ovat monimutkaisia moniosaisia ja molekyylikooltaan valtavia rakennelmia. Valtavat ionikanavien toimintaan kytkeytyneet reseptorit reagoivat suoraan pienen pieniin ligandimolekyyleihin, kuten aivoissa sijaitseva ionotrooppinen glutamaatti-aminohappoon reagoiva reseptori. Neljästä domeenista muodostuva proteiini muuttaa auliisti muotoaan tuhansia kertoja pienemmän glutamaatin sitoutuessa signaalinvälitykseen tarkoitettuun domeeniin ja avaa solukalvon läpisevä ionikanavan. Memantiinia käytetään Alzheimerin tautiin. Se suojaa aivojen hermosoluja tuhoutumiselta estämällä liiallisen glutamaatti-välittäjäaineen vaikutuksen.

Reseptoriohjatut ionikanavat aukeavat, kun niihen kiinnittyy tietty kemiallinen yhdiste. Kemiallinen yhdiste voi olla solun ulkoinen molekyyli kuten hormoni, hermoston välittäjäaine, lääkeaine tai myrkky tai solun sisäinen molekyyli. Ymmärtämällä ionikanavareseptorien toimintaa tutkijat voivat kehittää esimerkiksi addiktion hoitomuotoja muuttamalla reseptorien aktiivisuutta.

Ari Turunen

Tommi Nyrönen

14.6.2018

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, & Tommi Nyrönen. (2018). Half of all drug ingredients affect only three protein families. https://doi.org/10.5281/zenodo.8113184

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Algoritmi määrittää sopivan lääkkeen

Professori Mikko Niemen tavoitteena on laatia tulkinta-algoritmi, joka auttaa lääkäreitä määrittämään potilaalle sopivan lääkkeen ja oikean annostuksen. Hoidot tehostuvat ja haittavaikutukset vähenevät, jolloin myös kustannukset pienenevät.

Ihmiset reagoivat lääkkeisiin eri tavoin, osalla lääkehoidon teho jää puutteelliseksi ja osalle se aiheuttaa haittavaikutuksia. Syynä poikkeavaan vasteeseen voivat olla fyysiset ominaisuutemme, muu lääkitys ja geneettinen perimämme. Lääkkeen annostarpeen tai haittavaikutusten ennakoimiseen saataisiin apua algoritmilta, kun käytössä on potilaasta saatujen fysiologisten tietojen lisäksi tietoa potilaan perimästä. Geenitesti voidaan tehdä yksinkertaisen verinäytteen perusteella.

Ihmisten geeniperimästä saadaan koko ajan uutta tietoa. Samalla geenitutkimusten ja bioinformatiikan kustannukset ovat laskeneet tuntuvasti. Dataa kertyy ja sen hyödyntämiselle on paljon uusia mahdollisuuksia. Farmakogenetiikka tutkii perintötekijöiden vaikutusta lääkeaineiden tehoon ja turvallisuuteen. Jos potilaiden perimästä saatu tieto olisi lääkäreiden saatavilla, lääkekulut ja merkittävät haittavaikutukset usein vähentyisivät. Myös sairaalahoitopäivien määrä vähenisi.

”Jos potilaiden perimä testattaisiin systemaattisesti, lääkehoidot voitaisiin paremmin räätälöidä ja annostella yksilöllisemmin”, sanoo farmakogenetikan professori, ylilääkäri Mikko Niemi.

Niemi johtaa Helsingin yliopistossa tutkimusryhmää, joka tutkii miten perintötekijät vaikuttavat lääkeaineiden pitoisuuksiin, turvallisuuteen ja tehoon. Lisäksi hän selvittää, milloin kannattaa lääkeaineen valinnassa harkita geenitestejä.

”Tieto geenitestin tuloksista tulisi olla käytettävissä silloin kun lääkettä määrätään, mutta yleensä tulosta joudutaan odottamaan viikko-pari. Voisi siis olla järkevää tutkia tärkeimmät lääkehoitoihin vaikuttavat geenimuunnokset ennakoivasti. Pyrimme tutkimustemme avulla tunnistamaan ne potilaat, jotka eniten hyötyisivät tällaisesta ennakoivasta testaamisesta.”

Niemen tutkimusryhmä kehittää myös farmakogenetiikkaan liittyviä päätöksenteon tukijärjestelmiä. Tavoitteena on laatia sydän- ja verisuonitautipotilaita hoitaville lääkäreille tulkinta-algoritmi, joka auttaisi löytämään kullekin potilaalle mahdollisimman tehokkaan ja turvallisen kolesterolilääkityksen. Algoritmi hyödyntää tietoja potilaan ominaisuuksista, sairauksista, muista lääkityksistä ja perimästä.

Sydän- ja verisuonitauteihin tarkoitetut statiinilääkkeet vähentävät veren LDL-kolesterolin ja lisäävät hyvän HDL-kolesterolin pitoisuutta. Ne aiheuttavat kuitenkin joillakin potilailla lihaskipua. Alttius lihasoireille on osittain perinnöllinen.

Sytokromi P450 (CYP) -entsyymit ovat tärkeimpiä lääkeaineita hajottavia entsyymejä. Kuvassa CYP2C8-entsyymin kolmiulotteinen rakenne.

Lääkeaineen aineenvaihdunta yksilöllistä

Yksittäisten lääkeaineiden annostarve saattaa vaihdella eri yksilöillä jopa yli 10-kertaisesti. Se voi johtua siitä, miten nopeasti tai hitaasti lääkeaine poistuu elimistöstä. Sytokromi-entsyymit (CYP) ovat keskeisiä monien elimistölle vieraiden aineiden, kuten lääkkeiden, pilkkomisessa ja poistamisessa elimistöstä. CYP-entsyymejä on erityisesti maksassa.

Kun Mikko Niemi teki väitöskirjaansa diabeteslääkkeiden yhteisvaikutuksista, hän epäili, että lääkeaineiden aineenvaihdunnan vaihtelu eri yksilöillä oli perinnöllistä. Erityisen kiinnostavia ovat kolme CYP-entsyymiä (CYP2D6, CYP2C9 ja CYP2C19), sillä ne vaikuttavat jopa kolmannekseen kaikista kliinisesti käytetyistä lääkeaineista. CYP-entsyymien aktiivisuuden geneettinen vaihtelu on suurta. Vaihtelu voi johtaa eri lääkeaineen pitoisuuksien ja vasteiden moninkertaisiin eroihin eri yksilöissä.

Lääkehoitoihin vaikuttajat perintötekijät.

Geenitestien avulla ihmiset voidaan lääkeaineesta riippuen luokitella jopa neljään eri ryhmään sillä perusteella, miten nopeasti elimistö poistaa tiettyjä lääkeaineita: erittäin nopea, normaali, hidastunut ja hidas. Tämä ns. metabolianopeus voi vaikuttaa lääkkeen annostarpeeseen, tehoon ja haittavaikutusriskiin.

Erittäin nopeilla metaboloijilla lääkeaine poistuu elimistöstä tavallista nopeammin ja sen teho voi jäädä puutteelliseksi. Hitailla metaboloijilla lääke poistuu tavallista hitaammin ja sen vaikutukset voivat korostua. Sama lääkeannos siis voi olla toisilla liian pieni ja toisilla liian suuri.

Jotkut lääkkeet muuttuvat aktiiviseen muotoon CYP-entsyymien välityksellä. Tällaisiin lääkkeisiin perinnöllisen metabolianopeuden vaikutus on päinvastainen. Esimerkiksi kolmanneksella väestöstä veren hyytymistä estävä klopidogreeli-lääke tehoaa tavallista heikommin, mikä johtuu perinnöllisesti hidastuneesta CYP2C19-metaboliasta. Tällaisille potilaille kannattaa siksi yleensä valita vaihtoehtoinen lääkitys.

CYP2D6-entsyymin vaihtelu vaikuttaa puolestaan hyvin merkittävästi mm. kodeiiniin. Kodeiini on yleinen resepti-kipulääke, josta tavallisesti osa muuttuu maksassa CYP2D6-entsyymin välityksellä morfiiniksi. Hitailla metaboloijilla kodeiinin teho voi jäädä riittämättömäksi. Erittäin nopeilla metaboloijilla morfiinin määrä elimistössä voi nousta liian suureksi.

”Jos lääkäri tietäisi jo hoidon alussa, että potilaan CYP2D6-aineenvaihdunta on hidasta, potilaan ei tarvitsisi kärsiä riittämättömästä kivunhoidosta.”

Myös muilla kuin CYP-entsyymeillä on merkitystä. Esimerkiksi TPMT on entsyymi, joka vaikuttaa tiopuriinilääkkeiden aineenvaihduntaan. Tiopuriineja käytetään mm. autoimmuunitautien, tulehduksellisten suolistosairauksien sekä leukemioiden hoidossa.

”TPMT:n perinnöllinen puutos altistaa tiopuriinilääkkeiden vakaville verisoluihin kohdistuville haittavaikutuksille. Perinnöllisen puutoksen tunnistava eenitesti on ollut kliinisessä käytössä Suomessa jo vuodesta 2005”, sanoo Mikko Niemi.

Suomessa on tällä hetkellä saatavilla kymmenkunta lääkehoitoihin liittyvää geenitestiä.

Päätöksenteon tukialgoritmi lääkäreille

Lääkeaineen sopivuus kullekin yksilölle riippuu hyvin monista tekijöistä. Siihen eivät vaikuta pelkästään lääkkeitä hajottavat entsyymit. Solukalvon kuljetusproteiinit vaikuttavat lääkeaineiden kulkeutumiseen vaikutuspaikkaansa. Kohdekudoksessa lääkeaine vuorovaikuttaa vaikutuskohteensa kanssa.

”Tästä seuraa tapahtumaketju, joka aikaansaa toivotun lääkevaikutuksen. Kaikissa näissä tekijöissä on yksilöiden välisiä, osin perinnöllisiä eroja.

Olisi tärkeää, että kaikki nämä yksilötekijät, perimä mukaan lukien, otettaisiin huomioon lääkehoitoa valittaessa.”

Mikko Niemi sai vuonna 2017 mittavan rahoituksen Euroopan tutkimusneuvostolta hankkeeseen, jossa kehitetään kolesterolilääkityksen valintaa helpottava algoritmi. Tätä varten Niemen tutkimusryhmä rakentaa niin kutsutun systeemifarmakologisen mallin.

”Se on tavallaan virtuaalinen potilas, jonka avulla voidaan yksilöllisesti ennakoida kunkin vaihtoehtoisen kolesterolilääkityksen vaikutukset.”

Vastaavanlaista algoritmia ei ole toistaiseksi yritetty kehittää.

”Mikäli algoritmi toimii kolesterolilääkityksen valinnassa, voisi samanlaista ajattelutapaa laajentaa myös muihin lääkehoitoihin.”

Alogoritmia ei luonnollisesti voida rakentaa, jos käytettävissä ei ole riittävästi luotettavaa tutkimustietoa. Tätä Niemen tutkimusryhmä on kerännyt jo vuosien ajan tutkimushankkeissaan. Suomeen perustetut biopankit ja tuleva genomikeskus nopeuttavat myös tällaisessa tutkimuksessa tarvittavan tiedon keräämistä.

Geenitiedon parempaa hyödyntämistä haluaa myös Suomen valtio. Suomen poikkeuksellisen asutushistorian vuoksi väestön geneettinen rakenne antaa erityisiä mahdollisuuksia yhdistää genomi- ja terveystietoja. Farmakogenetiikka on yksi kansallisen genomistrategian neljästä kärkihankkeesta. Strategian tavoitteena on, että geenitieto on tehokkaassa, terveyttä edistävässä käytössä jo vuonna 2020.

Pilottiprojekti: genomitiedon hyödyntäminen terveydenhuollossa

Tällä hetkellä merkittävästi lääkehoidon tehoon ja turvallisuuteen vaikuttavia geenejä on suhteellisen pieni joukko: alle 20 ihmisen kaikkiaan noin 20 000 geenistä. Koska kyseessä on näin pieni määrä geenejä, laajojenkin potilasmäärien testaus olisi Mikko Niemen mukaan teknisesti mahdollista.

”Seuraava askel on, että ennakoivasti testattaisiin kaikki lääkehoitoihin vaikuttavat geenimuunnokset.”

Terveyden ja hyvinvoinnin laitos (THL), HUSLABin Kliinisen farmakologian yksikkö ja CSC:n ovat aloittaneet pilottiprojektin, joka toteutetaan THL Biopankin geenitietoja ja HUS:n potilasasiakirjatietoja yhdistämällä. Aineistoista kartoitetaan lääkehoitoihin vaikuttavien geenimuunnosten yleisyyksiä suomalaisilla. Lisäksi tutkitaan, kuinka moni potilasotoksesta sai hoitojakson aikana tai sen jälkeen lääkehoitoa, jonka valintaan tai annosteluun geenitiedolla olisi voinut olla vaikutusta.

Tutkimusta varten HUS ja THL saavat omat yksityiset ja tietoturvalliset verkkoyhteytensä CSC:n datakeskukseen. Näin HUS ja THL voivat prosessoida dataa nopeasti ja tehokkaasti.

Projektissa varaudutaan riittävään pitkäaikaistallennustilaan, tiedonsiirtoon vähintään 10 Gbit/s nopeudella HUS:n ja THL:n järjestelmiin, sekä tarjotaan farmakogenetiikan ohjelmistoympäristölle tiedon prosessointiin tarvittava määrä virtuaalipalvelimia.

Ari Turunen

4.4.2018

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Mikko Niemi, & Tommi Nyrönen. (2018). Algorithm determines the appropriate drug. https://doi.org/10.5281/zenodo.8082229

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

Kaikkien eliöiden perimän selvittäminen mahdollistaa uusia rokotteita ja lääkkeitä

Bioinformatiikan menetelmien kehittyessä myös kustannukset ovat laskeneet. Eri eliöiden perimä saadaan selvill entistä nopeammin ja halvemmin. Edessä oleva urakka eri eliöiden ja ihmisten genomien sisältämän tiedon ymmärtämisessä on kuitenkin valtava. Se edellyttää eri tutkimusorganisaatioiden yhteistyötä ja hyvin järjestettyjä tietokantoja.

Ihmisen koko perimä selvitettiin vuonna 2003. Human Genome Project-hanke saatiin valmiiksi ennakoitua aiemmin internetin ansiosta. Se mahdollisti eri laboratorioiden tehokkaan yhteistyön. Ihmisen koko DNA saatiin sekventoitua. Ihmisen geenit on pakattu kolmeen miljardiin emäspariin. Nyt seuraavana on selvittää miten nämä geenit toimivat. Genomin emäsparien selvittämisen kautta aletaan ymmärtää eri sairauksien syntymekanismeja ja tehokkaita hoitomuotoja.

Nykyään tutkimus tuottaa genomitietoa varsin monipuolisesti. Tavoitteena on esimerkiksi arvioida tiedon avulla ympäristön tilaa ja terveysvaikutuksia tarkastelemalla mikrobeja, jalostaa ruokakasveja paremmin kuivuutta sietäviksi viljelykasveiksi ilmastonmuutoksen kriisien lievittämiseksi, tai kehittää lääkeaineita tauteihin, joihin ei tällä hetkellä tunneta hoitokeinoja. Näihin tarkoituksiin tarvitaan tietolähteiden uudenlaista yhdistämistä ja analysointia.

Amazonin alueella on ehkä kolmannes maanpäällisistä eliölajeista

Kaikki tunnettujen lajien genomit selvitetään

Eri eliöiden genomien selvittäminen on entistä helpompaa ja halvempaa. Nyt EBP-projektin (Earth Bio-Genome Project) tavoitteena on selvittää kaikkien aitotumaisten eliöiden eli eukaryoottien genomit. Esitumalliset arkit ja eubakteerit eli prokaryootit ovat soluja, joiden DNA muodostuu vain yhdestä kromosomista. Eukaryootteihin kuuluvat yksisoluiset alkueläimet ja kolme monisoluisten elöiden ryhmät: kasvit, sienet ja eläimet.

Bioinformatiikan avulla voidaan selvittää loput 80-90% niistä eliöistä, joiden genomia ei vielä tiedetä. Vuonna 2011 Census of Marine Life arvioi eläinlajien määräksi noin 8,7 miljoonaa, joista 6,5 miljoonaa on maaeläimiä ja 2,2 miljoonaa merieläimiä. Korkean suoritustehon sekvensointimenetelmiin perustuvan arvion mukaan sienilajeja voi olla jopa 5,1 miljoonaa. Kasvilajeja on arviolta 400 000.

Ensimmäistä kertaa ihmiskunnan historiassa on mahdollisuus tehokkaasti sekvensoida kaikkien tunnettujen aitotumaisten eliöiden genomi. EPB:n tavoitteena on sekvensoida kaikki 1,5 miljoonaa tunnettua eukaryoottia. Näytteitä kerätään ympäri maailmaa. Osa, ehkä noin puoli miljoonaa, saadaan kasvitieteellisistä puutarhoista. Loput joudutaan keräämään suoraan luonnosta. Yksi merkittävä keräyspaikka on Amazon. EPB aloitti tammikuussa 2018 yhteistyön brasiliaisen geenipankki-projektin kanssa, joka keskittyy Amazonin alueen eliöihin.

Amazonin alueella on eniten kasvi- ja eläinlajeja kuin missään muussa paikassa maailmassa. Ehkä kolmannes lajeista löytyy sieltä. Sademetsiin kätkeytyy valtavasti esimerkiksi potentiaalisia lääkeaineita.

Amazonin jararaca-kyykäärmeen myrkystä löydettiin ACE- estäjä eli angiotensiinikonvertaasi-niminen entsyymi, jonka vaikutuksesta syntyy verenpainetta alentavaa ja sydämen pumppaustyötä keventävää angiotensiiniä. 1970-luvulla tutkijat kehittivät synteettisen version käärmeen myrkystä.

Jararaca-käärmeen myrkystä saatiin kehitettyä verenpainelääke

Massiiviset data-arkistot

Valtameret ovat maailman suurin yhtenäinen ekosysteemi. Planktonin merkitys maailman ilmastolla on vähintään yhtä merkittävä kuin sademetsien. Kuitenkin vain pieni osa niistä organismeista, jotka luovat tämän ekosysteemin, on luokiteltu ja analysoitu. Planktoneiden muodostamat ekosysteemit sisältävät valtavasti elämää: yli 10 miljardia organismia on jokaisessa litrassa valtameren vettä sisältäen viruksia, prokaryootteja, yksisoluisia eukaryootteja ja polttiaiseläimiä. Nämä ainutlaatuiset organismit sisältävät bioaktiivisia yhdisteitä, joille on käyttöä lääketeollisuudessa, elintarvikkeina, kosmetiikassa, bioenergiassa ja nanoteknologiassa. Vuosina 2009-2013 kansainvälinen tutkimusmatka Tara Oceans keräsi 210 mittauspaikasta maailman valtameristä 35 000 biologista näytettä. Se on laajin planktonista kerätty kokoelma. Ocean Sampling Day oli kampanja jossa myös kerättiin näyttetä merestä. Tutkimusasemia pyydettiin ottamaan näytteitä ja tuottamaan dataa. BioSamples kerää kuvauksia ja metadataa biologisista näytteistä, joita on käytetty tutkimuksessa. Näytteet ovat referenssejä tai niitä on käytetty eri tietokannoissa.

Genomien ja niiden toimintaa määrittävien proteiinien selvittäminen on valtava urakka, joka ei onnistu ilman yhteistyötä. Eurooppalainen biotieteiden tutkimusinfrastuktuuri ELIXIR tarjoaa tehokkaan alustan yhteistyölle. Siihen on liittynyt lähes 200 tutkimusorganisaatiota ja infrastruktuuria käyttää yli puoli miljoonaa tutkijaa. ELIXIR mahdollistaa pääsyn eri data-arkistoihin.

Massiivinen viljely- ja metsäkasvien sekvensointi mahdollistaa kasvitautien aiheuttajien tutkimisen. EURISCO (European Search Catalogue for Plant Genetic Resources ) sisältää informaatiota 1,9 miljoonasta viljelykasvista ja sen villeistä sukulaisista. Näytteet on kerätty lähes 400 eri organisaatioon. Mukana on 43 jäsenmaata ja tarkoituksena on säilyttää maailman agrobiologinen moninaisuus.

UniProt (Universal Protein Resource) kerää proteeinisekvenssit ja annotaatiodataa. Annotaatio tarkoittaa proteiinin toiminnan määrittelyä sekvenssin perusteella. Uniprotin datan ansiosa voidaan tietää enemmän proteiinien toiminnasta ja niiden vuorovaikutuksesta muiden molekyylien kanssa, niiden sijainnista soluissa ja organismeissa. Tavoitteena on kerätä kaikki julkisesti saatavulla oleva proteiinisekvenssidata. Uniprot on laajin julkisesti avoin olema proteenisekvenssitietokanta.

Euroopan nukleotidiarkisto ENA on kokoelma joka tarjoaa vapaan pääsyn kaikkiin julkaistuihin nukleotidisekvensseihin ja annotoituihin (geenin ja proteiinin toiminnan määrittely) DNA- ja RNA-sekvensseihin. The International Nucleotide Sequence Database on yhteistyöfoorumi, jossa ovat mukana DNA Data Bank of Japan (Japani), GenBank (Yhdysvallat) ja ENA. Uusi data synkronoidaan joka päivä kolmen tietokannan välillä. Jo vuonna 2012 näissä tietokannoissa oli 5682 organismin kokonaiset genomit. Data kaksinkertaistuu joka kymmenes kuukausi.

Euroopan genomiarkisto EGA on yksi maailman laajimmista julkisista datavarastosta, joihin on tallennettu potilasdataa biolääketieteellisistä projekteista. EGA säilöö ihmisistä kerättyä geno- ja fenotyyppidataa erikseen kysyttävällä suostumuksella näytteen ja datan tutkimuskäyttöön. EGA:n ansiosta moni ELIXIRin tutkimusprojekti on mahdollinen.

Biolääketieteellinen data potilaiden terveystietoihin

ELIXIR-infrastruktuurissa on yli 20 jäsenmaata Euroopasta. Jäsenmaiden keskusten kautta tarjotaan erilaista biolääketieteellistä dataa tutkijoiden käyttöön. Hyödyt ovat kiistattomia. Ihmisten harvinaisten sairauksien selvittämisessä on ollut hyötyä esimerkiksi koirien ja kissojen geeneistä. Suomen keskuksen kautta tutkijoilla on pääsy koirien ja kissojen DNA-pankkeihin, joiden aineistojen ansioista on onnistuttu löytämään esimerkiksi hermorappeumasairauden geeni. Tavoitteena on kehittää tähän sairauteen lääke. Koirien geeneistä on hyötyä ihmisten sairauksien tutkimisessa, sillä koiran ja ihmisen geeniperimä on 95-prosenttisesti samanlainen. Koirien geenipankissa on yli 70 000 näytettä 60 000 koirasta yli 300 rodusta. Se on tiettävästi lajissaan maailman suurin.

Arvioiden mukaan vuoteen 2025 mennessä voidaan sekvensoida 100 miljoonasta kahteen miljardiin ihmisen genomia. Jos datasta halutaan saada hyödyt, genotyyppinen data pitää linkittää muihin terveystietoihin. ELIXIR pystyy tähän. Tutkimusinfrastruktuuriin kuuluu lähes 200 organisaatiota, joiden muodostama federaatio, luottamusverkosto, mahdollistaa ihmisdatan käsittelyn tietoturvallisesti. Vuoteen 2016 mennessä ELIXIR-infrastruktuurin avulla oli laadittu 21000 tieteellistä artikkelia ja saatu 8500 patenttia. Patentteja oli haettu rokotteisiin, biomarkkereihin, entsyymeihin ja ebola-viruksen torjuntaan.

Elämän biologisten molekyylien yksittäisen atomin mittakaava on nanometrin kymmenesosa. Jos tuon biomolekyylin yksi hiiliatomi olisi ihmisen kokoinen kappale, se tarkoittaisi, että sen toiminnalla voisi olla ratkaiseva vaikutusta tapahtumiin, jotka tapahtuvat kymmenien miljoonien kilometrin päässä. Aurinkokuntamme halkaisija on samaa luokkaa.

Jos yksikin hiili vaihdetaan biologisessa molekyylissä toiseen atomiin, vaikka typpeen, se voi olla ratkaiseva piirre sille, tepsiikö esimerkiksi otettu lääke. Juuri tuon atomin avulla lääkemolekyyli voi olla tarttumassa proteiiniin, mutta ei onnistukaan muutoksen seurauksena saamaan riittävän pitävää otetta.

Proteiini, johon lääkkeen oli tarkoitus vaikuttaa puolestaan jakaa käskyjä eteenpäin toisille proteiineille soluissamme. Jos käskyyn vaikuttaminen jää tekemättä, biologiseen viestiketjun vaikuttaminen jää tekemättä.

Kysymys on myös siitä, ovatko solussa sijaitsevan viestiketjun kaikki osat virheettömiä? Kaikki nämä tekijät vaikuttava siihen voivatko tutkijat suunnitella lääkemolekyylin oikein, että se voi auttaa soluja parantumaan. Solussa ei ole tyhjiötä toisin kuin avaruudessa. Solut ovat täynnä toistensa kanssa koko ajan vuorovaikuttavia biomolekyylejä. Ihmisen vaikutusmahdollisuuden esimerkiksi auringon fuusioreaktioon ovat paljon rajallisempia kuin elämän molekyyleihin tallentuneen atomitason digitaalisen informaation vaikutus ihmisen sairastumiseen, vaikka mittakaavaero on sama.

Tommi Nyrönen
Ari Turunen

20.2.2018

Artikkeli PDF-muodossa

Sitaatti

Ari Turunen, & Tommi Nyrönen. (2018). Mapping the genomes of all organisms enables the development of new vaccines and medicines. https://doi.org/10.5281/zenodo.8070219

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

http://www.elixir-europe.org

”Älyhenkivakuutuksia” tarjolla: ihmisen biologinen data hyödyttää vain oikein tulkittuna

Kun dataa kerätään entistä enemmän ihmisen perimästä ja elintavoista, on pidettävä huoli omasta tietosuojasta. Ketkä ovat tarpeeksi päteviä tulkitsemaan ja käyttämään tätä dataa?

Biologisen informaation räjähdysmäinen lisääntyminen vaikuttaa sekä yksilöihin että yhteisöihin. Ihmisen koko elinkaaren ennustaminen tietyillä geneettisillä lähtökohdilla ja elintavoilla tulee mahdolliseksi. Samaan aikaan kun tieto lisääntyy, lisääntyvät myös mahdollisuudet käyttää dataa muihin tarkoituksiin kuin alunperin on tarkoitettu. Uskaltaako tulevaisuudessa enää nauttia epäterveellisiä ruokia, jos siitä kerätään tietoa, joka voi vaikuttaa esimerkiksi vakuutusehtoihin?

Taloudelliset ja yhteiskunnalliset vaikutukset seuraavat viiden–kymmenen vuoden aikana, kun bioinformatiikkaa aletaan soveltaa ennaltaehkäisevässä terveydenhuollossa. Esimerkiksi, jos henkilöllä on tunnettu geneettinen alttius sairastua maksasairauksiin, jonka voi hoitaa elintapoja suunnittelemalla, asian kertominen varhaisessa vaiheessa luultavasti vaikuttaa elintapojen valintaan. Terveydenhuollon ammattilaiset voivat perustella suosituksiaan esittämällä esimerkkeinä tunnettuja koko elämän kattavia
hoitohistorioita sairaanhoitojärjestelmästä tai biopankista.

Avoimia kysymyksiä yhä riittää: miten ja missä laajuudessa modernia biologista informaatiota tulkitaan ja käytetään julkisessa terveydenhuollossa? Miten lainsäädäntö kehittyy? Tilaus parempaan ikääntyvien terveydenhuoltoon kasvaa ja siksi asiaan olisi saatava nopeasti selvyyttä. Monet vakuutusyhtiöt ja datan käsittelyn jätit, kuten Google, ovat kiinnostuneita avautuvista mahdollisuuksista.

Biolääketieteellinen data on arvokasta

Yhdysvaltalainen 23 & me tarjoaa kenelle vain testejä, joilla saa tiedon sadoista lääketieteellisistä riskeistä, jotka liittyvät oman perimän piirteisiin. Sairauksia, joiden synty voidaan analysoida molekyylitasolle saakka on jo paljon. On mahdollista diagnosoida sairauksia, esimerkiksi syöpiä, entistä tarkemmin. Se muun muassa vähentää rankoista hoidoista johtuvia sivuvaikutuksia. Uusilla tekniikoilla voidaan myös ennustaa yksilön terveydentilan muutoksia.

Ketkä pystyvät, saavat tai osaavat osallistua terveyden jatkuvaan tarkkailuun, jolla voidaan esimerkiksi ennustaa tulevia muutoksia? Kuka tulkitsee, onko henkilö ajautumassa vakavaan sairauteen ja voiko diagnoosiin luottaa? Kenen harvinainen sairaus saadaan parannettua ja tehdäänkö se julkisin varoin? Millä eettisillä reunaehdoilla pääsy viimeisimpiin hoitoihin koordinoidaan?

Teknologia tarjoaa koko ajan enemmän mahdollisuuksia tarkkailla reaaliaikaisesti terveyttä ja elintapoja yksilötasolla. Erilaiset teknologiset apuvälineet terveydentilan monitorointiin tulevat koko ajan halvemmiksi ja sulautuvat kaikkien jo nyt mukana oleviin laitteisiin, kuten kännykkään, vaatteisiin tai rannekelloon. Esimerkiksi vakuutusyhtiö Lähitapiolalla on Suomessa meneillään uusi kokeilu, jossa yhtiö tarjoaa ”älyhenkivakuutusta.” Vakuutusyhtiö tekee yhteistyötä biomonitoreita tekevän Polarin kanssa ja kerää mm. syke- ja elintapatietoja sovellukseen, joka auttaa lääkäreitä tekemään ennusteita henkilön terveydentilasta. Asiakkaan on mahdollista alentaa vakuutusmaksuja, jos tietyt terveelliset elämäntavan
ehdot toteutuvat vakuutusyhtiölle luovutetussa datassa. Yksilöt siis hyötyvät alentuneista vakuutusmaksuista, jotka kannustavat terveempiin elintapoihin. Vastapalveluksena vakuutusyhtiö hyväksyy ”maksuvälineeksi” dataa, jota se hyödyntää.

Tämä data on arvokasta. Luotettavat ja hyvin järjestetyt datalähteet, joita käytetään yksilöiden terveyden tulkinnassa, ovat valuuttaa kansainvälisessä kaupankäynnissä. Britanniassa National Health Service NHS on päättänyt avata yli miljoonan lontoolaisen hoitohistorian Googlelle. Toiveena on, että Google asiantuntijoiden pääsy dataan auttaa ehkäisemään suuria kustannuksia julkisessa terveydenhuollossa aiheuttaviin munuaissairauksiin. Arvioidaan, että jopa neljännes sairaustapauksista voitaisiin estää, jos riskitilanteet havaittaisiin aikaisemmin ja henkilöt muuttaisivat elintapojaan. Tämä toisi merkittäviä säästöjä julkiselle sektorille ja parantaisi kansanterveyttä.

Kuka omistaa datan ja sen tulkinnat?

Ihmisten itse itsestään kerryttämä elämäntapaan liittyvä data esimerkiksi lenkeistä, syödystä ruuasta ja nautitusta alkoholista päätyy tällä hetkellä internetiin hyvin erilaisiin palveluihin, tai häviää muutaman vuoden sisällä keruusta. Dataa keräävien palveluiden tarkoitus on useimmiten voiton tavoittelu esimerkiksi sitouttamalla ihmiset teknologisten laitteiden ekosysteemiinsä. Siksi kerrytetyn datan liittäminen kolmansien osapuolten tietolähteisiin ei useinkaan onnistu. Datan käyttö luotettavan diagnosoinnin tukena vaatii pääsyä laajoihin ja tutkimuksiin, joiden valossa esimerkiksi yksittäinen näytteestä saatu data voidaan tulkita oikein. Tällainen datan integraatio on vielä alkutekijöissä.

Kehitysvauhti on kuitenkin valtava. Esimerkiksi koirista kerätyn datan tarkastelua rajoitetaan lainsäädännöllisesti vähemmän kuin ikuin ihmisistä, ja niille on jo saatavissa monenlaisia genetiikkaa ja elintapoja yhdistäviä terveyttä edistäviä palveluita (MyDogDNA). Ihmisen parhaan ystävän seuraava suuri palvelus voikin olla auttaa osoittamaan, millä tavalla geneettistä biologista informaatiota kannattaa käyttää terveydenhoidossa.

Terveydenhuollon organisaatiot keräävät dataa ja näytteitä ihmisistä hoitojen ohella tutkimustarkoituksiin. Datan ja näytteiden luottamuksellisesta keruusta on aina vastuussa lääketieteen ammattilainen. Kerääjän lupa kysytään, jos näitä käytetään uusiin tarkoituksiin.

Vallitseva käytäntö helpottaa ratkaisevasti terveyttä parantavien tutkimusten tekemistä. Pohjoismaissa on ollut vuosikymmeniä toiminnassa keskitetty terveydenhuolto, joka on kyennyt myös organisoimaan ja tarjoamaan laadukasta dataa tutkimustyötä varten. Esimerkiksi norjalaisista yli 30 prosentin osalta on näyte biopankissa. Suomessa on koottu yli 150 miljoonaa sairaskertomusta 4,3 miljoonasta kansalaisesta arkistoon.

Suomessa on yhteensä noin 5,4 miljoonaa asukasta ja vuonna 2016 lähes kaikkien lääkereseptit
päätyvät samaan arkistoon. Biopankkilaki Suomessa takaa myös sen, että datan vastuullinen tutkimuskäyttö voi tapahtua informoimatta jokaista kansalaista erikseen asiasta. Kokonaisuus antaa erinomaiset lähtökohdat tulkita geneettisten lähtökohtien ja elämän aikana tapahtuvien asioiden yhteyksiä, jos voidaan luoda pääsy dataan turvallisesti ja riittävän avoimesti suurelle kansainväliselle joukolle taitavia analyytikoita.

Mutta mitä datasta voi lukea nyt ja ennen kaikkea mitä tulevaisuudessa? Britanniassa Googlelle on annettu pääsy kaikkeen potilasdataan, koska ennalta ei voi tietää, mitkä tekijät ovat ennustavia ja selittäviä munuaissairauden kehittymiseen. Mutta entä jos tätä ennustettaessa käy ilmi, että henkilöllä on akuutti riski saada sydänkohtaus? Pitäisikö asiasta kertoa henkilölle? Pohjoismaiset biopankit ovat tutkineet, että noin 60 prosenttia ihmisistä haluaa tietää satunnaisista löydöistä. Loput 40 prosenttia ei halua tietää. Kuka omistaa ihmisestä kerätyn datan ja näytteet ja kenellä on oikeus hallinnoida niitä esimerkiksi tutkimustarkoituksiin?

Ratkaisuna avoin datapalvelu

Lainsäädännön on luotava linjauksia, jotka eivät jarruta kehitystä biologisen informaation ymmärryksestä. Lakien pitäisi suojella riittävästi datan luovuttajia ja lähteitä väärinkäytöksiltä ja ylläpitää datan infrastruktuuria ja sen palveluita, joiden varaan voidaan rakentaa uusia palveluita. Terveydenhoidon päätöksenteon tukijärjestelmät nojautuvat rakennettuihin ja ylläpidettyihin tietolähteisiin.

Kansainvälisessä yhteistyössä pystytään rakentamaan ihmisen geneettisten lähtökohtien ja elintapojen
ja hoitohistorian valossa luotettavampia tietolähteitä kuin yksikään maa pystyy yksin rakentamaan. Tämän vuoksi olisi pyrittävä kohti globaalisti saatavilla olevia datan lähteitä myös ihmiseen liittyvän biologisen informaation käsittelyssä ja tulkinnassa.

Kansainvälinen pääsy dataan lisää demokratiaa, koska ihmisistä kerätyn tutkimusdatan käytön tulkintoihin tarvittavat kustannukset voidaan jakaa. Samalla voidaan tukea maita, jotka eivät yksinään kykenisi luomaan tietopalveluita. Ihmisistä saadaan tehtyä nykyään mittauksia kaikkialla, mihin internet yltää – haaste on, että mittaustulosten tulkinta voidaan suorittaa luotettavasti. Tähän kansainvälisesti avoimet ja tietoturvalliset tietopalvelut olisivat yksi ratkaisu.

Esimerkiksi ihmisen perimässä on noin 20 000 sellaista geeniä, jotka ohjeistavat elimistön kaikkia toimintoja. Joskus geneettinen informaatio kuitenkin korruptoituu, mikä voi johtaa esimerkiksi rintasyövän syntyyn. Kansainvälinen tutkimusryhmä on osoittanut, että perimässä on täsmälleen 93 geeniä, jotka mutatoituessaan muuttavat terveen solun rintasyöpäsoluksi. Tämänkaltainen informaatio on erittäin tärkeää suunniteltaessa uusia lääkkeitä, koska mutatoituneesta geenistä syntyvät proteiinit ovat kohteita lääkemolekyylien suunnittelulle. Sairastunut henkilö voidaan myös entistä tarkemmin diagnosoida tiedon avulla.

Tämän tyyppisen biodatan sulkeminen rajoitetun joukon saataville olisi väärin. Siksi tarvitaan avoimia palveluita biologiselle informaatiolle, jotta tutkimustulokset ovat yliopistojen, tutkimuslaitosten ja lääketeollisuuden saatavilla silloin, kun niitä tarvitaan. Yksi tällainen tietopalvelu on European Genome-Phenome Archive EGA, joka on osa eurooppalaista ELIXIR-tutkimusinfrastruktuuria. EGA suojelee biologista informaatiota vanhalla mantereella. EGA varastoi suuria ihmisperäisiä biolääketieteellisiä data-aineistoja ja jakaa dataa luvanvaraisesti. Tähän eurooppalaiseen globaaliin palveluun voivat laittaa dataa niin yliopistot, tutkimuslaitokset, yritykset kuin julkishallintokin. Palvelua on käytetty esimerkiksi pohjoismaisessa julkisessa terveydenhuollossa pitkien aikasarjojen ja koko populaation (geenipoolin) kattavien tutkimusten datan julkaisuun.

Seuraavien vuosikymmenien aikana ihmisistä kerätyn data hyödyntäminen on osa yhteiskuntaa. Valistuneet kansalaiset osaavat vaatia uudenlaisia terveyspalveluita. Alan yksityisten palveluiden sektori voi kasvaa nopeasti. Tarvitaan kuitenkin kansainvälisesti luotuja tietolähteitä ja standardeja, joiden varaan pieni- ja keskisuuri sektori voi rakentaa ja jotka tuovat takuita mittausdatan tulkinnan laadulle. Geneettisen, molekyylibiologisen ja elintapoja keräävien tietolähteiden korrelointi on vasta aloitettu.

Tommi Nyrönen

6.4.2017

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, & Tommi Nyrönen. (2017). ”Smart life insurances” offered: human biological data is only useful when interpreted correctly. https://doi.org/10.5281/zenodo.8070130

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 20 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

Syöpää vastaan matematiikalla

Syövän tutkimuksessa käytetään entistä enemmän laajoja data-aineistoja ja tietokantoja. Helsingin yliopiston lääketieteellisen tiedekunnan systeemibiologian professorin Sampsa Hautaniemen tutkimusryhmässä kehitetään menetelmiä, joiden avulla voidaan integroida dataa eri lähteistä, kuten DNA:sta, geenien ilmentymisestä ja proteiinien toiminnasta. Kun analyysien tulokset yhdistetään biolääketieteellisiin tietokantoihin, voidaan tehdä kokeellisesti testattavia ennusteita. Tästä on hyötyä esimerkiksi diagnostiikassa ja hoitomenetelmien suunnittelussa.

Sampsa Hautaniemi työskenteli Massachusetts Institute of Technologyssa (MIT) ennen kuin perusti oman tutkimusryhmän Helsingin yliopistoon vuonna 2006. Hautaniemen laboratoriossa analysoidaan monimutkaisia, sairauksiin liittyviä biologisia järjestelmiä matemaattisin menetelmin. Ilman laskennallista apua tietomassojen analysointi ei onnistu.

”Biolääketieteellisessä tutkimuksessa, etenkin tulosten tulkintavaiheessa, tarvitaan tietokantoja ja laskennallisia menetelmiä”, toteaa Hautaniemi.

Biomedicumissa toimivan systeemibiologian ryhmän tavoitteena on soveltaa laskennallisia menetelmiä lääketieteellisiin tutkimuskysymyksiin. Esimerkiksi mitkä geneettiset profiilit vaikuttavat syövän riskiin tai millainen ennuste potilaalla on, jos hänellä on tietty geneettinen profiili? Tarkoituksena on löytää potilaalle yksilöllinen, genomisen profiilin mukainen hoito keino.

”Meidän tavoitteemme on ymmärtää syöpäsolun käyttäytymistä ja etsiä kohteita, joiden aktiivisuutta muokkaamalla syöpäsolut saadaan kuolemaan mahdollisimman pienillä sivuvaikutuksilla. Kun syöpäpotilasta halutaan hoitaa, niin pitää ymmärtää ensin, miten kasvaimen solut tekevät päätöksiä siitä, miten ne kasvavat, lisääntyvät ja liikkuvat. Pyrimme tähän genominlaajuisten mittausmenetelmien ja matemaattisten menetelmien avulla.”

Esimerkiksi rintasyövän hoidossa on tärkeää pystyä ennakoimaan etäpesäkkeiden syntymisen todennäköisyys. Vaikka hoitoennuste rintasyövälle paranee koko ajan, etäpesäkkeet lisäävät huomattavasti sairastumisriskiä.

”Ongelma on, että ei tiedetä miten ja mitkä solut kasvaimesta irtoavat, minne ne menevät ja kuinka ne siellä toimivat.”

Tutkimalla geenien aktiivisuutta ja yhdistelemällä tietoa pyritään päättelemään, kenellä on suuri todennäköisyys saada etäpesäkkeitä. Nykyiset mittausmenetelmät, kuten mikrosirut ja uuden sukupolven sekvenaattorit, tuottavat valtavat määrät dataa.

”Emme tällä hetkellä vielä tiedä solun sisäisiä päätekijöitä, jotka vaikuttavat syövän hoitovasteeseen. Siksi tutkimuksessa käytämme koko genomin mittaavia menetelmiä eri tasoilta.”

Tällaisia menetelmiä ovat DNA:n ja RNA:n sekvensointien lisäksi mm. epigenetiikka, jossa analysoidaan elintapojen vaikutusta geenien toimintaan. Tärkeää on myös proteomiikka, joka selvittää proteiinien ja niiden rakenteen toimintaa.

Sopiva lääke datan perusteella

Yhdestä syöpäkasvaimesta voidaan mitata yli neljä miljardia havaintopistettä. Tästä havaintomassasta pitäisi pystyä löytämään syövän kehitykselle ja lääkevasteelle ominaisimmat tekijät. Hautaniemen mukaan muutos on melkoinen, kun sitä verrataan tilanteeseen 10–20 vuotta sitten, jolloin tavallisesti puhuttiin muutamien kymmenien tai satojen havaintojen käsittelystä.

”Lisäksi tietokannoista löytyy genominlaajuista tietoa tuhansista syöpäpotilaista. Näiden hyödyntäminen suomalaisen aineiston rinnalla on tärkeää, mutta haastavaa.”

Ennusteen lisäksi Hautaniemen ryhmä etsii laskennallisen analyysin perusteella myös sopivia hoitomenetelmiä. Hautaniemen ryhmä kartoittaa esimerkiksi geenimuunnosten vaikutusta lääkevasteeseen. Syövän hoidossa käytetään solunsalpaajia eli sytostaatteja, jotka tuhoavat syöpäsoluja. Tärkeää on löytää sopiva sytostaatti, sillä potilas ei aina reagoi hyvin annettuun lääkeaineeseen.

Hautaniemen laboratorio on yhteistyössä professori Olli Carpénin ryhmän kanssa käyttänyt tutkimuksessaan genominlaajuista tietoa sadoista munasarjasyöpäpotilaista. Tutkijat ovat etsineet potilaitten joukosta sellaisia alaryhmiä, jotka ovat kehittäneet resistanssin tavanomaiselle kemoterapiahoidolle, jossa käytetään solunsalpaajina platinajohdoksia ja taksoideja.

Tutkimushanke käyttää satojatuhansia prosessoritunteja supertietokoneen laskentaaikaa sekä kymmeniä teratavuja tallennuskapasiteettia.

”Tietynlaisen geneettisen profiilin omistavalle henkilölle jotkin lääkkeet voivat olla jopa haitallisia, toisesta taas on optimaalinen hyöty.”

Miten data muutetaan tiedoksi?

Hautaniemi ryhmineen on kehittänyt menetelmiä käyttämällä lymfoomaan liittyvää dataa yhdessä professori Sirpa Lepän ryhmän kanssa. Haasteena on, miten geeneistä ja proteiineista kerätty data muutetaan tiedoksi.

“Kliinisistä näytteistä tehdyt havainnot ovat aina melkoisen kohinaisia ja moniulotteisia, eli geenejä, proteiineja tai potentiaalisesti kiinnostavia DNA-alueita on tuhansia. Siksi on olennaista vastata oikeisiin ja tarpeellisiin lääketieteellisiin kysymyksiin niin, että tulokset ovat hyödyllisiä. Tämän jälkeen tutkimuskysymykset pitäisi voida ratkaista matemaattisilla menetelmillä.”

Lymfooma- ja munasarjasyöpädataa analysoidessaan Hautaniemen ryhmä käytti niin sanottua syväsekvensointimenetelmää. Menetelmässä DNA tai RNA pilkotaan ja sekvensoidaan, minkä jälkeen molekyylien emäsjärjestys muutetaan tietokoneen ymmärtämään muotoon. Tietokonemuotoon muutettuja lyhyitä sekvenssipätkiä voi olla satoja miljoonia.

Hautaniemen mukaan suurin pullonkaula lääketieteellisen datan muuttamisessa tiedoksi on ehkä lääketieteellisten kysymysten ymmärtäminen niin, että ne voidaan muokata laskennallisiksi ongelmiksi.

Tämän ongelman ratkaisemiseksi Hautaniemi ryhmineen on kehittänyt tietokoneohjelmiston nimeltä GROK (Genomic Region Operation Kit). Sen avulla kysymykset saadaan käännettyä laskennallisiksi ongelmiksi ja pystytään ratkaisemaan datan perusteella. GROK-työkalu on yleiskäyttöinen ja sitä on käytetty eturauhassyövän etenemisen ymmärtämiseen. Tutkimus tehtiin yhteistyössä professori Olli Jänteen laboratorion kanssa. Yhteistyön tuloksena FoxA1proteiinin toimintaa yhdessä AR-proteiinin kanssa, joka on keskeisin eturauhasssyövässä vaikuttava proteiini, ymmärretään paremmin. Lisäksi tutkimuksessa huomattiin, että suuri määrä FoxA1proteiinia antaa huonon ennusteen, pieni määrä hyvän. Tulevaisuudessa tuloksia voidaan käyttää hoitoennusteen tekemisessä ja hoidon suunnittelussa. Hautaniemen mukaan kehitettyjä menetelmiä voidaan soveltaa mihin tahansa syöpään.

”Olemme esimerkiksi tutkineet rinta-, eturauhas- ja munasarjasyöpiä kehittämillämme menetelmillä. Vaikka kasvaimet löytyvät eri elimistä, niin niillä on huomattavan paljon samankaltaisuuksia molekyylitasolla. Siten tulevaisuudessa voisi olla mahdollista käyttää rintasyöpälääkettä esimerkiksi joissain munasarjansyöpien alatyypeissä. Tätä ennen pitää pystyä karakterisoimaan kunkin syövän alatyypit. Tämä tarkoittaa sitä, että pystymme tulevaisuudessa sekä löytämään luotettavasti samankaltaiset syövät riippumatta niiden sijainnista ja suosittelemaan niille sopivaa tehokasta lääkitystä.”

Hautaniemi uskoo, että tulevaisuudessa syöpäsolun sekvensointi on osa rutiinisyöpädiagnostiikkaa.

“Pyrimme löytämään tekijät kullekin kasvaintyypille ja yksittäiselle kasvaimelle, ja on vain ajan kysymys, kun ymmärrämme kasvaimien biologiaa niin hyvin, että pystymme laskemaan nopeasti ennusteen ja todennäköisesti toimivien lääkkeiden kombinaatiot niiden genomin perusteella. Tähän pääsemisessä ja teknologian hyödyntämisessä laskennalliset tieteet ovat avainasemassa.”

ELIXIR: eurooppalaista helpotusta biolääketieteellisen datan käsittelyyn

Biotieteellisten kokeiden tuottama data kaksinkertaistuu nykyään muutaman kuukauden välein, ja määrä on edelleen kasvussa. Lisäksi kokeet tuottavat aivan uudenlaista dataa. Tutkimusten tuottamien valtavien datamäärien kertyminen on synnyttänyt tarpeen hallita kaikkea tuota informaatiota systemaattisesti. ELIXIRin tavoitteena on harmonisoida datan tallennus, käsittely ja analysointi.

Tietokannat alkavat monessa suhteessa olla elintärkeitä biotieteiden tutkimukselle, mutta niitä on usein ylläpidetty ikään kuin muun tutkimustoiminnan ohella ja määräaikaisen tutkimusrahoituksen varassa. Yksi ELIXIRin merkittävimmistä tavoitteis ta onkin tärkeimpien biologista tutkimustietoa sisältävien tietokantojen rahoituksen turvaaminen. Kun tietoa kokoava ja jakeleva järjestelmä on kuitenkin pysyvä, tutkimusryhmät voivat rakentaa omaa toimintaansa sen varaan. ELIXIR infrastruktuuri tarjoaa myös järjestelmän ja rahoitusväylän Suomessa kehitetyille, koko Euroopassa merkittäville palveluille. Kaikkien ei tarvitse tehdä samaa tietokantaa itse, vaan kertaalleen luotua dataa voidaan käyttää tehokkaasti useammassa paikassa ja tehtäviä voidaan jakaa.

”Bioinformatiikan ala on niin laaja, ettei yksikään laboratorio pysty tarjoamaan kaikkia palveluita laidasta laitaan. Se, mitä Suomen ja ESFRI-hankkeiden infrastruktuurit tuovat tullessaan on tietty selkeys ja tiedonkulun parantuminen. Tiedämme, mitä muualla tehdään ja suunnitellaan”, Hautaniemi huomauttaa.

Ari Turunen

24.9.2015

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Sampsa Hautaniemi, & Tommi Nyrönen. (2015). Fighting cancer with mathematics. https://doi.org/10.5281/zenodo.8068867

Lisätietoja:

Genomic region operation kit

http://csbi.ltdk.helsinki.fi/grok/

Ovaska, Lyly, Sahu, Jänne, Hautaniemi (2013): Genomic region operation kit for flexible processing of deep sequencing data

CSC – Tieteen tietotekniikan keskus Oy

http://www.csc.fi

https://research.csc.fi/cloud-computing

ELIXIR

https://www.elixir-europe.org

Web-mikroskooppi tallentaa kudosnäytteet pilveen

Suomalaisten lääkärien Johan ja Mikael Lundinin keksintö tarjoaa tehokkaan ratkaisun kudosleikekuvien analysoimiseen ja tallentamiseen.

Tutkimusdata lisääntyy valtavasti vuosi vuodelta, mikä edellyttää ohjelmistonkehittäjiltä jatkuvaa aktiivisuutta. Isoja datamääriä on pystyttävä analysoimaan ohjelmistoilla, jotka eivät pistä työasemaa jumiin. Suomen molekyylilääketieteen instituutin (FIMM) tutkimusjohtaja Johan Lundin tutkii ja kehittää kuvaperustaista diagnostiikkaa konenäköratkaisujen avulla. Tulevaisuudessa eri datalähteitä, geneettistä dataa, kudosdataa ja kliinistä potilasdataa, yhdistämällä voidaan laatia persoonakohtaisia tautiennusteita ja hoitomuotoja. Tätä on sovellettu erityisesti rinta- ja eturauhassyövän sekä paksunsuolen syövän hoitamisessa.

Helsingin yliopistollisessa keskussairaalassa 2000-luvun alussa työskennellessään Lundin turhautui siihen, miten hankalaa isojen kudosleikekuvien käsittely oli työasemilla. Kudosleikekuvat ovat 1-2 gigatavun kokoisia, joten niiden tallentaminen omalle kovalevylle ei ole järkevää. Kuvien pyörittely on myös hidasta. Johan Lundin alkoi miettiä veljensä Mikaelin kanssa toimivaa ohjelmistoratkaisua ongelmaan.

Veljekset kehittivät täysin web-pohjaisen ohjelmiston, jonka olennaisia osia ovat tehokas kuvapalvelin sekä web-käyttöliittymä joka toimii kaikilla selaimilla. Heidän käyttämänsä kompressioalgoritmin avulla kuvat vievät vähemmän tilaa ja latautuvat nopeasti. Kahden gigatavun näytekuva voidaan kompressoida puolen gigan kokoiseksi. Kudosnäyte tallennetaan pilveen ja isoa datamäärää
voidaan käsitellä omalta työasemalta helposti ja nopeasti.

Verkossa toimivaa mikroskooppipalvelua voi käyttää kaikilla selaimilla ja tableteilla, myös älypuhelimilla. Web-Microscope® on myös yhteensopiva eri mikroskooppivalmistajien kuvaformaattien kanssa. Web-mikroskoopilla on mahdollista tutkia erittäin laajoja aineistoja ja
se sopii hyvin myös yhteistyöprojektien yhteiseksi digitoitujen kuvien hallinta- ja analysointipaikaksi.

”Palveluun on ollut todella kasvavaa kiinnostusta. Lääkärit, tutkijat ja opettajat ovat siirtymässä digitaaliseen mikroskopiaan. Verkossa toimiva pilvipohjainen palvelu on edistyksellinen ratkaisu digitaalisen mikroskopian käyttäjille kaikkialla maailmassa,” toteaa palvelua tarjoavan Fimmicin toimitusjohtaja Kaisa Helminen. Helminen on koulutukseltaan biokemisti ja työskennellyt aiemmin useissa bioalan firmoissa.

Fimmic perustettiin vuonna 2013 ja seuraavana vuonna palvelua alettiin kaupallistaa. Fimmicin asiakkaita ovat mm. yliopistot, tutkimuslaitokset, lääkeyritykset sekä ulkoista laadunvalvontaa tekevät yritykset. Ulkoinen laadunvalvonta tehostuu kun näytteitä voidaan lähettää virtuaalisesti analysoitavaksi sen sijaan, että lasilevyillä olevia näytteitä postitettaisiin laboratorioihin.

Näiden palvelujen tuottamisen kumppanina Fimmic käyttää Tieteen tietotekniikan keskuksen CSC:n cPouta-pilvipalvelua. Se tarjoaa web-mikroskoopin käyttäjille oman palvelimen, nopean kaistanleveyden ja valtavasti tallennustilaa. Näin taataan, että palvelu toimii mahdollisimman tehokkaasti. Web-mikroskooppi soveltuu myös biopankeille kudosnäytteiden hallinnoimiseen. Palvelu voidaan räätälöidä yksittäiselle biopankille sopivaksi.

Näytteen tallennus suoraan asiakkaan tilille

Mikroskooppiskannerit ovat kalliita laitteita – hinta vaihtelee tyypillisesti 150 000 – 300 000 euron välillä. Skannereiden määrä kuitenkin lisääntyy ja kun kuvia skannataan, monelle käyttäjälle kätevin ja edullisin ratkaisu on tallentaa ne suoraan pilveen.

”Mikäli asiakkaalla ei ole mahdollisuutta käyttää skanneria, hän voi lähettää näytteet meille skannattavaksi. Me tallennamme digitoidut näytteet suoraan asiakkaan Web-Microscope-tilille,” Helminen kertoo.

WebMicroscope-portaalin kautta käyttäjä voi jakaa omia mikroskooppikuviaan eri tutkimusryhmille ja yhteistyökumppaneille ympäri maailmaa. Tämä on tärkeä ominaisuus, koska esimerkiksi lääkeainesuunnittelussa testitulosten jakaminen nopeasti tutkimusryhmien ja lääkeyhtiöiden kesken
on edellytys läpimurroille. Lääkekehitykseen liittyvä tutkimus on yksi Fimmicin
painotuksista.

Perinteisellä mikroskoopilla voidaan tarkastella vain pientä osaa näytteestä kerrallaan. Mikroskooppiskanneri kuvaa näytteen suurella objektiivilla, jolloin koko näyte on yksityiskohtineen digitoitu. Syntynyttä kuvaa voidaan web-mikroskoopin avulla katsella helposti ja nopeasti, paikasta
riippumatta.

”Tarkasteltavaksi voidaan ottaa osa kudosnäytteestä Google Mapsin tavoin ja katsoa siitä vain osa ja siirtyä nopeasti toiseen kohtaan. Kuvaa ei tallenneta työasemille, vaan se latautuu verkon yli suoraan kuvapalvelimesta.”

Kaikissa Suomen lääketiedettä opettavissa yliopistoissa käytetään web-mikroskooppia opetustarkoituksiin anatomian ja patologian kursseilla. Webmikroskoopin avulla digitoituja näytteitä
voidaan helposti jakaa opiskelijoille ja liittää oheen muita dokumentteja ja videoita.
Omat sivut voidaan suojata salasanalla ja ohjelmiston avulla voidaan suorittaa myös tenttejä. Virtuaalisia näytteitä voidaan katsoa etäopetuksessa vaikkapa tableteilta tai älypuhelimilta ja luokkahuoneessa isolta näytöltä. Sovellus sopii erinomaisesti monipistetunnistusta hyödyntäviin Multitouch–näyttöihin. Massiivisia kudosleikekuvia voidaan tällöin tarkastella helposti ja nopeasti
suurella kosketusnäytöllä isommankin ryhmän kesken.

Konenäköä kehitetään

Mikroskooppiskanneri tuottaa paljon dataa. Tarkasteltavana voi olla miljoonia havaintopisteitä, joiden käsittelyyn tarvitaan laskentatehoa ja hyviä algoritmeja. Fimmicin suunnitelmissa on kehittää ohjelmistoa eteenpäin ja tuoda siihen kvantitatiivisen kuva-analyysin työkaluja, algoritmeja.
Kaisa Helmisen mukaan mahdollisia tutkimuskohteita, joihin algoritmeja voidaan käyttää, on valtavasti.

”Konenäköalgoritmit perustuvat signaalin käsittelyyn. Konetta opetetaan kymmenillä ellei sadoilla kuvilla tunnistamaan tietty signaali taustasta, esim. värjätyt solut muusta kudoksesta. Seulonta on tapauskohtaista ja vaihtelee, miten eri näytteitä on käsitelty. Algoritmi on juuri niin hyvä kuin se
on opetettu.”

Tähän kaikkeen tarvitaan laskentatehoa, jota saadaan mm. CSC – Tieteen tietotekniikan
keskuksen supertietokoneista.

”Laskentatehoa vaaditaan paljon, koska tutkittavat kuvat ovat ns. suurkuvia (whole slide images). Toki näistä saatetaan rajata pienempiä alueita analyysiä varten, mutta silti laskentatehoa vaaditaan paljon, jotta analyysi ei veisi liikaa aikaa,” Kaisa Helminen huomauttaa.

Ari Turunen

1.8.2015

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Kaisa Helminen, & Tommi Nyrönen. (2015). Webmicroscope stores tissue samples in the cloud. https://doi.org/10.5281/zenodo.8068745

Lisätietoja:

Fimmic Oy

Fimmic kehittää teknologiaa ja palveluja liittyen digitaaliseen mikroskooppikuvantamisen, kuva-analyysin ja informatiikan teknologiaa ja palveluja.
http://www.fimmic.com

CSC – Tieteen tietotekniikan keskus Oy

CSC on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon
osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing