Elixir logo

THL, HUS ja CSC yhteistyöhön edistämään genomitiedon hyödyntämistä terveydenhuollossa

Tavoitteena kansallinen palvelu perimästä saadun datan hyödyntämiseen terveydenhuollossa

Parempaa satoa luvassa? Myös data kerätään jatkossa talteen

Mikrobit ja ilmastonmuutos

Suomalaisten koko perimä talteen? Datasta hyötyä tautien tutkimiseen

Molekyylidatasta saadaan paljon hyötyä tautien tutkimiseen

ELIXIR esittelee uudessa julkaisussaan neljä tiedealaa, jotka hyödyntävät sen palveluja

Proteiinien rakenteen selvittämisen avulla uusia lääkemolekyylejä

Tulevia tapahtumia

BBMRI.fi: yhteinen biopankkien IT-infrastruktuuri

BBMRI.fi: yhteinen biopankkien IT-infrastruktuuri

Saimaannorppa apuna populaatioiden perimän tutkimisessa

"No country can manage in isolation"

BioSB RNA- seq data analysis course (5th edition) Mon 07- 09.09.2015 Leiden, Netherlands

ELIXIR Curation Hackathon I :. Registration of Tools & Data Services November 19 - 21, CBS-DTU, Denmark

ELIXIR Innovation and SME Forum: Turning big data into growth. University of Copenhagen, Denmark, Nov 24-25, 2014

ELIXIR Denmark - First Annual Danish Bioinformatics Conference, Odense, Denmark, Aug 27-28, 2015

The EMBO conference: "The biochemistry and chemistry of biocatalysis: From understanding to design" June 12 (Sunday) to June 15 (Wednesday) 2016, University of Oulu, Oulu, Finland.

Web-mikroskooppi tallentaa kudosnäytteet pilveen

Saimaannorppa apuna populaatioiden perimän tutkimisessa

ELIXIR uutiskirje on ilmestynyt!

Web-mikroskooppi tallentaa kudosnäytteet pilveen

Mustit ja Murret ihmissairauksien geenilöytöjen takana: koirageenitutkimus hyötyy ELIXIRin tietokannoista

Majakat valaisevat väylää genomitutkimuksen dataan

Biotiedettä eurooppalaisessa pilvessä

CSC cPouta Cloud Course 01.06.2015

ELIXIR nousuun merkittävän Horisontti 2020 -rahoituksen turvin

ELIXIR Suomen keskuksen avajaiset 4.5.2015

ELIXIRILLE rahoitusta Suomen Akatemialta

Suomi liittyi ELIXIR-infrastruktuuriin

How to Utilize New CSC Computing Resources in Your Research 19.8 2014

Internal Workshop on Membranes - From Fundamentals to Applications 19.8-22.8 2014

CSC johtaa arkaluontoisen datan pohjoismaista projektia

CSC avasi Pouta-pilvipalvelun: palvelu avoin myös biotieteille

ELIXIR hyödyntää uutta nopeaa tietoliikenneyhteyttä Viron ja Suomen välillä

Schrödinger workshop for computational modeling of protein-ligand interactions and biologics 4.4.2014

CSC Spring School in Bioinformatics 31.3-3.4.2014

14th SocBiN annual conference in bioinformatics 11-13.6.2014

BioMedBridges RDF Workshop 29-30.4.2014

ICRI 2014, 2-4.4.2014

2nd BiomedBridges Annual General meeting 10-12.3 2014

ELIXIR laillisesti toimintaan

ELIXIR Founding Ceremony and Launch Event 18.12.2013

ELIXIR UK Training Workshop 4.10.2013

Federated Identity Management for Research Collaborations in Helsinki 2.10.2013

ISMB-ECCB 21.6.2013

INSTRUCT Biannual Conference 22.5.2013

ESFRI Workshop on EU Structural Funds 15.5.2013

Enlighten Your Research Global palkinto: samoja virtuaalikoneita eri pilvipalveluihin

FIMM laajentaa laskentainfrastruktuuriaan genomi- ja kuvantamistutkimuksen tarpeisiin

REMS: Työkalu tutkimusdatan ja tietokantojen hallintaan

Bio-IT world Europe

Bioinformatics with large data-sets

BioMedBridges Kick-off Meeting

EUDAT User Forum

ICRI 2012

Next generation sequencing data analysis with Chipster

Next generation sequencing data analysis with Chipster

Next generation sequencing data analysis with R/Bioconductor

ESOF 2012

ECCB'12

Seminar at HY/Vi: New CSC computing resources

Seminar at OY/BL: New CSC computing resources

Seminar at HY/Meilahti: New CSC computing resources

Iaas in Life Science Research

CoPoRi Exchange of Experience Workshop

CSC Winter School in Bioinformatics 2013

PAERIP

Marine Biotech conference

ELIXIR-UK/GOBLET Training Workshop

BioMedBridges piti ensimmäisen kokouksensa

Niklas Blomberg ELIXIRin johtajaksi

ELIXIR eNewsletter ilmestynyt

ELIXIR eNewsletter ilmestynyt

CSC isännöi Ewan Birneyn vierailua

Euroopan kattava bioinformatiikan infrastruktuuri

Pilvilaskennasta lisätehoa biotutkimukseen

Eduroam leviää vauhdilla

Suuritehoinen tietoliikenneyhteys

Suomi investoi biolääketieteen tutkimusinfrastruktuuriin

Kalmar2

Kalmarin unioni

Suomalaisten koko perimä talteen? Datasta hyötyä tautien tutkimiseen

Suomalaisten geeniperimästä tehdään laajoja tutkimusprojekteja ja genomidataa tuotetaan ja analysoidaan koko ajan. Kansallinen tavoite on kuitenkin tallentaa suomalaisista tuotettu data Suomeen, jolloin analyytikot voivat yhdistää datan muihin terveystietoihin. Genomidatan hyödyntäminen terveydenhoidossa on vasta alussa. Data-analyysi tarjoaa paljon mahdollisuuksia bioalan yrityksille myös Suomessa.

Tutkimuskäyttöön soveltuvaa geenidataa suomalaisista on sirpaleina eri puolilla maailmaa eri tietokannoissa ja datavarastoissa ja vaihtelevasti järjestettynä. Tarve olisi siis luoda suomalaisen datan hallintaan kotimainen tietoturvallinen palvelu, joka ylittäisi organisaatiorajat, on verkostomainen ja hyvin koordinoitu. Kun eri paikoissa sijaitseva data koordinoitaisiin yhteen paikkaan, data voitaisiin omistajan luvalla luovuttaa laillisiin käyttötarkoituksiin, kuten tutkimukseen, tuotekehitykseen ja lääkehoitoihin.

Ihmisen biologia on hyvin monimutkaista, monimutkaisempaa kuin aiemmin on luultu. Geenin ja elimistön rakennusaineiden eli proteiinien ilmeneminen, rakenne ja niiden toiminta edellyttävät
kehittyneitä matematiikan, tietojenkäsittelytieteen sekä tilastotieteen menetelmiä eli bioinformatiikkaa.

Bioinformatiikan menetelmien, kuten geenien sekvensoinnin, avulla löydetään koko ajan uusia tapoja tutkia ja ehkäistä sairauksia. DNA:n sekvensointi on lähtökohta, jossa määritetään  DNA-molekyylin neljän eri emäksen, adeniiniin, guaniini, sytosiini ja tymiini (A, G, C,T) järjestys geneettisen digitaalisen koodin selvittämisessä. Jokainen ACGT-emäs on vastaava tiedonjyvä kuin tietokoneen bitti, nolla tai ykkönen, jotka pitkänä ketjuna sisältävät ohjeet ohjelmaan.

Sekvensointimenetelmien parantuminen ja halpeneminen ovat lisänneet merkittävästi biologian ja lääketieteen mahdollisuuksia tuottaa tämänkaltaista dataa. Nyt datan avulla saadaan selville mitä digitaalisia viestejä elämän molekyyleihin on kirjoitettu eliöiden selviämistä varten.

Data on kuitenkin vasta ensimmäinen askel kohti tulkintaa. Digitaalisen genomidatan tulkinta, eli miten genomiin tallennettu tieto ilmenee elimistössä, on vielä kehittymässä. Esimerkiksi viimeisen kymmenen vuoden aikana on Ruotsissa luotu karttaa (HPA Human Protein Atlas) siitä, miten
geenit ilmenevät proteiineina eri soluissa ja yhdistetty tämä tieto mikroskooppikuviin soluista. Näin siis voidaan nähdä, mikä geeni ilmenee missäkin solussa ja osallistuu proteiinien ja sitä kautta suurempien rakenteiden esimerkiksi hermosäikeiden, hiustuppien tai silmänpohjan valoa aistivien rakenteiden syntymiseen. Ei ole kuitenkaan vielä selvää syvemmän tason karttaa siitä, miten nanometrien skaalassa toimivat molekyylit tuottavat nämä toiminnalliset mikroskooppiset
rakenteet. Jokaiseen solun rakenteeseen tarvitaan miljoonia molekyylejä yhteistyössä. Genomeihin tallennettu rakennusohje ja sen tuottamat molekyylit muodostavat itsestään organisoituvan verkon, jota pyritään nykytutkimuksella ymmärtämään.

Suomella on melko hyvät lähtökohdat olla kansainvälinen toimija genomitiedon hallinnassa, mutta osaajia on yksittäisissä organisaatioissa liian vähän. Genomitiedon ymmärtämiseen vaadittavat tietomassat ovat suuria ja analysointi vaatii erikoistunutta osaamista toimijoita, jota ei vielä löydy
riittävästi Suomesta. Tarvitaan yhteistyötä genomidatan hallintaan ja lisää dataan erikoistuneita
tulkitsijoita. Osaamista saadaan Suomeen lisää, kun päästään luomaan puitteet suomalaisten genomien tallentamiselle. Tämä tarkoittaisi aluksi kymmenien tuhansien ihmisten datasta luotua kansallista viitetietokantaa. Siitä olisi hyötyä diagnostiikassa, esimerkiksi lääkehoitojen parantamisessa, sillä jo nyt voidaan potilaan genomitiedon perusteella määrittää esimerkiksi sopiva ja turvallinen lääkitys.

Datan hyvä organisointi auttaa sairauksien tutkimisessa

Molekyyleistä, soluista tai kokonaisista organismeista saadun datan analysointi edellyttää, että data on järjestetty hyvin. Sekvensoinnilla, mikroskoopeilla, massaspektrometrialla tai tietokonesimulaatioilla tuotetuilla data-aineistoilla pitää olla yhteiset tiedostostandardit ja riittävästi koneluettavia rajapintoja, joita noudatetaan kun dataa varastoidaan. Hyvä mittari datan järjestämisen asteelle on, jos toinen tutkimusryhmä pystyy hyödyntämään dataa yhtä hyvin kuin
sen alkuperäiset tuottajat.

Kun data on hyvin järjestetty ja kuvailtua, sitä voidaan yhdistellä. Täydentävien tietojen, esimerkiksi lääkemääräyksen, genomin ja pitkäaikaisten hoitotulosten liittäminen yhteen on edellytys syvemmän ymmärryksen kehittymiselle.

Taitavien analyytikoiden käsissä järjestetty data auttaa saavuttamaan läpimurtoja tutkimuksessa. Esimerkiksi yhdysvaltalainen GRAIL-yritys pyrkii ymmärtämään syövän syntymekanismeja. Mitä varhaisemmassa vaiheessa syöpä havaitaan, parantaa se huomattavasti taudin hoitoennustetta.
GRAIL-hankkeessa on kerätty 10 000 potilaan näytteet ja suostumus niistä luodun monipuolisen datan analysointiin. Ideana on, että tämän potilasjoukon syöpäkasvaimista luodaan tietokanta, jota vastaan voidaan tehdä verinäytteiden seulontaa.

Syöpäkasvaimet ovat yleensä seurausta siitä, että sairautta kantavan ihmisen solun genomiin on tullut muutos, joka on tekee solusta epänormaalin. Jokainen syöpä on solutasolla kantajansa näköinen melko yksilöllinen sairaus, joita yhdistää epänormaalien solujen holtiton kasvu. Syöpä hyödyntää elimistön normaaleja uusiutumisen ja parantumista mekanismeja omien geneettisten ohjeidensa itsekkääseen levittämiseen. Kahden ihmisen väliset genomit ja niiden sisältämä digitaalinen informaatio ovat keskimäärin 99,5% samanlaiset. Siksi monien syöpien etenemisprosessi on syöpien yksilöllisyydestä huolimatta hyvin tunnettu. Siksi onkin perusteltua tutkia, miten yksittäisten tai useampien nukleotidien (ACGT) muutokset genomissa vaikuttavat solun molekyyliverkoston tasapainoon siten, että solusta tulee syöpäsolu.

GRAIL-hankkeessa potilaiden genomeista ja heidän syöpäkasvaimistaan sekvensoidaan miljoonia ainutlaatuisia genomitiedon muutoksia, jotka voivat aiheuttaa syöpää. Hanke luo tietokannan, jonka avulla terveydenhuollossa pystytään havaitsemaan syövän varhaiset vaiheet, jopa suoraan
verenkierrosta. Innovaation onnistuessa syöpäseulontaa voidaan alkaa tehdä entistä varhaisemmassa, jolloin kasvaimet ovat vasta mikroskooppisen pieniä ja helpommin hallittavissa esimerkiksi lääkeaineilla.

Samanlaisen tutkimuksen tekeminenon mahdollista Suomessa yhdistämällä terveys- ja genomitiedot. Esimerkiksi Suomen ELIXIR-keskus on jo alkanut rakentaa genomitiedon hallinnalle ja tallentamiselle tarvittavaa tietoturvallista infrastruktuuria.

Tautien synnyn ymmärtäminen molekyylitasolla

Suomen ELIXIR-keskuksen tarjoamat palvelut.

Tieteen käyttöön on saatavissa satoja kertoja enemmän dataa DNA:n sisältämästä tiedosta kuin kymmenen vuotta sitten. Ymmärrys siitä, miten genomiin tallentunut tieto välittyy molekyylitasolla esimerkiksi proteiineiksi, ja edelleen solujen kolmiulotteisiksi toiminnallisiksi yksiköiksi kasvaa kovaa vauhtia. Kun ihmisen biologiaa ymmärretään solutasolta molekyylien tasolle, se parantaa elämänlaatua ja sairauksien hoitoa.

Yksi tärkeimpiä bioinformatiikan tutkimuskohteita on tautien pohjimmaisten syntymekanismien ymmärtäminen. Geenin koodaama toiminnallinen yksikkö on proteiini. Se on satojen yksiköiden, aminohappojen, ketju. Aminohappoja on 20 erilaista. Geenien ohjeistama proteiiniketju tulee solun toiminnalliseksi yksiköksi, vaikkapa entsyymiksi vasta sen jälkeen, kun se on laskostunut kolmiulotteiseen muotoonsa ja voi aloittaa vuorovaikutuksen toisten solun molekyylien kanssa. Väärin laskostunut proteiini voi johtaa sairauteen, koska se ei toimi odotetulla tavalla elämälle tärkeiden molekyylien muodostamassa verkostossa.

Joskus esimerkiksi geneettisessä koodissa on muutos tämän kriittisen toiminnallisen yksikön eli proteiinin laskostumiselle kriittisessä kohdassa. Solut muokkaavat itseohjautuvasti syntyvien proteiinin koostumusta ja sitä kautta niiden rakennetta ja toimintaa. Tämä voi korjata geneettiseen
koodiin syntyneen virheen. Toisaalta voi myös käydä niin, että proteiini menee rikki solun omassa prosessissa. Useimmat sairaudet voidaan jäljittää  tilanteisiin, jossa solun molekyylien verkoston
dynamiikkaan on tullut tärkeään kohtaan biokemiallinen lukuvirhe. Toisaalta kyseessä voi olla vain muunnelma jonka seuraus ihmiselle on vain suositus, miten kannattaa valita ruokavalionsa. Molekyylitason muutosten vaikutus genomiin talletettuun dataan riippuu monesta asiasta, sillä DNA:ssa on jokaisesta geenistä ”varmuuskopio” molemmilta vanhemmilta. Joistakin geeneistä on jopa useita versioita.

Vaikka logiikka ja tieto siitä mitkä ovat biologisten prosessien verkoston tärkeimmät pelurit alkavat olla selvillä, dynaamista kokonaisuutta ei vielä osata hahmottaa saati ennustaa tai muokata lääketieteellisesti niin hyvin kuin haluttaisiin. Esimerkiksi sepelvaltimotautiin sairastumisen
riskien ennakointi on genomista saadun datan ansiosta tarkentunut, mutta molekyylitason tapahtumien ymmärrys on siinä vaiheessa, että komponentit tunnetaan, mutta ponnistellaan niiden välisen toiminnan tai molekyylitasolla esiintyvien vikojen ymmärryksessä. Tautien molekyylitason ymmärrys kuitenkin merkitsee tarkempia ja varhaisempia diagnooseja, ja että
ehkäisytoimet voidaan aloittaa varhain ja esimerkiksi riskiryhmässä olevat voivat halutessaan muuttaa elintapojaan.

Tommi Nyrönen

Ari Turunen

Tommi Nyrönen on biokemisti ja Suomen ELIXIR-keskuksen johtaja.

Ari Turunen on tietokirjailija ja Le monde Diplomatiquen Suomen edition
päätoimittaja.

Lue artikkeli PDF-muodossa

CSC
Elixir europe
Biomedinfra