
Francesca Morello työskentelee CSC:n sensitiivisen datan palveluiden yhteyshenkilönä. Morello ja hänen kollegansa kehittävät työkaluja ja palveluja sensitiivisen datan analysoimiseen, jakamiseen ja julkaisemiseen. CSC myös ylläpitää Suomen osuutta federoidusta EGA:sta (European Genome-phenome Archive), joka on hajautettu palvelu arkaluonteisten biolääketieteellisten tietojen tallentamista ja jakamista varten.
SD Connect on palvelu, jolla voi kerätä ja tallentaa sensitiivistä tutkimusdataa tutkimusprojektin aktiivivaiheessa. SD Desktopin käyttäjät pääsevät suoraan hallinnoimaan dataansa virtuaalikoneympäristössä. Palveluihin pääsee web-käyttöliittymän kautta käyttäjän omalta tietokoneelta.
”Kun käyttäjä on lähettänyt sensitiivisen datansa CSC:hen, data aina salataan, kun se tallennetaan, siirretään ja prosessoidaan palveluissamme. Salaus puretaan vain, kun data annetaan saataville valtuutetuille käyttäjille SD-palvelussa”, Morello sanoo.
Tätä pilvilaskentaympäristöä on helppo käyttää. Morello on hyvin innostunut siitä, että pääsy työympäristöön ei edellytä erityistä teknistä osaamista.
”Tutkijat pääsevät työtilaan muutamalla klikkauksella. Vaikka SD-palvelut sopivat minkä tahansa tutkimusalan sensitiivisen datan hallinnoimiseen, työskentelemme paraikaa mahdollistaaksemme palveluiden jatkokäytön alkaen täysin automatisoidusta datan salauksesta aina laskentaympäristön kustomoinnin virtaviivaistamiseen.”
Palvelut ovat käytettävissä tutkijoille ja opiskelijoille, jotka ovat kytköksissä suomalaisiin akateemisiin organisaatioihin, tutkimusinstituutteihin ja näiden kansainvälisille yhteistyökumppaneille. CSC:n palveluiden käyttäminen edellyttää rekisteröitymistä CSC:n asiakastilille. Vaikka SD Connect ja SD Desktop on suunniteltu mahdollistamaan yhteistyö eri organisaatioiden välillä, data on aina tallennettu CSC:n pilvipalveluihin Suomessa.
Oulun yliopiston kehitysbiologian professori Seppo Vainio tutkii organoideja. Organoidi on yksinkertainen ja pieni versio elimestä, jonka on kasvatettu kantasoluista. Organoidien tutkimukseen liittyy paljon sensitiivisen datan käsittelyä.
”Organoidit mallittavat joko normaalia tai sairauden elintoimintoihin liittyviä solu ja molekyylitason muutoksia. Oleellista on, että tutkijat ovat kehittäneet keinoja tuottaa myös ihmisistä monikykyisiä soluja, jota voidaan sitten kehitysbiologisin signaalein ohjata erilaisiin kehityssuuntiin. Meillä on siis keinot ja reseptit ohjata solut muodostamaan vaikka munuaisen normaalia syntyä mallintavia organoideja. Voimme mallintaa elinten kuten munuaisen kehitystä. Niin ikään meillä on keinot luoda samanlaisia geneettisiä muutoksia ihmisen alkion kantasoluissa, joita havaitaan ihmisen perimässä.”

Seppo Vainion mukaan organoiditutkimus on yksi tieteellinen megatrendi. Nyt on mahdollista mallintaa ihmisen sairauden prosesseja uudella tavalla. Kun useita organoideja yhdistetään, voidaan tutkia myös kudosten ja elinaiheiden vuorovaikutuksia kokeellisesti ihmisessä. Organoidien avulla voidaan tutkia ihmisen sairauksia ja kehittää uusia lääkkeitä ja hoitoja.
”Meillä on ihmisen kantasolukirjastoja Euroopassa. Voimme periaatteessa tehdä jokaisesta ihmisestä oman kantasoluvaraston biopankkiin. Tästä voisimme tuottaa tarpeen mukaan henkilöstä terveyden ja sairauden tutkimukseen henkilökohtaisen sairausmallin.”
Kun tavoite on pyrkiä henkilökohtaiseen terveysteknologiaan ja tietoon, niin kantasolu- tai solubiopankki tarjoaa Vainion mukaan realistiset keinot seurata miten sairaudet kehittyvät. Kaikki tämä edellyttää tutkimusinvestointeja. Vainio toivoo, että Suomen biopankkijärjestelmää voitaisiin kehittää tähän suuntaan.
Yksi kiinnostava kohde ovat iPS-solut. Ihmisen alkion kantasoluja opittiin kasvattamaan 1990-luvun lopulla ja niitä läheisesti muistuttavat indusoidut pluripotentit kantasolut eli iPS-solut kuvattiin vuonna 2007. Näitä iPS-solulinjoja voidaan tuottaa muun muassa potilaan iho- tai verisoluista ja ne voidaan ohjata erilaistumaan haluttuun suuntaan.
”Koska iPS-solut ovat peräisin yksilöistä, hankkeisiin liittyy myös paljon arkaluontoisen potilasaineiston käsittelyä. Tavoite on pyrkiä linkittämään organoideissa tehdyt havainnot yhä paremmin potilasrekisteritietoihin. Tässä kokonaisuudessa sosiaali- ja terveysalan tietolupaviranomainen Findata tarjoaa keinot Suomen runsaslukuisen rekisteritietojärjestelmän hyödyntämiseen. ”
Esimerkiksi FinnGen-tutkimuksen tavoitteena on sairausmekanismien parempi ymmärtäminen ja uusien hoitokeinojen kehittäminen yhdistämällä genomi- ja terveystietoa. Se tarjoaa yli 500 000 suomalaisen geneettisen tiedon. Tieto palautuu sopimuksen mukaan suomalaisiin biopankkeihin, josta geenitieto on vapaasti tutkijoiden käytössä. FinnGen on tunnistanut monia uusia sairauksiin liittyviä geenivariantteja.
”Tutkijat ovat mallintaneet kokeellisesti organoideissa identifioituja variantteja tutkiakseen tarkemmin sairauksiin assosioituneita geenitason muutoksia eli patogeneesiä. Kun tämä tutkimus liitetään sitten jatkossa erilaisten ns. kemikaalikirjastojen ja biomerkkien avulla tehtävään, automaatioon perustuvaan lääkeseulontaan, tämä prosessi luo perustan kiihdyttää organoidien avulla uusien hoitokeinojen kehittämistä.”
Sensitiivisen datan piiriin kuuluvat ihmisistä kerätty data, ekologinen data tai luottamuksellinen data. Henkilötietojen käsittelyä säätelee Euroopan yleinen tietosuoja-asetus GDPR (European General Data Protection Regulation).
”Rekisterinpitäjä on organisaatio tai laillinen edustaja, joka vastaa kaikista päätöksistä, miten dataa käytetään. SD-palvelujen avulla pyrimme tarjoamaan tutkijoille ja heidän organisaatioilleen kaikki työkalut, joilla dataa pääsee hallinnoimaan, kun sitä kerätään, analysoidaan ja käytetään uudelleen,” sanoo Francesca Morello.
Terveys- ja rekisteridatan käsittelyä toisiokäyttöön on tiukasti säädelty kansallisella lainsäädännöllä. SD Desktop on sertifioitu toisiokäytön ympäristö, jonka Suomen sosiaali- ja terveystietojen lupaviranomainen Findata on tarkastanut sääntelyään vastaavaksi. Tässä tapauksessa Findata ja CSC Helpdesk hallinnoivat pääsyä tietoihin ja tiedonsiirtoja.
Morellon mukaan nämä palvelut on suunniteltu siten, että ne tarjoavat tutkijoille ja rekisterinpitäjille kaikki välineet pitää datansa turvassa, mutta palvelut pysyvät joustavina ja helppokäyttöisinä.

Sekvensointi, tallentaminen ja geenisekvenssien käsittely on aikaa vievä prosessi. Ensimmäisessä vaiheessa DNA-sekvenssit voidaan lähettää sekvensointilaitteistolta SD Connect-palvelun kautta suoraan tutkijan työtilaan. Täällä salattu data voidaan helposti jakaa muille tutkijoille URL-osoitteen avulla. Kun datan keräämisen vaihe on ohi, tutkivat voivat luoda virtuaalikoneen SD Desktopilla ja analysoida SD Connect-palveluun tallennettua dataa striimauksen kautta. He voivat myös, jos esimerkiksi halutaan analysoida dataa yhdessä, myöntää pääsyn yhteistyökumppaneille muista organisaatoista vain lukuoikeuksilla.
Kun tutkijat ovat laatineet tulokset geenianalyyseistaan, he voivat julkaista datan valvottua pääsyä pitkin käyttämällä Suomen federoitua EGA-palvelua. Tällöin data-aineistolle myönnetään pysyvä tunniste ja datan uusiokäytön mahdollisuudesta ilmoitetaan kansainvälisesti EGA:ssa. Data pysyy Suomessa, kun taas luvan saaneet tutkijat pääsevät dataan SD Desktop-palvelun datastriimauksen kautta. Vain yksi kopio data-aineistosta lähetetään CSC:hen ja sitä käytetään tutkimuksen kaikissa eri vaiheissa. Federoitu EGA yhdessä täysin yhteensopivan amerikkalaisen virkaveljensä dbGAP:n kanssa ovat ensisijaiset globaalit resurssit, jotka mahdollistavat pääsyn sensitiivisen ihmisperäiseen biolääketieteelliseen dataan, joka on hyväksytty tutkimuskäyttöön.
Ari Turunen
19.12.2022
Lue artikkeli PDF-muodossa
Sitaatti
Ari Turunen, Francesca Morello, & Tommi Nyrönen. (2022). Sensitive Data (SD) services for Research: with a few clicks a researcher can launch a personal secure computing environment. https://doi.org/10.5281/zenodo.8154610
Lisätietoja:
Oulun yliopisto
www.oulu.fi/
CSC – Tieteen tietotekniikan keskus Oy
on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keski- tettyä tietotekniikkainfrastruktuuria.
https://research.csc.fi/cloud-computing
ELIXIR
rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
My CSC portal
SD Connect
SD Desktop
https://research.csc.fi/-/sd-desktop
Federoitu EGA