Algoritmi opetetaan tunnistamaan syöpä sekvenssidatasta

Syväoppiminen on mullistanut syöpäsairauksien tutkimisen. Syvillä neuroverkoilla voidaan automaattisesti löytää potilaan näytedatasta piirteitä, joiden perusteella voidaan tunnistaa syöpiä. Oppivat algoritmit voivat tunnistaa jatkossa verinäytteestä mahdollisia syövän esiasteita. Esa Pitkänen ja hänen tutkimusryhmänsä Suomen molekyylilääketieteen instituutista kehittävät uuden sukupolven syväoppimisen algoritmeja.

Algoritmeja on hyödynnetty kudosnäytteiden leikekuvien solujen tunnistamisessa. Esimerkiksi jos kudoksen solut näyttävät epätyypillisiltä, algoritmi tunnistaa sen ja päättelee onko kyseessä syöpä. Nyt kuvantamisdatan rinnalla käytetään syöpien tunnistamisessa kasvaimista saatua DNA-sekvenssidataa.

”Aikaisemmin on ollut vaikea sanoa DNA-sekvenssin perusteella, minkälaisesta kasvaimesta sekvenssi on tullut. Nyt on luotu uusia tekniikoita ja syväoppimisen algoritmeja”, sanoo tutkija Esa Pitkänen.

Pitkänen ryhmineen kehittää algoritmeja, jotka tunnistavat DNA-sekvensseistä lyhyitä, toisteisia pätkiä. Algoritmien avulla voidaan löytää pätkiä, jotka mutatoituvat tietyssä syöpätyypissä usein tai joihin tietyt geenien säätelyyn osallistuvat proteiinit sitoutuvat. Näitä pätkiä analysoimalla voidaan saada tietoa esimerkiksi syöpäsairauksien syiden kartoittamiseen ja lääkkeiden kehittämiseen.

”DNA:n kopioituminen solun jakautumisen yhteydessä ei ole täydellistä. Kun solu jakautuu niin on mahdollista, että mutaatioita syntyy. Kun solu jakautuu, kopioitavaa DNA:ta on kuuden miljardin merkin verran eli virheitä tapahtuu. Pienikin todennäköisyys riittää että mutaatioita tulee”, sanoo Pitkänen.

”Jos riittävästi mutaatioita tapahtuu esimerkiksi kasvaimen syntyä ehkäisevissä geeneissä, syöpä voi alkaa kehittyä.”

Esimerkiksi pistemutaatiossa yksi emäs vaihtuu toiseksi DNA-ketjussa. Virhe voi syntyä, kun solun jakautuessa DNA kopioidaan ja kopioinnista vastaavat entsyymit korjaavat esimerkiksi auringonvalon ultraviolettisäteilystä vaurioituneen kohdan väärin. Ihosyöpää aiheuttavan ultraviolettisäteilyn aikaansaama tyypillinen mutaatio on se, että ihmisen DNA:n emäspareissa kaksi peräkkäistä sytosiinia (C) muuttuvat kahdeksi tymiiniksi (T). Kun tällaisia, ihosyövälle tyypillisiä mutaatioita havaitaan riittävästi, oppivat algoritmit yhdistämään mutaatiot tiettyyn syöpätyyppiin.

”Yritämme ennustaa mutaatioiden perusteella mikä syöpätyyppi ja kasvain on kyseessä. Samalla saadaan tietoa, joka voi vaikuttaa hoitoon.”

Algoritmi tunnistaa verinäytteestä saadusta DNA:sta syövän

Pitkänen ryhmineen analysoi sekvenssijaksoja ja algoritmeja opetetaan tunnistamaan sekvenssijaksojen poikkeavuuksia. Näistä poikkeavuuksista algoritmi pystyy tunnistamaan, että kyseessä on kasvain ja luokittelemaan kasvaimet eri syöpätyyppeihin.

“Ennen siirtymistäni Suomen molekyylilääketieteen instituuttiin olin Euroopan molekyylibiologian laboratoriossa EMBL Heidelbergissä, jossa osallistuin PCAWG-syöpägenomiprojektiin. Projektissa analysoitiin yli 2600 syövän kokogenomia. PCAWG-data toimii aineistona useassa ryhmäni syöpägenomiikkaa käsittelevissä projekteissa.”

Esa Pitkäsen ryhmän kehittämälle algoritmille on opetettu näiden 2600 syöpäpotilaan kasvainnäytteistä löydetyt löytyneet mutaatiot, joita on yhteensä 47 miljoonaa.

“Algoritmi on koulutettu siten, että se yrittää näistä sekvenssien muutoksista päätellä syöpätyypin. Kun algoritmille on annettu eri kasvainten kaikki mutaatiot sekvensseineen, se pystyy jatkossa päättelemään minkälainen kasvain on kyseessä. Päättely perustuu siihen, että algoritmi oppii nämä yhteydet.”

Algoritmi oppii kasvaimissa olevan sekvenssidatan poikkeamien kautta tunnistamaan, että kyseessä on tietylle syövälle olennainen mutaatio. Algoritmi pystyy ryhmittelemään kasvaimet pelkän sekvenssidatan perusteella.

”Ryhmässäni tutkija Prima Sanjaya on kehittänyt neuroverkkomalleja sekvenssidatan analysoimiseen. Silloin tällöin törmätään metastaattisiin eli levinneisiin syöpiin, josta ei tiedetä mistä se on levinnyt. Tulevaisuudessa voidaan hyödyntää myös ns. nestebiopsiaa. Tällöin pystytään toivottavasti verinäytteestä sanomaan, onko potilaalla syöpä ja jos on niin minkälainen.”

Esa Pitkänen ja hänen tutkimusryhmänsä hyödynsivät yhtä suurimmista syöpänäytteiden (PCAWG) datakokoelmaa, joka koostuu 47 miljoonasta mutaatiosta. Data on peräisin 2600 potilaan kasvainnäytteistä, jotka on sekvensoitu. Kokoelmassa oli 37 eri kasvaintyyppiä eri syövistä, kuten paksusuolensyövästä, keuhkosyövästä ja melanoomista. Prima Sanjaya teki koneoppimismallin syvillä neuroverkoilla, joka ottaa huomioon kunkin potilaan sekvenssidatan ja ikään kuin heijastaa tämän datan kaksiulotteiseen karttamuotoon. Tässä kuvassa jokainen piste on yksi erillinen potilaalta saatu kasvain . Värit ovat eri kasvaintyyppejä. Mielenkiintoisesti malli ryhmittelee paksusuolensyövät yhteen mutta myös näkee eron kolmen alatyypin välillä (merkitty kuvaan nuolilla).

Nestebiopsia perustuu siihen, että elimistön solut vapauttavat verenkiertoon ja ruumiinnesteisiin DNA:ta, jota kutsutaan solunulkoiseksi tai soluvapaaksi DNA:ksi (cell free DNA, cfDNA). Myös syöpäsoluista vapautuu DNA:ta, joka mahdollistaa syöpämutaatioiden etsimisen veren plasmasta.

“Jos nestebiopsiassa näkyy jälkiä syövästä, emme tiedä suoraan mikä syöpä on kyseessä, koska se voi tulla verenkiertoon mistä vain kehosta. Jos meillä on keinoja katsoa tarkemmin, kuten syväoppimisen algoritmit, saamme arvokasta tietoa, mihin kohtaan potilaan kehossa tutkimus pitää suunnata. Algoritmi voi kehottaa katsomaan esimerkiksi paksusuoleen. Uskon, että tulevaisuudessa tällaisilla algoritmeilla on suuri merkitys. Nestebiopsian ja algoritmien ansiosta voidaan tehdä tutkimusta ilman potilasleikkauksia”

Algoritmi suolistosyövien tunnistamisessa

Syövän syntyyn vaikuttavat perintötekijöiden lisäksi elintavat. Helsingin yliopistossa on tutkittu paljon esimerkiksi suolistosyöpiä.

”Se tiedetään, että punaisen lihan syömisellä on yhteys paksunsuolen syövän syntyyn. Syntymekanismit vaativat vielä lisätutkimuksia mutta esimerkiksi punaisen lihan aiheuttamien DNA:n alkylaatioreaktioiden merkitystä on selvitetty viime vuosina paljon.”

Paksunsuolen syöpä (CRC) on yksi vaarallisimpia syöpiä länsimaissa ja johtaa 30% tapauksissa esimerkiksi Suomessa kuolemaan. Noin 15% paksunsuolen syövistä kuuluvat joukkoon, jossa esintyy ns. mikrosatelliiti-instabiliteettia (MSI). Mikrosatelliitit ovat DNA:n toistojaksoja, joiden pituus vaihtelee yksilöstä toiseen ja ovat siten yksilöllisiä “sormenjälkiä”. Mikrosatelliiti-instabiliteetissa solun DNA:n replikaation jälkeinen korjausmekanismi ei toimi, jolloin mutaatioita alkaa kertyä erityisesti mikrosatelliitteihin.

”MSI-kasvaimessa mikrosatelliitteihin tulee helposti yhden emäksen lisäyksiä tai poistoja. Esimerkiksi kahdeksan peräkkäisen adeniinin mikrosatelliitista häviää yksi adeniini. Osuessaan geeniin tällainen muutos aiheuttaa geenin koodaaman proteiinin aminohappoketjun sisällön muuttumisen täysin. Jos riittävästi muutoksia tapahtuu hallitsematonta solujakautumista estävissä geeneissä, saattaa syövän kehittyminen alkaa.”

MSI liittyy usein paksunsuolensyövän lisäksi muihin syöpiin, kuten vatsasyöpiin, kohdunrungon ja munasarjan syöpään tai aivosyöpään. Syövän ennusteen arvioinnissa voidaan käyttää apuna MSI-analyysiä. Analyysin perusteella on joskus mahdollista määrittää sopiva hoito.

”Mielenkiintoista on, että syvä neuroverkko oppii myös luokittelemaan eri syöpien alalajeja. Se tunnisti esimerkiksi suolisyöpien MSI-alatyypin”, Pitkänen sanoo.

Suomen ELIXIR-keskus CSC on yksi pääpartnereita PerMedCoE-hankkeessa. Kolmevuotisen HPC/Exascale Centre of Excellence in Personalised Medicine -hankkeen (PerMedCoE) avulla esimerkiksi syöpään liittyvä data saadaan tehokkaasti terveydenhoidon käyttöön ja diagnoosit nopeutuvat.

”Tulevaisuuden yksilöidyt hoidot kuten syöpähoidot rakentuvat täsmälliseen käsitykseen potilaasta ja hänen sairaudestaan. Tämä käsitys muodostetaan keräämällä suuri määrä erilaista tietoa, kuten syöpää hoidettaessa kasvaimen genomi- ja kuvantamistietoa. Monet tiedonkeruumenetelmät tuottavat valtavan määrän tietoa, joiden analysoimiseksi kehitetyt uudet laskennalliset menetelmät puolestaan vaativat suuria laskentaresursseja”, Pitkänen toteaa.

”Uuden laskennallisen menetelmän kehittäminen ideasta toimivaksi, terveydenhoidossa käytettäväksi työkaluksi on tällaisessa toimintaympäristössä valtava haaste. Erityisesti syöpähoidoissa on tärkeää, että potilaan hoitoon vaikuttava tieto saadaan lääkärin käyttöön mahdollisimman nopeasti. Uskon, että PerMedCoE:n tuloksilla luodaan pohjaa sille, että valtavasta terveystietomäärästä voidaan lääkärin avuksi jalostaa merkityksellistä tietoa ja näin parantaa hoitotulosta merkittävästi.”

Ari Turunen

16.9.2021

Lue artikkeli PDF-muodossa

Citation

Ari Turunen, Esa Pitkänen, & Tommi Nyrönen. (2023). Teaching an algorithm to identify cancer from sequence data. https://doi.org/10.5281/zenodo.8135303

Mutaatioiden lähteet

Mutaatioiden lähteinä ovat 1.ulkoiset tekijät: esimerkiksi auringon UV-säteily. 2.sisäiset tekijät: spontaani deaminaatioreaktio eli emäksen amiiniryhmän muutos, jolloin alkuperäinen emäs muuttuu joksikin toiseksi, esimerkiksi adeniini urasiiliksi 3. DNA:n kopioinnissa aiheutuneet virheet.

Mutaatio tarkoittaa muutosta DNA:n tai RNA:n nukleotidijärjestyksessä. Nukleotidiin kuuluu emäs, sokeri ja fosfaatti. DNA:n sokeri on D-deoksiriboosi ja RNA:n D-riboosi. DNA:n emäksiä ovat guaniini (G), adeniini (A), sytosiini (C) ja tymiini (T). RNA:n emäsosassa tymiinin tilalla on urasiili (U). Mutaatio voi olla vain yhden nukleotidin muutos eli pistemutaatio, tai se voi käsittää useita nukleotideja. Pistemutaatiossa yksi emäs vaihtuu toiseksi RNA- tai DNA-ketjussa. Iso mutaatioita, jotka voivat käsittää tuhansia nukleotideja, kutsutaan rakennemuutoksiksi.

Rakennemuutos voi vaikuttaa yhtä aikaa useaan geeniin. Syövät ovat yleensä useiden somaattisten mutaatioiden aiheuttamia; somaattiset mutaatiot eivät periydy, ja niitä voi syntyä milloin tahansa alkionkehityksen aikana ja sen jälkeen. Mutaatioiden seurauksena normaalin solun toiminta voi muuttua siten, että solu alkaa jakautua hallitsemattomasti. rilaisia mutaatiotyyppejä mutaatioiden jakautuminen kromosomeihin epigeneettinen tieto. Epigeneettiseen periytymiseen vaikuttavat monet ulkoiset tekijät, kuten esimerkiksi ravinto. Esimerkiksi identtiset kaksoset, voivat kehittyä ulkoisilta olemuksiltaan erilaisiksi. Mutaatioiden mallintaminen lineaariset mallit syvät neuroverkot transformer-mallit. Transformerit ovat syväoppimismalliperhe, jotka toimivat erityisen hyvin esim. tekstimuotoiseen dataan, sovelluksena vaikkapa konekääntäminen. Syöpätutkimuksessa transformer-mallit voivat kiinnittää huomiota mutaatiotyyppeihin, jotka ovat tärkeitä tietyn syöpätyypin tunnistamiseksi. Esimerkiksi ihosyövissä, joissa on paljon auringonvalon aiheuttamia mutaatioita (C>T, CC>TT), huomio kohdistuu juuri näihin mutaatioihin.

Kuvassa keskellä erilaisia mutaatiotyyppejä ja miten mutaatiot jakautuvat kromosomeihin. Mutaatioihin liittyy epigeneettinen tieto. Epigeneettiseen periytymiseen vaikuttavat monet ulkoiset tekijät, kuten esimerkiksi ravinto. Esimerkiksi identtiset kaksoset, voivat kehittyä ulkoisilta olemuksiltaan erilaisiksi.

Mutaatioiden mallintaminen:

lineaariset mallit

syvät neuroverkot

transformer-mallit. Transformerit ovat syväoppimismalliperhe, jotka toimivat erityisen hyvin esim. tekstimuotoiseen dataan, sovelluksena vaikkapa konekääntäminen. Syöpätutkimuksessa transformer-mallit voivat kiinnittää huomiota mutaatiotyyppeihin, jotka ovat tärkeitä tietyn syöpätyypin tunnistamiseksi. Esimerkiksi ihosyövissä, joissa on paljon auringonvalon aiheuttamia mutaatioita (C>T, CC>TT), huomio kohdistuu juuri näihin mutaatioihin.

Lisätietoja:

HPC/Exascale Centre of Excellence in Personalised Medicine (PerMedCoE)

https://permedcoe.eu

Suomen molekyylilääketieteen instituutti FIMM

https://www.fimm.fi/

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

Tehokas datan prosessointi ja jakaminen parantaa sairauksien tunnistamista ja hoitoa

Uuden sukupolven geenien ja RNA-molekyylien analyysimenetelmät mahdollistavat entistä nopeammat ja vaivattomammat analyysit. Data saadaan myös hyvin talteen ja jaettavaksi tutkimusryhmille Suomen ELIXIR -keskuksen CSC:n Allas-käyttöliittymän kautta.

Uuden sukupolven sekvensointimenetelmien (NGS) avulla tutkitaan perimässämme olevia virheitä ja variaatiota sekä geenien ilmentymisen (ekspressio) muutoksia. Menetelmien tuottamien miljardien sekvenssipätkien analysointi on mahdollista kerralla yhdessä tietokoneajossa.

Uusien menetelmien avulla pystytään tutkimaan lukuisia geenejä ja kohteita useista eri näytteistä samanaikaisesti. Menetelmien avulla voidaan tehdä nopeasti yksittäisten solujen, kuten syöpäsolujen, analysointi. Nyt voidaan myös analysoida veren plasmasta eroteltu soluvapaa DNA, joka kertoo nopeasti ja luotettavasti valittujen hoitojen tehokkuudesta ja erityisesti siitä, onko etäispesäkkeitä jäljellä.

Suomen molekyylilääketieteen instituutin (FIMM) ja CSC:n alustoilla on käytössä erilaisia algoritmeja sekvensointiin perustuvien menetelmien, (eksomit, genomit ja trasnkriptomitn) tuottaman datan analysoimiseen. Yksi keskeisimpiä on Broad Instituten GATK -työkalupakki (Genome Analysis Toolkit). Sen avulla etsitään geenivariantteja ja tunnistetaan DNA- tai RNA-sekvenssin muutoksia solulinjassa. GATK -analyysiohjelmistosta on tullut bioinformatiikan standardi tiedeyhteisössä. GATK-ohjelmistot ajetaan huippunopean Dragen-alustan (Dynamic Read Analysis for GENomics) kautta. Suomen ELIXIR-keskus CSC ylläpitää Dragenia yhdessä FIMM:n kanssa. Dragen esiprosessoi datan eli kun ensimmäiset tulkinnat datasta on tehty, tehdään usein lisää analyysejä. Tällöin myös CSC:n tallennuskapasiteetista on hyötyä, koska analysoitu data ei mahdu tavanomaiseen tietokoneeseen vaan saadaan suoraan jaettua käyttäjille Allas-palvelun kautta. CSC:n ja FIMM:n yhteistyö on olennainen osa analyysien nopeaa läpimenoa.

”Kun käytössä ovat korkean kapasiteetin sekvensointitekniikan alustat, algoritmit ja laskentateho, saadaan erittäin nopeita tuloksia. Yksi genomi voidaan nyt analysoida jopa vuorokaudessa kun aikaisemmin siihen meni useita viikkoja”, sanoo Pekka Ellonen.

Ellonen on Suomen molekyylilääketieteen instituutin (FIMM) sekvensointiyksikön laboratoriopäällikkö. Yksikkö tuottaa tutkimusyhteisölle genomiikan (DNA) ja transkriptomiikan (RNA) analyysejä moderneilla menetelmillä. Yksikkö saa analysoitavakseen erilaisten tutkimusprojektien tuottamia näytteitä.

”Yhdessä tutkijoiden kanssa päätetään tarvittavista menetelmistä ja räätälöidään paras työkalupakki, jolla testataan tutkijoiden hypoteesia. Sellaisia menetelmiä voivat olla eksomisekvensointi, genomisekvensointi, erilaisten RNA-molekyylien (transkriptomi) sekvensointi sekä geeniekspressio,” sanoo Ellonen.

Näiden menetelmien avulla kudoksesta voidaan selvittää perimä (genomiikka) tai tunnistaa esimerkiksi kaikki kudoksessa ilmentyvät geenit (transkriptomiikka) ja proteiinit (proteomiikka). Genomin proteiinia koodaavan alueen eli eksomin sekvensointi auttaa esimerkiksi periytyvien tautien, synnynnäisten kehityshäiriöiden ja syövän tutkimisessa. Geenien ilmentymistä säädellään tarkasti soluissa ja muutokset voivat johtaa sairauksiin. Tutkimuksissa voidaan verrata esimerkiksi syöpäkudoksen ja terveen kudoksen geenien ilmentymisen eroja.

Korkean käsittelytehon sekvensointilaitteistot (high throughput sequencing) tuottavat 1 -20 miljardia sekvenssipätkää ajotyypistä riippuen. NovaSeq6000 -laitteessa voidaan ajaa 4 eri kapasiteetin ajoja. Pienimmän kapasiteetin ajossa voidaan sekvensoida parikymmentä eksomia. Kaikki perimän eksonit eli proteiineja koodaavat geenit muodostavat yhdessä eksomin, joka vastaa kooltaan noin yhtä prosenttia koko perimästä. Suurimmassa ajossa voidaan analysoida 24 genomia kerralla. Genomisekvensointi (WGS, whole genome sequencing) kattaa koko perimän, 3.1 miljardia emästä. Yhden ihmisgenomin analysointia varten tuotetaan noin 1.2 miljardia lyhyttä sekvenssiä, joista koostetaan algoritmien avulla analyysin kohtena oleva genomi. Luotettavan tuloksen saamiseksi emäsparit luetaan useampaan kertaan (lukusyvyys). Kun etsitään perimästä esimerkiksi syövälle ominaisia muutoksia, lukusyvyys voi olla 500-1000 –kertainen. Silloin kohdennetaan analyysi esimerkiksi eksomiin.

Yksittäisen solun analytiikka

Uuden sukupolven sekvensointimenetelmät mahdollistavat monimutkaisten biologisten järjestelmien tutkimisen. Ellosen mukaan ylivoimaisesti suurin muutos bioinformatiikassa viime vuosina on ollut yksittäisten solujen analysointi. Yksittäisten solujen analyysi tapahtuu Suomen molekyylilääketieteen instituutin yksittäisten solujen analyyseihin erikoistuneen yksikön (SCA) sekä sekvensointiyksikön yhteistyönä.

Jokainen solu sisältää yksilön jokaisen geenin, mutta tietyt geenit ilmentyvät vain tietyissä soluissa sekä usein vain tietyissä olosuhteissa. Geenien ilmentyminen ja proteiinien tuotanto soluissa vaihtelee eri kehitysvaiheissa ja sairauksien vaikutuksesta. Se aiheuttaa muutoksia solujen ja kudosten toiminnassa. Yksittäisen solun analytiikka ei oikeastaan tarkoita yhtä solua.

”Nyt voidaan tutkia esimerkiksi syöpäsoluja yksittäisinä kohteina. Luotettavaan tulokseen ei riitä yhden solun DNA:n emäsjärjestyksen tai geeniekspression selvittäminen, vaan pitää tutkia tuhansien tai kymmenien tuhansien solujen otoksia”, sanoo Ellonen.

RNA-sekvensointi yhden solun tarkkuudella (scRNA-seq) voi paljastaa geenien välisiä säännöllisiä vuorovaikutusyhteyksiä, solujen syntyperälinjat, solujen eroavaisuuksia sekä solun viitekehyksen ympäristössään.

Sekvensointi yksittäisistä soluista paljastaa myös erilaisia ja jopa uusia solutyyppejä sekä geenien ilmentymiseen perustuvaa tietoa niiden toiminnallisuudesta. Yksittäisen solujen DNA-sekvensointi antaa puolestaan tietoja mutaatioista, jotka tapahtuvat pienissä solupopulaatioissa normaalien solujen seassa. Yksittäisen solun tarkkuus antaa tietoja kasvainten geneettisestä erilaisuudesta, mistä on apua hoidoissa.

”Elävien solujen määrä tutkittavassa näytteessä todennetaan laboratoriossa, jonka jälkeen kukin solu erotellaan omaan nestepisaraansa eli droplettiin mikä mahdollistaa yksittäisen solun DNA- tai RNA –molekyylien merkitsemisen molekyylikohtaisilla ja solukohtaisilla DNA-viivakoodeilla. Molekyylikohtaiset, solukohtaiset ja lopulta näytekohtaiset DNA-viivakoodit mahdollistavat sekä solunäytteen kuhunkin soluun kuuluvien molekyylien tunnistamisen sekä taloudellisesti tehokkaan sekvensoinnin,” kertoo FIMM Teknologiakeskuksen yksittäisten solujen analytiikan yksikön (SCA) johtaja Pirkko Mattila.

”Yhdessä sekvensointiajossa profiloidaan useista näytteistä kustakin tuhansia soluja kerrallaan. Näin saavutetaan tuhansien solujen tai jopa satojen tuhansien solujen analyysistä yhden solun resoluutio ja päästään tutkimaan yksittäisen solun ominaisuuksia.”

Nestemäinen biopsia

Nestemäinen biopsia tarkoittaa soluja tai solunosia sisältävän nestemäisen näytteen ottamista elävästä kudoksesta, kuten verestä. Nestemäinen biopsia on lupaava seurantatyökalu syövän hoitamiseen ilman kirurgisia toimenpiteitä.

”Luomme sekvenssikirjastoja genomialueista, joista ollaan kiinnostuneita eri syövissä,” Pekka Ellonen sanoo.

Nestemäistä biopsiaa voidaan käyttää syövän tunnistamiseen varhaisessa vaiheessa. Verinäytteestä saadaan tietoja kasvaimen syöpäsoluista tai niiden erittämistä DNA-fragmenteista, joita on mahdollisesti verenkierrossa.

”Kasvain on yleensä hankalassa paikassa, jolloin kasvaimen poistamiseksi ja näytteen pitää tehdä kirurginen operaatio. Kun kasvaimet kasvavat hallitsemattomasti, solukuolemia tapahtuu normaalia enemmän. Kuolevat syöpäsolut vapauttavat DNA-fragmentteja verenkiertoon. Verinäytteen soluvapaasta osasta, plasmasta ja seerumista, kerätään nämä DNA-fragmentit talteen sekvensointia varten. Sekvensointituloksia analysoimalla voidaan havaita, onko verenkierrossa DNA-fragmentteja, joissa on nähdään syöville ominaisia muutoksia,” Ellonen toteaa.

Soluvapaa DNA (cfDNA) tarkoittaa verenkierrossa verisolujen ulkopuolella kiertävää DNA:ta. CfDNA-fragmentit päätyvät verenkiertoon joko solukuoleman tai kuolion (nekroosi) takia. Normaalisti nämä fragmentit poistuvat makrofagien eli syöjäsolujen ansiosta, mutta syöpäsolujen liikakasvu aiheuttaa niiden pääsyn verenkiertoon. Soluvapaata DNAta päätyy verenkiertoon solukuolemien kautta myös terveistä soluista. Syöpään sairastuneilla osa soluvapaasta DNA:sta on peräisin kasvaimesta. Tämä kiertävä cfDNA ja erityisesti sen sisältämä kasvaimesta peräisin oleva fraktio (circulating tumor DNA, ctDNA) on lupaava tutkimuskohde yksilöllisilisiin syöpähoitoihin tähtäävissä hankkeissa. Soluvapaata DNA:ta voidaan tutkia verinäytteen lisäksi virtsa-, selkäydinneste- ja sylkinäytteistä. Suomen molekyylilääketieteen instituutin (FIMM) sekvensointiyksikössä etsitään tällaisen cfDNA:n jäänteitä sekvensoimalla.

Ellosen mukaan nestemäistä biopsiaa käytetään paljon ja siihen liittyy monia uusia tutkimushankkeita. Nestemäistä biopsiaa voidaan käyttää perustutkimuksen lisäksi myös hoitosuunnitelman teossa, hoidon vaikutusten seurannassa tai syövän uusiutumisen monitoroinnissa. Se, että pystyy ottamaan useita verinäytteitä eri aikoina, auttaa lääkäreitä ymmärtämään minkälaisia molekyylitason muutoksia on tapahtunut elimistössä.

”Voidaan tunnistaa uusia geenimerkkejä ja parhaassa tapauksessa valita mutaatioiden perusteella toimiva täsmähoito. Vaihtoehtoisesti tiedetään mitä etsitään eli tutkitaan näkyykö verenkierrossa enää merkkejä jäännöstaudista ja saatiinko syöpä kirurgisen operaation jälkeen kokonaan leikattua pois.”

Pekka Ellonen on innostunut CSC:n Allas-tallennuspalvelun käyttöliittymästä, jota kautta laboratoriot ja tutkimuslaitokset voivat jakaa esikäsitellyt sekvensointitulokset ja molekyylien datan tutkijoiden, tutkimusryhmien ja konsortioiden käyttöön. Allas tarjoaa 12 petatavun tallennustilan. Data on saatavilla tietoturvallisesti suoraan www:n kautta. Datankäsittely voidaan tehdä tavanomaisia ohjelmointirajapintoja käyttäen mistä tahansa.

”Julkinen raha tuottaa dataa, joten se pitää jakaa aikanaan tiedeyhteisön käyttöön laajemminkin, asianmukaisesti pseudonymisoituna. Käyttöliittymä mahdollistaa isojen aineistojen, kuten hyödyllisen genomitiedon kohorttiaineistot, jakamisen.”