• Suomi
  • English

RNA:ta sitovista proteiineista uusia lääkekohteita

Itä-Suomen yliopiston farmasian laitoksen lääketutkijan Piia Bartoksen kiinnostuksen kohteena on RNA, RNA:ta sitovat proteiinit ja miten tähän järjestelmään vaikuttamalla voisi estää syövän kasvua. RNA:ta ja siihen sitoutuvan argonautti- proteiinin toimintaa hän on tutkinut massiivisilla simulaatioilla.

 

Molekyylidynamiikan simulaatiot ovat antaneet tietoa, miten biomolekyylit vuorovaikuttavat toisiinsa atomien tasolla. Koska atomit ovat jatkuvassa liikkeessä, niiden väliset voimat lasketaan ja tämän perusteella selvitetään esimerkiksi proteiinin atomien uudet sijainnit, nopeudet ja energiat.  Näin saadaan uutta tietoa lääkeainesuunnitteluun.

Bartos on tutkinut RNA:han sitoutuvia proteiineja (RBP-proteiinit), joilla voi olla merkitystä syövän hoitamisessa. Niillä on havaittu olevan merkitystä syöpäsoluille etenkin lääkevasteissa ja lääkeresistenssin muodostumisessa. Yli 1500 RBP-proteiinia on löydetty. Muutoksen näiden proteiinien toiminnassa voivat vaikuttaa syöpägeenien ilmentymisen tasoon.

RNA-häirintä (RNA-interferenssi eli RNAi) on biokemiallinen mekanismi, jossa RNA aiheuttaa lähetti-RNA:n pilkkoutumisen solussa, jolloin geenin ilmentyminen häiriintyy. RNAi:n löytäneet tutkijat Andrew Fire ja Craig Mello saivat työstään lääketieteen Nobelin palkinnon vuonna 2006. RNAi:n avulla voidaan sammuttaa syövän kasvua edistävien proteiinien ilmentyminen.

”Erityisenä kiinnostuksen kohteenamme ovat argonauttiproteiinit, joilla on tärkeä rooli RNA-välitteisessä geenien hiljentämisessä eli RNA-häirinnässä. Näistä tärkeimpänä on Ago2,”sanoo Bartos.

Kun RNA on sitoutunut Ago2-proteiiniin, tätä yhdistelmää kutsutaan RNA-Ago2-kompleksiksi. Argonautti 2-proteiini sitoo mikro-RNA -molekyylejä soluissa.

”Koska argonautti-2 on solun toiminnalle elintärkeä proteiini, se todennäköisesti vaikuttaa kaikkiin syöpätyyppeihin. Jos se poistetaan soluista, solut eivät pysy elossa. Jos sen toiminta pystyttäisiin poistamaan syöpäsoluissa, syöpäsolutkaan eivät pysyisi elossa. Näin voitaisiin estää syöpäsolujen kasvaminen ja leviäminen.”

Kompleksi, jossa RNA on esitetty palloina ja Ago2:n (argonautti 2) eri osat (domeenit) eri väreillä. Nämä kompleksit voivat hyödyntää muita proteiineja lääkevaikutusten aikaansaamiseksi. Hyvä lääkeaine ei synny, ellei tiedetä, mihin proteiineihin se elimistössämme vaikuttaa.

Proteiinin rakenteen simulaation avulla etsitään täsmälääkkeitä

 

Haasteena on, että RNA-Ago2-kompleksissa voi olla sitoutuneena kahdenlaisia RNA-molekyylejä. Ensimmäinen estää, mutta toinen lisää proteiinin tuotantoa. Jälkimmäisessä tapauksessa syöpäsolujen tuotanto voikin lisääntyä.

”Simuloin RNA:n toimintaa erikseen ja yhdessä Ago-2-proteiinin kanssa. Olen pyrkinyt selittämään, miten Ago-2- kompleksit eroavat rakenteellisesta toisistaan, siis silloin kun siinä on sellainen RNA, joka lisää proteiinin tuotantoa ja silloin kun siinä on proteiinin tuotantoa vähentävä RNA. Olemme vasta saaneet simulaatiot ajettua ja nyt tuloksia analysoidaan.”

Molekyylidynamiikkasimulaation avulla voidaan tehdä eräänlaisia videoita Ago2-RNA-kompleksien liikkeistä ja vertailla aktivoivien ja hiljentävien kompleksien eroja.

Simulaatiossa käytetty RNA-sekvenssidata saatiin A.I Virtanen-instituutista. Simulaatioissa oli kuusi RNA-molekyyliä, joista kolme lisäsi ja kolme vähensi proteiinien tuotantoa. Näille kaikille tehtiin molekyylidynamiikan simulaatioita noin 50 mikrosekuntia eli sekunnin miljoonasosa systeemiä kohden. Simulaatioissa tarvittiin paljon Suomen ELIXIR-keskuksen CSC:n laskentaresursseja.

”Se on aika iso proteiini. Yhdessä RNA:n ja ympäröivän veden kanssa siinä on noin 300 000 atomia, ja niille kaikille piti laskea nopeus ja paikka neljän femtosekunnin välein.”

Femtosekunti on miljoonasosa sekunnin miljardisosasta. Bartos haluaa selvittää, muuttuuko kompleksin muoto ja liikkuuko joku proteiinin osa eri tavalla, kun siinä on lisäävä tai vähentävä RNA sitoutuneena.

”Kompleksin muodon muuttuminen voi todennäköisesti indikoida sitä, että kompleksi sitoutuu eri proteiineihin.”

Kompleksien rakenteissa tai liikkeissä täytyy siis olla jokin ero, joka saa aikaan erilaiset geenien ilmentymistä lisäävät ja vähentävät vaikutukset.

Ymmärtämällä geenien ilmentymistä vähentävien ja lisäävien RNA-proteiinikompleksien rakenteelliset erot, pystytään suunnittelemaan ja etsimään lääkeaineita, jotka sitoutuvat vain haluttuun kompleksiin. Bartosin mukaan tällaiset lääkeaineet olisivat lääketieteellinen läpimurto ja tarjoaisivat uuden mahdollisuuden hoitaa syöpäsairauksia, joissa proteiinien tuotanto on häiriintynyt.

”RNA-häirintään perustuvat lääkkeet ovat hyvä vaihtoehto. Nämä lääkkeet verrattuna tavalliseen pienimolekyyliseen syöpälääkkeeseen voisivat olla spesifisempiä ja tarkemmin syöpäsoluun kohdentuvia. RNA-häirinnällä pystyisimme tarvittaessa estää minkä tahansa haluamamme proteiinin ilmentymisen syövässä. Eli siitä saisi täsmälääkkeitä.”

Bartosin mukaan RNA:n toiminnan mallintaminen on kuitenkin vielä haasteellista. Simulaatioissa voimakenttämallit toimivat hyvin proteiineille, mutta eivät RNA:lle.

”Se johtuu siitä, että se RNA on kemiallisesti ja fysikaalisesti aika erilainen kuin proteiinit.”

Ongelma on esimeriksi fosfaatti, joka muodostaa RNA:n rangan yhdessä deoksiriboosin kanssa.

”RNA:n fosfaatti on sähköisesti varautunut ja sitä nämä nykyiset voimakenttäyhtälöt eivät kovin hyvin pysty mallintamaan. Eli tässä on selkeästi työsarkaa työkalujen kehittämisessä.”

Lääkeainesuunnittelu etenee suurin harppauksin monella tasolla. DeepMindin tekoäly Alphafold osaa jo ratkaista, miten sekvenssi muuttuu proteiinirakenteeksi. Se käyttää tunnettuja proteiinirakenteita ja ennustaa rakenteen kaikille tunnetuille proteiineille.  Sekvensoinnin avulla voidaan puolestaan selvittää syövässä esiintyvät mutaatiot ja mallien avulla tutkia, miten mutaatiot vaikuttavat syöpälääkkeiden toimintaan.

”Mutaatio voi esimerkiksi estää syöpälääkkeen sitoutumisen kohdeproteiiniin lääkevaikutuskohteeseen, jolloin kyseisestä lääkityksestä harvoin on potilaalle hyötyä.”

Laskentakapasiteetin kasvaessa voidaan tulevaisuudessa myös simuloida isompia kokonaisuuksia.

”Olisi hienoa simuloida yksittäistä proteiinia isompaa yksikköä, esimerkiksi solutasolla. Voitaisiin simuloida, miten proteiini vaikuttaa muiden proteiinien, solukalvojen ja soluelinten kanssa.”

Ari Turunen

30.9.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). New drug targets from RNA-binding proteins. https://doi.org/10.5281/zenodo.14810576

 

Lisätietoja:

 

Hanna Baltrukevich & Piia Bartos: RNA-protein complexes and force field polarizability. Front. Chem., 22 June 2023

Sec. Theoretical and Computational Chemistry

Volume 11 – 2023 | https://doi.org/10.3389/fchem.2023.1217506

 

Milla Kurki et all: Structure of POPC Lipid Bilayers in OPLS3e Force Field. Journal of Chemical Information and Modeling. Vol 62/Issue 24

https://pubs.acs.org/doi/full/10.1021/acs.jcim.2c00395

 

Itä-Suomen yliopisto

 

www.uef.fi

 

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi

https://research.csc.fi/cloud-computing

 

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-finland.org

http://www.elixir-europe.org

 

 

 

Uusi koneoppimisen menetelmä nopeuttaa lääkeaineiden seulontaa satakertaisesti

Itä-Suomen yliopistossa seulottiin virtuaalisesti 1,56 miljardia molekyyliä kahdelle lääkekohde-ehdokkaalle. Seulonta oli maailman suurin lajissaan.

Suurin osa käytössä olevista lääkkeistä on suunniteltu niin, että niiden kohdemolekyyleinä ovat elimistön proteiinit. Kun proteiiniperheen yhden jäsenen rakenne on selvitetty, voidaan muiden samaan perheeseen kuuluvien proteiinien rakenne ennustaa mallintamalla. Toimiva lääke voidaan kehittää esimerkiksi siten, että seulotaan isosta kirjastosta molekyyli, jonka kolmiulotteinen rakenne mahdollistaa vuorovaikutuksen kohdeproteiinin kanssa.

Professori Antti Poson tutkimusryhmässä etsittiin kahden lääkevaikutuskandidaatin, SurA-kaperonin ja GAK-kinaasin kanssa reagoivia molekyylejä. Hankkeessa testattiin seulontaan kehitetyn HASTEN-algoritmin toimivuutta ja luotiin uusi koneoppimisen malli.

”Nämä kohdeproteiinit, eli SurA ja GAk, olivat meille entuudestaan tuttuja, olemassa olevista akateemisista tutkimushankkeista. Massiivisten seulontojen tuloksia voidaan nyt hyödyntää muissa tutkimuksissa. Emme siis pelkästään validoineet menetelmää vaan voimme myös auttaa erillisiä akateemisia tutkimushankkeita”, sanoo Poso.

Kaperonit auttavat proteiinien laskostumisessa ja säätelevät proteiinien välisiä vuorovaikutuksia. Kinaasit toimivat mm. solujen signaalienvälittäjinä.

”SurA –kaperoni liittyy Tübingenin yliopiston yhteistyöhankkeeseen, jossa tavoitteena on kehittää uusia antibiootteja. Kinaasit taas ovat iso proteiiniperhe. Syöpälääkkeistä iso osa on kinaasi-inhibiittoreita. Kinaaseja on noin 500 erilaista ja GAK (Cyclin-G-associated kinase) on yksi niistä. GAK:n potentiaali on syöpälääkkeissä ja virusinfektoiden torjunnassa.”

Poson ryhmässä tutkitaan lääkeaineiden vuorovaikutuksia proteiinien kanssa ja rakennetaan kohdeproteiinimalleja. Kohdeproteiinin rakenteesta voidaan yleensä tunnistaa lääkeaineen sitoutumispaikka proteiinin ja saada siten lääkeaine toimimaan. Mallia voidaan erityisesti käyttää virtuaaliseulontaan, jossa suurista molekyylitietokannoista etsitään uusia ideoita lääkekehitykseen.

”Kaperoni on proteiinirakenteeltaan hyvin erityyppinen kuin kinaasi. Kyseessä on siis kaksi hyvin erilaista kohdeproteiinia, joita oli hyvä testata yhdessä.”

 

Tekoäly osasi ennustaa molekyylien sitoutumisen proteiineihin

 

Enamine Real-tietokannan täysi versio sisältää jo 48 miljardia rakennetta. Pelkästään molekyylirakenteiden muuttaminen kolmiulotteiseen muotoon on aikaavievää ja työlästä näin ison datamäärän ollessa kyseessä, mutta HASTEN-algoritmin avulla tämä vaihe voidaan ”ohittaa” ja materiaali käydään läpi muutamassa päivässä. Kuva: Ina Pöhner.

Kahden lääkeaihion rakenteen erilaisuus oli tärkeä tekijä, koska algoritmin pitää toimia kaikissa proteiiniperheissä.

”Kahdella lääkeaineaihiolla testattiin, miten Orionin Tuomo Kalliokosken kehittämä HASTEN-algoritmi toimisi CSC:n superlaskentaympäristössä. Skaalautuvuus onnistui.”

Kohdeproteiinien seulontaa tehtiin vertailun vuoksi HASTEN-algoritmilla ja perinteisellä telakointi -menetelmällä (docking). Telakoinnissa hakualgoritmi laskee vuorovaikutukset proteiinin ja tietokannassa olevan lääkeainekandidaatin välillä. Algoritmin antama lukuarvo kertoo, miten hyvin lääkeaine sitoutuu proteiiniin.

Poson ryhmässä seulottiin 1,56 miljardia lääkeainekandidaattia sisältävää molekyyliä. Molekyylit seulottiin ison ukrainalaisen kemian alan yrityksen Enaminen REAL-tietokannasta.

”Ensin laskettiin joka ikinen tietokannassa oleva piirretty kaksiulotteinen molekyyli ja ne muutettiin kolmiulotteiseen muotoon. Sitten tietokoneohjelma yritti sovittaa kunkin molekyylin GAK:n tai SurA:n sisään. Yksittäinen sovitus voi käsittää jopa satojatuhansia potentiaalisia vaihtoehtoja.”

Sitten tutkijat kokeilivat, miten koneoppimisen malli pärjäsi telakointiin verrattuna. Koneoppimiseen käytettiin HASTEN-algoritmia.

”Valitsimme ensin satunnaisesti miljoona molekyyliä ja katsoimme, miten telakointi sujui. Sitten tämä tulos kerrottiin tekoälylle. Kone siis opetteli miljoonan molekyylin perusteella ennustamaan tuloksen. Eli kun molekyyli näyttää tietynlaiselta, se telakoituu tiettyyn kohtaan.”

Tämän jälkeen tekoälylle syötettiin kaikki 1,56 miljardia molekyyliä ja ennustetiin tulokset perustuen miljoonan molekyylin tuloksiin. Parhaiksi ennustetut telakoitiin ja tulosten perusteella koneoppimine tehtiin uudelleen. Muutaman kierroksen jälkeen tekoäly ennusti telakoinnin 90% tarkkuudella.

”Opetettu kone pystyi tekemään seulonnan huomattavasti nopeammin kuin perinteisen telakointimenetelmän avulla. Kun telakoinnin laskemiseen meni pari kuukautta tehokkaillakin tietokoneilla, koneoppimisen avulla oppimisprosessi ja ennustaminen vei muutaman päivän.”

 

Poson mukaan nyt tutkijat pystyvät rutiininomaisesti seulomaan miljardeja molekyylejä samassa ajassa kuin missä aiemmin seulottiin miljoona. Lisäksi koneoppimisen mallin takia miljardien molekyylien seulonnan voi nyt tehdä ilman supertietokonetta.

”Nyt tietenkin voidaan supertietokoneella seuloa vieläkin suuremmista tietokannoista tuhansia miljardeja molekyylejä tämän menetelmän avulla. ”

Poson ryhmä tutkii seuraavaksi ns. vivid screening-menetelmää.

”Sen sijaan, että ennustetaan jokin tietty yksittäinen aktiivisuus tai telakointi, voidaankin samaan aikaan ennustaa useita erilaisia ominaisuuksia, esim. välttää jotakin sivuvaikutuksen omaavaa sitoutumispaikkaa samalla kun pidetään sitoutuminen oikeaan kohteeseen hyvänä.”

Tutkimuksessa käytettiin Suomen ELIXIR-keskuksen CSC:n superlaskentaresursseja, datantallennusta sekä tarvittavien työkalujen kontitusta.

Ari Turunen

31.8.2024

Lue artikkeli PDF-muodossa

Sitaatti:

Turunen, A., & Nyrönen, T. (2024). New machine learning method speeds up drug screening hundred-fold. https://doi.org/10.5281/zenodo.13691983

 

Lisätietoja:

Toni Sivula, Laxman Yetukuri, Tuomo Kalliokoski, Heikki Käsnänen, Antti Poso & Ina Pöhner (2023): Machine Learning-Boosted Docking Enables the Efficient Structure-Based Virtual Screening of Giga-Scale Enumerated 

Chemical Libraries. J. Chem. Inf. Model. DOI: 10.1021/acs.jcim.3c01239. Available at: https://pubs.acs.org/doi/full/10.1021/acs.jcim.3c01239

 

HASTEN-algoritmi

https://github.com/TuomoKalliokoski/HASTEN

 

Itä-Suomen yliopisto

 

https://www.uef.fi/fi

 

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi https://research.csc.fi/cloud-computing

 

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-finland.org

http://www.elixir-europe.org

 

Rintasyövän hoitoennuste paranee nestebiopsian avulla

Rintasyöpäpotilaan verinäytteestä voidaan eristää syöpäsolun DNA:ta, jonka pilkkoutumisasteesta pystytään arvioimaan onko potilaalla huono tai hyvä hoitoennuste.

 

Rintasyöpä on naisten yleisin syöpä. Yli kaksi miljoonaa naista sairastui siihen vuonna 2020. Rintasyövän ennuste on onneksi parantunut, koska se on mahdollista havaita varhaisessa vaiheessa ja hoitomenetelmät ovat kehittyneet. Yksi tällainen on nestebiopsia, josta on tulossa yhä merkittävämpi syöpien diagnostiikan menetelmä.

Henkilökohtaisen lääketieteen ja biopankkitoiminnan professori Arto Mannermaan ryhmässä nestebiopsiaa on tutkittu vuodesta 2015 alkaen. Nestebiopsia perustuu siihen, että elimistön solut vapauttavat verenkiertoon ja ruumiinnesteisiin DNA:ta, jota kutsutaan solunulkoiseksi DNA:ksi (cell free DNA, cfDNA). Syöpäsoluista vapautuu siis potilaiden verenkiertoon DNA:ta, joka sisältää kullekin syövälle ominaisia mutaatioita. DNA sekvensoidaan, jolloin saadaan selville kasvaimessa olevat geneettiset muutokset.

”Solunulkoisesta DNA:sta olemme tutkineet sen pitoisuutta, pilkkoutumisastetta ja mutaatioita, jotka ovat yhteydessä rintasyöpäpotilaiden ennusteeseen. Vastaavanlaisia yhteyksiä löytyy myös useissa muissa syöpäsairauksissa”, sanoo tutkija Jouni Kujala. Hän työskentelee Mannermaan tutkimusryhmässä Itä-Suomen yliopistossa.

”Tämä on sellainen tutkimusaihe, jossa on ollut hyvinkin paljon laskennallista puolta, varsinkin sekvensointidatan työstämistä,” Kujala sanoo. Kujala aikoo keskittyä jatkossa solunulkoiseen mikro-RNA:han.

”Se on kokonaan toinen nukleiinihappotyyppi, mitä syöpäpotilaiden verinäytteistä voidaan eristää. Solunulkoinen mikro-RNA säätelee geenien toimintaa, eikä niiden ennusteellista arvoa vielä täysin ymmärretä.”

 

 

Solunulkoinen DNA

 

Mannermaan tutkimusryhmässä on tutkittu solunulkoisen DNA:n pilkkoutumista. Sen perusteella voidaan nyt arvioida rintasyöpäpotilaan hoitoennustetta. Tulos on merkittävä, sillä menetelmä auttaa tunnistamaan huonon hoitoennusteen rintasyöpäpotilaat aiempaa varhaisemmin ja tarkemmin. Varhainen tunnistus on keskeisimpiä keinoja vähentää rintasyövän kuolleisuutta.

Tutkijat ovat analysoineet solunulkoisen DNA:n eheyden syy-yhteyttä rintasyövän hoitoennusteeseen.

”Kun syöpäsolut vapauttavat solunulkoista DNA:ta verenkiertoon se alkaa pikkuhiljaa pilkkoutua pienemmäksi, kunnes se hajoaa kokonaan.”

Eheys kuvaa DNA:n pilkkoutumisastetta eli kuinka paljon DNA on veressä pilkkoutunut.

”Mitä eheämpää eli vähemmän pilkkoutunutta solunulkoinen DNA on, sitä enemmän se on yhteydessä huonoon rintasyövän ennusteeseen.”

Mannermaan ryhmän tutkimustuloksen mahdollisti mittava potilasaineisto, Kuopion rintasyöpäprojekti.

”Kuopion rintasyöpäprojekti kattaa yli 500 rintasyöpäpotilasta ja heistä on kerätty todella kattavat tiedot. Tiedämme heidän elintapansa ja heidän saamansa syöpähoidot. Meillä on seurantatiedot parhaimmillaan 25 vuoden ajalta, mikä on kansainvälisestikin poikkeuksellisen pitkä seuranta-aika.”

Tässä tutkimuksessa aineistoon oli valittu rintasyöpäpotilaita, joille ei oltu vielä aloitettu syöpähoitoja.

”Aineistossa oli varhaisen vaiheen rintasyöpäpotilaita, jotka olivat lähtökohtaisesti hyväennusteisia.”

Tällaisen aineiston valinnalle oli selkeä peruste, sillä rintasyöpä uusiutuu jopa kolmanneksella potilaista ja on naisten yleisin syöpäperäinen kuolinsyy. Mannermaan ryhmän tavoitteena on, että tulevaisuudessa aggressiivista rintasyöpää sairastavat potilaat voitaisiin tunnistaa nykyistä aikaisemmin eheysmittauksen avulla ja tarvittaessa ohjata tehostettuun hoitoon ja seurantaan.

Aineistoa tekoälyn opettamiseen

 

Eheyden mittaus on menetelmänä yksinkertainen. Käytännössä eristetty näyte laitetaan mittauslaitteeseen, joka määrittää näytteessä olevien DNA-pätkien suhteellisen osuuden. Sitten voidaan laskea, mikä näytteessä olevan solunulkoisen DNA:n eheysaste on.

Kujalan mukaan näinkin yksinkertainen DNA-näytteen laatua kuvaava arvo voi olla käyttökelpoinen syövän ennusteen arvioinnissa. Tätä menetelmää voidaan jatkossa hyödyntää tekoälyn opettamiseen.

”Kun mitataan solunulkoisen DNA:n pitoisuutta ja eheyttä, nehän ovat puhtaasti laatumittareita. Niitä ei nykyisellään käytetä potilaan ennusteen arvioimisessa. Varsinainen diagnostinen puoli on pitkälti keskittynyt mutaatioihin ja muihin DNA:n piirteisiin. Koneoppiminen voisi hyödyntää tätäkin dataa nykyistä tehokkaammin. Tämä data joka tapauksessa kerätään kaikista näytteistä joita tutkitaan, mutta sitä ei juurikaan hyödynnetä.”

Mannermaan ryhmässä kehitetään genomidatan ja kliinisen datan perusteella oppivia algoritmeja, jotka tunnistavat ja ennustavat rintasyövän riskitekijöitä. Genomidata ja kliininen data yhdistetään tekoälymalliksi, joka auttaa paitsi sairastumisriskin määrittämisessä, myös yksilöllisten hoitosuunnitelmien tekemisessä.

Mannermaan ryhmän tutkimuksissa käyttämän datan määrä on niin iso, että siihen tarvitaan Suomen ELIXIR-keskuksen CSC:n superlaskentakapasiteettia.

”Meillä on CSC:n resursseja käytössä nimenomaan koneoppimisen takia. Toistaiseksi olemme kehittäneet syöpäriskin analytiikkaa, mutta samoja malleja hyödynnetään näiden nestebiopsiatulosten jatkotyössä. Vielä tätä dataa ole jatkotyöstetty”, sanoo professori Arto Mannermaa.

Ari Turunen

23.1.2024

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Improving breast cancer treatment prognoses with liquid biopsy. https://doi.org/10.5281/zenodo.13691344

 

Lisätietoja:

Maria Lamminaho, Jouni Kujala, Hanna Peltonen, Maria Tengström, Veli-Matti Kosma ja Arto Mannermaa. High Cell-Free DNA Integrity Is Associated with Poor Breast Cancer Survival. Cancers. 2021.

https://doi.org/10.3390/cancers13184679.

 

Itä-Suomen yliopisto

https://www.uef.fi/fi/

 

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keski- tettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi https://research.csc.fi/cloud-computing

 

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-finland.org

http://www.elixir-europe.org

 

 

Dataa eri lähteistä yhdistämällä saadaan yksilöllisiä hoitoja

Itä-Suomen yliopiston Bioinformatiikan keskuksessa kehitetään Virpi Aholan johdolla biolääketieteellisen ja multimodaalisen datan analysoimiseen uusia sovelluksia. Näitä voidaan hyödyntää syöpien, metabolisten, sydän- ja verisuonisairauksien sekä hermostoa rappeuttavien sairauksien tutkimisessa.

 

Aholalla on pitkä ura bioinformatiikasta. Hän oli mukana professori Ilkka Hanskin metapopulaatiobiologian tutkimusryhmässä, jossa sekvensointiin täpläverkkoperhosen koko genomi. Se oli ensimmäinen Suomessa tehty referenssigenomi. Karolinska Institutissa Hong Kongissa hän analysoi geenien toimintaa eri taudeilla yhden solun tasolla ja tutki sen avulla, miten kantasoluja käyttämällä voidaan kehittää uusia lääkkeitä ja hoitoja. Nyt hän johtaa Bioinformatiikkakeskusta.

Bioinformatiikakeskuksessa yhdistellään erilaisia omiikka-datoja (genomiiikka, proteomiikka, transkriptomiikka) kliiniseen dataan ja jatkossa mahdollisesti myös kuvantamisdataan.

”Tavallisten omiikka-analyysien lisäksi tehdään eri tutkimusryhmille multimodaalista data-analyysiä. Siinä yhdistetään erityyppisten datojen analyysi ja pyritään siihen, että saadaan enemmän tietoa kuin erikseen analysoimalla.”

Multimodaalisen datan analyysitapa vaihtelee sen mukaan, onko erityypiset datat kerätty samasta potilaasta vai ovat ne peräisin eri potilaista.

Omiikka on tutkimustapa, jolla pyritään analysoimaan tutkimuskohteen kaikkia geneettisesti määräytyviä muuttujia samanaikaisesti. Kun genomiikassa analysoidaan geneettistä muuntelua ja geenien toimintaa, proteomiikassa keskitytään proteiineihin ja epigenetiikassa geenien toiminnan säätelyyn ja perinnöllisen tiedon tallentumiseen ilman DNA-sekvenssin muutoksia. Metabolomiikassa analysoidaan sairauden, ruokavalion tai lääkityksen aiheuttamia muutoksia aineenvaihdunnassa.

”Kehitämme bioinformatiikkapalveluja yhteistyössä biolääketieteen asiantuntijoiden kanssa. Yksi painopiste Itä-Suomen yliopistossa on keskeisten kroonisten kansansairauksien molekulaarisen taustan selvittämisessä sekä niiden ehkäisyn ja hoidon kehittämisessä”, sanoo Ahola.

Niveltävä lääketiede tarjoaa yksilöllisen hoidon

 

Translationaalinen eli niveltävä lääketiede hyödyntää perustutkimusta kliinisessä tutkimuksessa ja toisaalta potilasnäytteitä ja tautimalleja tautimekanismien ja lääkevaikutuskohteiden selvittämisessä. Lähtökohtana on poikkitieteellisyys, joka auttaa tutkimuksen ohella myös potilaita.

”Translationaalisen lääketieteen tulemista hidastaa se, että ei kerta kaikkiaan tiedetä tarpeeksi. Monen eri datalähteen yhdistämisen lähtökohta on, että saataisiin enemmän tietoa esille. Yhdistäminen on hyvin paljon laskennallista ja siihen tarvitaan CSC:n resursseja ja ELIXIRin tapaisia infrastruktuureja.”

Yhtenä esimerkkinä Ahola mainitsee yksisolutekniikat.

Transkriptiossa DNA:ssa olevaa geneettistä koodia kopioituu RNA:ksi. Transkriptio on proteiinisynteesin ensimmäinen vaihe. Transkriptomiikan avulla saadaan tarkkaa tietoa yksittäisen solun geenien ilmenemisestä juuri tietyllä hetkellä.

”Yksisolutranskriptomiikan käyttö on vielä kallista. Avoimen tieteen periaatteet ovat olemassa ja sen vuoksi kaikki data pitää jakaa, kun se julkaistaan. Tällöin dataa voi uudelleen käyttää ja eri datalähteitä yhdistellä.”

Haasteena on kuitenkin, että dataa on tuotettu erilaisilla teknologioilla.

”Eri datalähteissä voi solujen määrä vaihdella tai niissä voi olla eri solutyyppejä. Minkälaisia menetelmiä pitäisi tällöin käyttää erilaisten datojen yhdistämiseen? Jos tämä voitaisiin ratkaista, silloin voitaisiin tehokkaammin tutkia potilaan solujen kehitystä ja niiden erikoistumista.”

Laskennalliset menetelmät ison datan käsittelyssä on haaste jatko-opiskelijoille

 

Aholan tavoitteena on avustaa enemmän laskennallisten menetelmien käytössä. Itä-Suomen yliopiston Bioinformatiikan keskus tarjoaa tutkijoille laskentakapasiteettia ja auttaa tutkijoita esikäsittelemään ja analysoimaan dataa sekä avustamaan erilaisten laskennallisten menetelmien ja ohjelmistojen käytössä ja asentamisessa.

”Jos samassa ryhmässä tai yhteistyökumppanina ei ole bioinformaatikkoja, tutkijoiden oletetaan hallitsevan myös laskennalliset menetelmät ja ison datan käsittelyn.”

Ahola myöntää, että vaatimukset ovat kovat esimerkiksi jatko-opiskelijoille.

Itä-Suomen yliopistossa on tähän haasteeseen on tartuttu perustamalla laskennallisen biolääketieteen suuntautumisvaihtoehto.

”Yksi esimerkki datan uudelleenkäsittelyn haasteista ovat suomalaiset biopankit, joihin on tallennettu yli puolen miljoonan suomalaisen genomit. Ei ole ihan yksinkertainen juttu käydä biopankeissa analysoimassa dataa, koska sitä on ihan järjetön määrä.”

Ahola viittaa FinnGen -tutkimushankkeeseen, joka käynnistyi syksyllä 2017. Sen päätavoitteena on lisätä ymmärrystä sairauksien syistä ja edistää niiden diagnosointia, ennaltaehkäisyä ja hoitojen kehittämistä. FinnGen -tutkimuksessa hyödynnetään suomalaisten biopankkien keräämiä näytteitä. Kesäkuuhun 2023 mennessä FinnGen -tutkimukselle saatiin kerättyä yli 553 000 näytettä. Tutkimushankkeen ensimmäisen vaiheen kesto oli kuusi vuotta. Vastaavan kokoluokan tutkimushankkeita on maailmassa vain muutama.

Tutkimushankkeissa genomidata yhdistetään kansallisissa terveydenhuollon rekistereissä oleviin aineistoihin. Suomessa onkin harvinaisen hyvät edellytykset koko väestön kattavalle geenitutkimukselle.

Kliininen data pitkittäistutkimuksista yhdistettynä geenidataan tarjoaa paljon mahdollisuuksia. Mutta dataa pitää olla paljon.

”Datakokoelmia tarvitaan, koska yksikään tutkija ei voi kerätä 10 tai 100 tuhannen yksilön aineistoa. Jos aineisto on pienempi sillä ei välttämättä saada luotettavaa tietoa geneettisesti kompleksisten tautien tutkimiseen ”

Itä-Suomen yliopistossa on monia eri datalähteitä hyödyntäviä tutkimushankkeita. Itä-Suomen yliopiston ja Kuopion yliopistollisen sairaalan Alzheimerin tautia käsittelevässä hankkeessa yhdistetään potilaskäynneillä kerätty kliininen data FinnGen -aineistoon. Näin tutkijat pyrkivät selvittämään Alzheimerin taudin puhkeamiseen johtavia biologisia mekanismeja.

”FinnGenin biopankki on ainutlaatuinen resurssi, jota voitaisiin kuitenkin hyödyntää tutkimuksessa mahdollisesti vielä paljon enemmän”, sanoo Ahola.

”Toinen esimerkki Alzheimerin taudin tutkimuksesta on Rappta Therapeutics:in ja Itä-Suomen yliopiston professoreiden Mikko Hiltusen ja Annakaisa Haapasalon projekti, jossa tutkitaan transgeenisten solulinjojen avulla eri Alzheimerin hoitojen vaikutusta proteiinien toimintaan.”

Yksi mielenkiintoinen yhteistyöprojekti on akatemiatutkija Kirsi Ketolan kanssa.

Siinä tutkitaan eturauhassyövän hoitoon käytettyä karboplatiini-resistenssiä. Karboplatiini tuottaa ”DNA-ristilinkkejä”, mikä johtaa DNA:n korjausmekanismin aktivoitumiseen ja resistenssiin, jolloin syöpäsolut kykenevät taas jakautumaan. Tutkimukseen käytetään yksisolutekniikoita, jossa yksittäisen solun tasolla pystytään mittaamaan sekä geenien ilmentymistä että kromatiinin muutoksia.”

Kromosomit sijaitsevat tumassa pitkinä kromatiini-rihmoina.

Virpi Aholan mukaan hyvä datankäsittely ja sen taitava yhdistäminen voisi mahdollistaa yksilöllisen hoidon.

”Potilaille voitaisiin räätälöidä paremmin olemassa olevilla lääkkeillä tehtyjä hoitosuunnitelmia”.

Itä-Suomen yliopiston Bioinformatiikkakeskuksen tutkimuspalvelut.

Datan uudelleenkäyttö vaatii osaamista

 

Ahola kannattaa vahvasti datan avoimuutta ja uudelleenkäyttöä sekä sellaisen menetelmien ja infrastruktuurien luomista, joka helpottaa ja kannustaa tähän. Yhtenä esimerkkinä hän mainitsee EGA:n. European Genome-phenome Archive (EGA) on data-arkisto, jossa voi jakaa ja lupaa vastaan on mahdollista saada käyttöönsä jo julkaistuja biolääketieteellisiä datoja.

”Arkisto sisältää ihmisen genomista dataa, joka on yhdistetty kliiniseen ja muuhun metadataan. Koska periaatteessa henkilö voi olla mahdollista genomisen ja fenotyypin perusteella identifioida, datan jakamien on tarkkaan säädeltyä.”

Aholan mukaan EGA:n avulla datan jakaminen on hoidettu asianmukaisella tavalla ja näin arvokasta biolääketeteen tutkimusaineistoa on mahdollista käyttää uudelleen, kuten uusien tutkimushypoteesien luomiseen tai testaamiseen.

”Olemassa olevia aineistoja voidaan myös katsoa eri näkökulmasta. Esimerkiksi potilaita voidaan valita eri kriteereillä kuin jo julkaistussa tutkimuksessa tai aineistoja voidaan käyttää osana laajempaa datakokoelmaa.”

Aholan mukaan yhdessä pitäisi tehdä enemmän ja viittaa Biokeskus Suomeen, joka yhdistää seitsemän eri Suomen yliopiston biokeskusta. Yhteistyötä pitäisi pystyä lisäämään eri biokeskusten välillä ja yli valtakunnan rajojen esimerkiksi Suomen ELIXIR-keskus CSC:n avulla.

”ELIXIR on meille väylä verkostoitua ja oppia muiden bioinformatiikkakeskuksien kokemuksista sekä olla mukana niissä pöydissä, jossa tutkimusinfrastruktuuriin liittyvistä asioista keskustellaan ja uusia aloitteita tehdään.”

Koska uudet teknologiat tuottavat isoja ja kompleksisia data-aineistoja, tutkimusinfrastruktuureilta edellytetään muutakin kuin vain tutkimuslaitteistoja.

”Jotta aineistoja voitaisiin tehokkaasti hyödyntää, pelkkä esimerkiksi CSC:n tarjoama laskentakapasiteetti ei riitä vaan datojen käsittelyyn ja uudelleenkäyttöön tarvitaan niihin perehtynyttä henkilökuntaa. Näen, että biokeskusten parempi resursointi ja systemaattinen yhteistyö voisi olennaisesti helpottaa ja parantaa isojen genomisten datojen käsittelyä, yhdistämistä ja uudelleenkäyttöä.”

 

Ari Turunen

1.9.2023

Lue artikkeli PDF-muodossa

Sitaatti

Turunen, A., & Nyrönen, T. (2024). Improving breast cancer treatment prognoses with liquid biopsy. https://doi.org/10.5281/zenodo.13691344

Lisätietoja:

Bioinformatiikkakeskus, Itä-Suomen yliopisto

https://uefconnect.uef.fi/tutkimusryhma/bioinformatiikkakeskus/

 

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi

https://research.csc.fi/cloud-computing

 

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-europe.org

https://www.elixir-finland.org

 

 

 

Leukemiaan parempia hoitoja

Itä-Suomen yliopiston professori Merja Heinäniemi tutkimusryhmineen tulkitsee laskennallisten menetelmien avulla syöpänäytteistä, millaiset solun prosessit ovat viallisia ja miten solut käyttäytyvät lääkehoitojen aikana. Tarkoitus on löytää leukemiaan tehokkaita lääkehoitoja.

Leukemia eli verisyöpä johtuu kun luuytimen valkosolujen esiasteet muuttuvat syöpäsoluiksi. Toisin kuin muissa syövissä leukemiassa ei muodostu yksittäistä kasvainta, vaan syöpäsoluja on verenkierrossa ja luuytimessä. Kokonaisuudessaan lasten leukemiahoidot ovat niin tehokkaita, että ennusteet paranemisesta ovat jopa 90%. Heinäniemi kuitenkin muistuttaa, että tauti saattaa uusiutua.

”Vaikka leukemia olisi uusiutuessaan hoidettavissa, se kuitenkin tarkoittaa että kemoterapia, pitkä sytostaattilääkehoito, kestää useita vuosia. Siksi nykyistä tehokkaammat hoitomuodot ovat tärkeitä ja toisaalta joillakin potilaille hoitoja voisi keventää. On potilaita, joille on vaikea löytää hoitomuotoja, mutta toisaalta lasten leukemioiden hoidot kestävät pitkään.”

Laskennallisen biolääketieteen professori Merja Heinäniemi tutkii, miten geenit vaikuttavat syöpäsolujen syntyyn.

”Verisyöpiin kuuluu erilaisia leukemioita, akuutteja ja kroonisia leukemioita. Näistä leukemioista myeloidiset leukemiat ovat lähinnä aikuisten tauteja kun taas lymfoblastiset ovat lasten tauteja”, sanoo Heinäniemi.

Akuutissa  leukemiassa luuytimessä veren kantasolun perimä muuttuu ja valkosolujen esiasteet alkavat jakaantua hallitsemattomasti. Lapsilla yleisin leukemia on immuunipuolustuksessa toimivien B- ja T-solujen esiasteesta lähtöisin, jolloin sitä kutsutaan akuutiksi lymfoblastileukemiaksi.

 

Data-analyysin avulla löydettiin uusia lääkeaihioita

 

Heinäniemen tutkimusryhmässä on tehty syöpiin liittyviä geeniekspressioprofiilien analyyseja. Geeniekspressio tarkoittaa geenien ilmentymistä eli solun tapahtumasarjaa, jossa DNA:n sisältämä koodi kopioidaan RNA:ksi ja edelleen tämän  viestimolekyylin ohjaamana proteiiniksi. Syövän kehittymistä edistävä geeni voi käynnistyä tai vastaavasti hiljentyä. Geenin toimintaan vaikuttavilla säätelyalueilla on vaikutus myös DNA-vaurioiden syntymisessä lasten leukemiassa ja kypsemmissä imukudossyövissä.

Vuonna 2019 Heinäniemi yhdessä muiden tutkijoiden kanssa keräsi ison datakokoelman, jossa on yli 10 000 potilasnäytettä. Tämä HEMAP-data (hematological malignancies) on edelleen jaettavissa tutkijoille Suomen ELIXIR-keskuksen CSC:n kautta. Tästä datajoukosta pystyttiin päättelemään laskennallisin menetelmin yli 30 syöpätyyppiä. Lisäksi löydettiin tauteja kuvaavia uusia biomarkkereita sekä uusia lääkeaihioita kun data yhdistettiin lääkekohdetietokantoihin.

Esimerkiksi lasten leukemiasta löytyi molekyylitasoltaan eri tyyppisesti käyttäytyviä alityyppejä.

”Pystymme huomaamaan jo dataryhmittelystä, että taudin alatyypitkin ovat geeniluennan profiileiltaan ainutlaatuisia ja ne voidaan tunnistaa datan perusteella. Yhteen koottu data paljasti meille molekyylitasolla taudin heterogeenisyyttä ja toisaalta yhteneväisyyksiä eri tautien välillä.”

Heinäniemi on etsinyt datan perusteella sellaisia potilaita, joille hoito voisi olla kevyempää. Solunsalpaajat eli sytostaatit ovat syöpäsolujen tuhoamiseen tarkoitettuja lääkkeitä. Ne kuitenkin voivat aiheuttaa paljon haittavaikutuksia. Huonon hoitovasteen saavilla potilailla on yleensä myös suurentunut riski taudin uusiutumisesta.

Leukemia eli verisyöpä johtuu luuytimen valkosolujen esiasteiden muuttumisesta pahanlaatuisiksi syöpäsoluiksi. Leukemiassa ei muodostu yksittäistä kasvainta kuten muissa syöpämuodoissa, vaan syöpäsoluja on kiertävässä veressä ja luuytimessä. Leukemia on luuytimen kantasolujen syöpäsairaus. Kuvassa ihmisen verisoluja ja lymfosyyttejä, jotka ovat yksi veren valkosolujen lajeista. Niitä muodostuu luuytimessä. Leukemiassa lymfosyytin rakenne on muuttunut ja sairaiden lymfosyyttien osuus valkosolujen määrästä on lisääntynyt.

Yksisoluanalytiikka auttaa hyvän lääkehoidon löytämisessä

 

Yhdessä Tampereen yliopiston Olli Lohen kanssa Heinäniemen ryhmä kartoitti ihmisen koko perimästä, miten eri geenit voisivat toimia ennustavana tekijänä lasten leukemiassa.

”HEMAP-aineistosta on löydetty mahdollisia biomarkkerigeenejä lasten leukemioihin. Lähdimme aluksi kartoittamaan huonoa lääkevastetta, mutta genomitutkimuksessa löydettiinkin, millaisia piirteitä sellaisilla leukemiapotilailla on, jotka vastaavat hyvin lääkehoitoihin.”

Yksi tällainen hyvän vasteen merkki ovat solusyklissä olevat solut. Solujen elämä noudattaa yleensä tiettyä rytmiä eli solusykliä, jossa solunjakautuminen eli mitoosi ja välivaihe eli interfaasi vuorottelevat. Solusyklin päämääränä on useimmiten tuottaa solunjakautumisen avulla kaksi identtistä solua.

”Yksittäisten solujen kartoituksessa meille selvisi syklissä olevien solujen määrä. Me pystyimme erottamaan eri solut vaiheisiin ja syklissä olevien solujen määrä näytti olevan tärkeä hyvään vasteeseen liittyvä merkki. Yksisoluanalytiikka on hyvä keino tutkia miten syöpäsolu käyttäytyy. Sieltä paljastuu ne harvinaisemmat selviytyvät solut muun massan joukosta. Tärkeää on tutkia, miten lääkehoito vaikuttaa syöpäsolun käyttäytymiseen”, Heinäniemi toteaa.

Yksittäisten solujen RNA-sekvensointi (scRNA-seq) mittaa kaikkien geenien aktiivisuudet jokaisessa solussa erikseen, jolloin saadaan aiempaa tarkempi kuva solujen eroavaisuuksista. Tämä on tärkeää tietoa, koska syöpäsolut yrittävät karata immuunisoluilta muuttumalla.

”Syöpätutkimuksessa on tärkeää saada dataa yhden solun tarkkuudella. Syöpäsolut nimittäin muuttuvat koko ajan, jolloin jokainen solu alkaa olla erilainen.”

Nyt leukemiaa tutkittaessa yksisolutekniikalla saadaan yksittäisestä luuydinnäytteestä mitattua jopa 10 000 solun profiilia. Kun yksisolutekniikkaa käyttää muissa syövissä päästään helposti mittaamaan jopa miljoonia soluja.

 

Tarkoitus estää syöpäsolujen pakoreitti hoidon aikana

 

Heinäniemen ryhmän tutkimuksissa havaittiin, että leukemiahoito käynnistää soluissa nopeasti eräänlaisia pakoreittejä muuttamalla geenien luentaa. Sen avulla syöpäsolu väistää annettua hoitoa. Nämä RNA- molekyylien profiilit, jotka luetaan vaikuttavat solun toiminnallisen osan rakentamiseen. Näin saadaan tavallaan sen hetkinen solun tila selville ja se, mitä solu pyrkii tekemään.

”Leukemiasolu on sellainen luuytimen kantasolumainen solu, jolla on vielä mahdollisuuksia vaihtaa ilmiasuaan. Se voi erilaisissa ilmiasuissa yrittää piileksiä hoidoilta. Esimerkiksi se, että solu ei jakaannukaan niin villisti, on yksi pakokeino. Solu voi alkuhoidoissa myös vaihtaa erilaistumistilojaan ja löytää lääkeresistentin tilan. ”

Heinäniemen ryhmässä laaja soluista mitattu molekyyliprofiili on laskennallisten menetelmien avulla mahdollista ryhmitellä. Siten voidaan erotella normaalit luuytimen solut leukemiasolujen profiileista ja tunnistaa erilaisia leukemiasolujen ilmiasuja mittausten perusteella. Malleja voi myös kouluttaa oppimaan samasta näytteestä kerättyjen eri mittausten yhteyden.

”Diagnoosivaihe ei täysin paljasta, minkälaisia pakokeinoja niillä syöpäsoluilla mahdollisesti on. Tässä yksisoluteknologia on auttanut, koska nyt pääsemme mittamaan niitä harvinaisia resistenttejä solumuotoja hoidon aikana. Eli uutta tietoa ja pystymme sitten miettimään, miten voimme ennaltaehkäistä solun pakoreittiä tai mihin se on piiloutumassa.”

HEMAP on reaaliaikainen verkossa toimiva interaktiivinen työkalu, jolla voidaan tunnistaa ja kuvailla eri molekyylitason fenotyyppejä eri verisyövistä. HEMAP sisältää 10 000 mikrosiru-profiilia eri verisyövistä. Hematopoieesi eli verenmuodostus on biologinen prosessi, jolla keho tuottaa lisää verta sekä ylläpitää puolustusjärjestelmää. Verisolut muodostuvat hematopoieesissa luuytimessä sijaitsevista erikoistuneista kantasoluista. Nyt kehitetty uusi CSC:n ylläpitämä HEMAP mahdollistaa lääkeainemolekyylien kohdegeenin analyysin ja pilottiversio, missä mukana on yhden solun tarkkuudella tehtyjä mittausprofiileja myös solutyyppien tunnistamisen. Kuvassa alempana LCK-onkogeenin ilmentyminen HEMAP-näytteissä. Korkea taso punaisella, matala sinisellä. LCK ( lymphocyte-specific protein tyrosine kinase) löytyy erityisen korkealla T-lymfosyyteistä kehittyvässä T-soluisessa akuutissa leukemiassa. LCK:n mutaatiot ja korkea ilmentyminen liittyvät moniin erilaisiiin sairauksiin. Tyrosiinikinaasit ovat entsyymejä, joiden säätelyhäiriöt voivat edistää myeloidisien leukemiasolujen henkiinjäämistä.

Dataa yhdistetään useista lähteistä

 

Nyt Heinäniemen ryhmä on alkanut käyttää kehittämiään neuroverkkomalleja. Dataa kerätään eri tutkimuksista tähän malliin.

”Leukemia-hankkeemme keskittyy lasten syöpiin. Se on hyvin harvinainen syöpätyyppi: jos me emme saa yhdistettyä dataa niin ne aineistot jäävät todella pieniksi. Tavoitteena on näissä hankkeissa hyödyntää CSC:n infrastruktuuria. Näin pystyttäisiin prosessoimaan datat valmiiksi ja jakamaan ne tiedeyhteisön käyttöön.”

Tutkimusta ei pysty tekemään pelkästään suomalaisilla aineistoilla.

”Meillä on ollut pitkään pohjoismaista yhteistyötä. Nyt on tullut mukaan myös muita Euroopan maita. Tavoitteena olisi mahdollistaa datavaranto niille tutkijoille, jotka eivät itse pysty tekemään datan prosessointia. Tuomme yhteen jo kerättyjä ja mitattuja profiileja, koska niiden kerääminen julkisista datatietokannoista on työlästä. Tarkoitus on tuoda yksisoludata yhteen paikkaan ja helposti lähestyttävään muotoon. Kun pystymme tuomaan maailman eri tutkimusryhmien tuloksia samaan paikkaan, niin pääsemme nopeasti vertaamaan mitkä lääkeaihiot voisivat toimia. ”

Datan jakaminen vaatii luottamuksen luomista. Käytännössä se tarkoittaa yhteistyötä hankkeissa mukana olevien potilaiden kanssa.

”On todella tärkeää, että he osallistuvat ja että heidän datansa on tietoturvallisesti säilytetty ja että tutkijat pystyvät aineistojen kanssa tekemään työtään. Sitähän CSC on mahdollistamasssa kansallisesti ja EU-tasolla olemalla mukana ELIXIR-infrastruktuurissa.”

Ari Turunen

15.8.2023

Lue artikkeli PDF-muodossa

Sitaatti

Nyrönen, T., & Turunen, A. (2023). Better treatments for leukaemia. https://doi.org/10.5281/zenodo.10020637

 

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi

https://research.csc.fi/cloud-computing

 

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-europe.org

https://www.elixir-finland.org

 

Hemap: An Interactive Online Resource for Characterizing Molecular Phenotypes across Hematologic Malignancies.

Pölönen P, Mehtonen J, Lin J, Liuksiala T, Häyrynen S, Teppo S, Mäkinen A, Kumar A, Malani D, Pohjolainen V, Porkka K, Heckman CA, May P, Hautamäki V, Granberg KJ, Lohi O, Nykter M, Heinäniemi M.Cancer Res. 2019 May 15;79(10):2466-2479. doi: 10.1158/0008-5472.CAN-18-2970. Epub 2019 Apr 2.PMID: 30940663

 

Data-driven characterization of molecular phenotypes across heterogeneous sample collections.

Mehtonen J, Pölönen P, Häyrynen S, Dufva O, Lin J, Liuksiala T, Granberg K, Lohi O, Hautamäki V, Nykter M, Heinäniemi M.Nucleic Acids Res. 2019 Jul 26;47(13):e76. doi: 10.1093/nar/gkz281.PMID: 31329928

 

Immunogenomic Landscape of Hematological Malignancies.

Dufva O, Pölönen P, Brück O, Keränen MAI, Klievink J, Mehtonen J, Huuhtanen J, Kumar A, Malani D, Siitonen S, Kankainen M, Ghimire B, Lahtela J, Mattila P, Vähä-Koskela M, Wennerberg K, Granberg K, Leivonen SK, Meriranta L, Heckman C, Leppä S, Nykter M, Lohi O, Heinäniemi M, Mustjoki S.Cancer Cell. 2020 Sep 14;38(3):380-399.e13. doi: 10.1016/j.ccell.2020.06.002. Epub 2020 Jul 9.PMID: 32649887

 

Therapeutic targeting of LCK tyrosine kinase and mTOR signaling in T-cell acute lymphoblastic leukemia.

Laukkanen S, Veloso A, Yan C, Oksa L, Alpert EJ, Do D, Hyvärinen N, McCarthy K, Adhikari A, Yang Q, Iyer S, Garcia SP, Pello A, Ruokoranta T, Moisio S, Adhikari S, Yoder JA, Gallagher K, Whelton L, Allen JR, Jin AH, Loontiens S, Heinäniemi M, Kelliher M, Heckman CA, Lohi O, Langenau DM.Blood. 2022 Oct 27;140(17):1891-1906. doi: 10.1182/blood.2021015106.PMID: 35544598

 

Erythroid/megakaryocytic differentiation confers BCL-XL dependency and venetoclax resistance in acute myeloid leukemia.

Kuusanmäki H, Dufva O, Vähä-Koskela M, Leppä AM, Huuhtanen J, Vänttinen I, Nygren P, Klievink J, Bouhlal J, Pölönen P, Zhang Q, Adnan-Awad S, Mancebo-Pérez C, Saad J, Miettinen J, Javarappa KK, Aakko S, Ruokoranta T, Eldfors S, Heinäniemi M, Theilgaard-Mönch K, Wartiovaara-Kautto U, Keränen M, Porkka K, Konopleva M, Wennerberg K, Kontro M, Heckman CA, Mustjoki S.Blood. 2023 Mar 30;141(13):1610-1625. doi: 10.1182/blood.2021011094.PMID: 36508699

 

Single cell characterization of B-lymphoid differentiation and leukemic cell states during chemotherapy in ETV6-RUNX1-positive pediatric leukemia identifies drug-targetable transcription factor activities.

Mehtonen J, Teppo S, Lahnalampi M, Kokko A, Kaukonen R, Oksa L, Bouvy-Liivrand M, Malyukova A, Mäkinen A, Laukkanen S, Mäkinen PI, Rounioja S, Ruusuvuori P, Sangfelt O, Lund R, Lönnberg T, Lohi O, Heinäniemi M.Genome Med. 2020 Nov 20;12(1):99. doi: 10.1186/s13073-020-00799-2.PMID: 33218352

 

Semisupervised Generative Autoencoder for Single-Cell Data.

Trong TN, Mehtonen J, González G, Kramer R, Hautamäki V, Heinäniemi M.J Comput Biol. 2020 Aug;27(8):1190-1203. doi: 10.1089/cmb.2019.0337. Epub 2019 Dec 2.PMID: 31794242

 

Sequential drug treatment targeting cell cycle and cell fate regulatory programs blocks non-genetic cancer evolution in acute lymphoblastic leukemia. Malyokova A, Lahnalampi M, Falqués-Costa T, Pölönen P, Sipola M, Mehtonen J, Teppo S, Viiliainen J, Lohi O, Hagström-Andersson AK, Heinäniemi M*, Sangfelt O* co-senior, BioRxiv https://www.biorxiv.org/content/10.1101/2023.03.27.534308v2

 

 

 

 

 

 

Koneoppimisella etsitään merkkejä rintasyövästä

Geenivarianttien lisäksi on genomisia variantteja yksittäisissä DNA:n emäsparijaksoissa. Nämä variaatiot aiheuttavat yksilöiden väliset erot, mutta ne voivat myös auttaa paikallistamaan tautia aiheuttavia geenejä. Nämä yhden emäsparin vaihtelut eli snipit (single nucleotide popymorphism, SNP) voivat toimia markkereina, jotka viittaavat sairauteen. Itä-Suomen yliopistossa kehitetty tekoälymalli etsii rintasyöpään viittaavia snippejä.

 

Genomidatan valtava määrä on mahdollistanut sen, että tutkijat voivat laskea, mitä geenimuunnoksia on niissä ryhmissä, jotka ovat sairastuneet syöpään. Yhteen tautiin voi vaikuttaa satoja tai tuhansia geenimuunnoksia.

Tilastollisten menetelmien ansiosta tutkijat voivat arvioida, miten yhden ihmisen geenimuunnokset lisäävät riskiä sairastua tautiin eli näin saadaan monitekijäisten geenien riskiarvo. Mutta variaatioita on myös DNA:n emäspareissa eli nukleotideissä. Ne tunnetaan genomisina variantteina eli snippeinä. DNA:n sekvenssivariaatiot tapahtuvat, kun yhdessä emäsparissa genomisekvenssi (adeniini-tymiini, sytosiini-guaniini) muuttuu. Jokainen SNP edustaa muutosta yhdessä emäsparissa. Esimerkiksi yksi SNP voi vaihtaa jossakin DNA-ketjun emäsparissa sytosiinin tymiiniksi. Se tarkoittaa, että sytosiini-guaniini -emäspari voi muuttua DNA-ketjusssa esimerkiksi tymiini-adeniini -pariksi. Toisin kuin geenimuunnokset, snipit eivät välttämättä sijaitse geeneissä. Snippejä sijaitsee myös ei-koodaavissa geeneissä tai geenien välissä. Ihmisen genomissa on paljon snippejä. Niitä on keskimäärin melkein joka tuhannen emäsparin jälkeen, mikä tarkoittaa, että ihmisen genomissa on arviolta 4-5 miljoonaa snippiä.

Snipit voivat olla hyödyllisiä, kun etsitään syövän geneettisiä riskitekijöitä. Biolääketieteellisessä tutkimuksessa snippejä käytetään tutkimusaineistossa vertailemalla genomialueita sairastuneiden ja terveiden välillä.

“Kun snipit ilmaantuvat geenissä tai regulatiivisella alueella lähellä geeniä, niillä voi olla suora rooli taudin syntymiseen, koska ne vaikuttavat geenin toimintaan. Meillä on uudenlainen koneoppimisen lähestymistapa, jolla voidaan tunnistaa joukko vuorovaikuttavia snippejä, jotka ovat eniten osallisina rintasyövän riskitekijöissä”, sanoo tutkija Hamid Behravan Itä-Suomen yliopistosta. Hän työskentelee Kuopiossa Kliinisen lääketieteen yksikössä.

”Olemme julkaisseet useita tuloksia siitä, miten geneettinen osatekijä rintasyövän riskissä tunnistetaan, jolloin erotettaisiin luotettavasti sairastapaukset terveiden vertailuryhmästä. Rintasyöpään liittyvien snippien tunnistaminen on erityisen hyödyllistä, koska rintasyövän ennustettavuutta voidaan parantaa ja kehittää yksilöllisiä hoitosuunnitelmia”, sanoo Behravan.

Standardeilla hypoteesien testausmenetelmillä on mitattu ainoastaan yhden snipin yhteyttä tautiin. Kuitenkin Itä-Suomen yliopiston tutkimukset ovat osoittaneet, että rintasyövän riskitekijät voidaan ennustaa paremmin kun snippejä tarkastellaan ryhminä, jotka itse asiassa vuorovaikuttavat toistensa kanssa.

Genominlaajuisten assosiaatiotutkimusten (GWAS) idea on tunnistaa snipit DNA:ssa. Se auttaa selvittämään geneettiset osatekijät tutkittavassa fenotyypissä joukossa genotyypitettyjä ihmisiä. Genotyypityksessä luetaan vain ne tiedossa olevat kohdat kromosomeissa, joissa esiintyy tutkittavaan tautiin liittyviä geenivariantteja.

”Genominlaajuiset assosiaatiotutkimukset mittaavat yksittäisen snipin yhteyttä sairauteen, mutta jättävät huomioimatta mahdollisen korrelaation snippien välillä”, sanoo Behravan.

”Tähän päivään asti koko populaation kattavat GWAS-tutkimukset ovat usein käyttäneet ns. PRS- pisteytystä (polygenic risk scoring, PRS), joka kerää yhteen riskialleelien (geenien vaihtoehtoiset muodot) vaikutukset tautiin. Kuitenkin PRS olettaa, että tauteihin liittyvät snipit ovat riippumattomia toisistaan ja että riskivaikutukset ovat lineaarisia ja yhteenlaskettavissa. Olemme osoittaneet, että sen sijaan, että arvioisimme yksittäisiä osatekijöitä (snipit) yksi kerrallaan, olisi erityisen hyödyllistä parantaa rintasyöpäriskin ennustettavuutta tutkimalla vuorovaikuttavien snippien ryhmää käyttäen koneoppimista.”

Tutkijat ovat löytäneet yli miljoona snippiä (single nucleotide polymorphisms) populaatioissa kaikkialla maailmassa. Kaikkein yleisimmin nämä variaatiot löytyvät DNA:sta geenien välistä. Nämä variaatiot voivat olla ainutlaatuisia tai esiintyä monella yksilöllä. Kuva perustuu David Ecclesin SNP-malliin.

Snipit, joilla on todellista biologista merkitystä, löydettiin koneoppimisen avulla

Itä-Suomen yliopistossa kehitetty koneoppimisen menetelmä on osoittautunut tehokkaaksi.

“Löysimme ryhmän vuorovaikuttavia snippejä, joilla on todellista biologista merkitystä. Tunnistettujen snippien biologinen analyysi paljasti geenejä, jotka liittyivät tärkeisiin rintasyöpään viittaaviin mekanismeihin, kuten estrogeeniaineenvaihduntaan ja ohjelmoituun solukuolemaan, apoptosikseen.”

Kohonneet estrogeenitasot liittyvät vaihdevuosien jälkeen kasvaneeseen rintasyövän riskiin. On myös vahva näyttö, että kasvaimen kasvu ei johdu pelkästään rajoittamattomasta leviämisestä vaan myös pienentyneestä solukuolemasta.

”Löysimme siis menetelmämme avulla geenit noiden tunnistettujen snippien taustalta. Laadimme näistä geeneistä interaktiivisia karttoja. Sitten tarkkailimme useita erilaisia rintasyöpään liittyviä geenien vuorovaikutusverkostoja, kuten estrogeeniaineenvaihduntaa ja ohjelmoidun solukuoleman verkostoja. Meidän systeemimme ei ainoastaan löytänyt mahdollisimman hyvin vuorovaikuttavia rintasyövän riskejä ennustavia snippejä, vaan se myös tunnisti ne snipit, jotka muodostivat merkittävän määrän tärkeitä biologisia rintasyövän osa-alueita. Näin ollen, vuorovaikuttavat snipit ilmaisevat myös ne snipit, jotka ovat mukana syöpään liittyvissä biologisissa verkostoissa.”

125 000 snipin genotyypitys tehtiin iCOGS-sirulla yteistyössä BCAC:n (Breast Cancer Association Consortium) kanssa.   iCOGS on genotyypittävä siru, joka on suunniteltu testaamaan kolmea hormoniperäistä syöpää: rinta,-munasarja,- ja eturauhassyöpiä. Sirulla on genotyypitetty yli 250 000 yksilöä ja snippiä yli 50 eri alueelta, joissa tiedetään lymyilevän joidenkin näiden tautien epäilyttäviä variantteja.

Kone oppii etsimään geneettisiä variaatioita

Kuopiossa kehitetty koneoppimisen lähestymistapa perustuu gradienttipuun tehostamismenetelmälle, jossa on iteratiivinen hakualgoritmi. Tehostaminen on ensimmäinen moduuli ja haku toinen.

Tehostaminen (boosting) on algoritmi ja metodi, jolla heikot oppijat muutetaan vahvoiksi. Heikolla luokittelijalla tarkoitetaan sellaista luokittelijaa, joka on vähintään puolessa tapauksista oikeassa. Algoritmi käynnistyy opettamalla päätöspuuta. Heikot luokittelijat lisätään peräkkäisesti korjaamaan olemassaolevien luokittelijoiden virheet, jotta rakennetaan vahvaa luokittelija.

”Ensimmäinen moduuli arvioi tunnusmerkkien tarkkuutta, tässä tapauksessa snippejä, rintasyövän ennustettavuudessa. Ensimmäinen moduuli antaa alustavan kandidaattilistan snipeistä, jotka voivat ennustaa rintasyöpäriskistä.”

Toinen moduuli sitten käyttää kandidaattisnippejä adaptiivisessä ja iteratiivisessa haussa, jotta se voisi kaapata nuo vuorovaikuttavat piirteet. Parhaimmat tunnistetut vuorovaikuttavat snipit käytetään ennustamaan tuntemattoman yksilön rintasyövän riskiä testivaiheessa käyttäen koneluokittelijaa. Luokittelija opetettiin erottamaan rintasyöpätapaukset (positiiviset näytteet) terveistä kontrolleista (negatiiviset näytteet).

Koska syöpä on monitekijäinen tauti, jonka aiheuttavat elintavat sekä geneettiset ja ympäristötekijät, geneettisiin variantteihin perustuva ykslöllinen analyysi ei ehkä ole riittävä, jotta saataisiin kokonaisvaltainen kuva tautiriskistä. Behravanin mukaan myös muita datalähteitä tarvitaan.

“Kehitämme integroivia koneoppimisen lähestymistapoja, jossa yhdistetään eri datalähteitä, kuten väestötieteellistä dataa.”

 

Ari Turunen

18.5.2020

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Hamid Behravan, & Tommi Nyrönen. (2020). Searching markers for breast cancer by machine learning. https://doi.org/10.5281/zenodo.8131311

 

Lisätietoja:

Lääketieteen laitos, Itä-Suomen yliopisto

https://www.uef.fi/fi/web/laake

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

Metabolomiikka mittaa ja analysoi sairauden, ruokavalion tai lääkityksen aiheuttamia muutoksia aineenvaihdunnassa

Aineenvaihdunnan eli metabolian aikana syntyy ja hajoaa molekyylejä, joilla osalla on vaikutus myös terveyteen. Niiden pitoisuuksia mitataan verestä, virtsasta ja kudosnäytteistä. Metabolomiikan avulla saadaan selville biomarkkereita, jotka voivat kertoa elintavoista, ruokavaliosta, sairauksista sekä lääkityksen ja muiden vierasaineiden vaikutuksista.

 

Yhdellä mittauksella saadaan tietoa sadoista, jopa tuhansista aineenvaihduntatuotteista eli metaboliiteista. Lisäksi samassa mittauksessa näkyvät myös elimistön ulkopuolelta tulleet yhdisteet kuten lääkkeet, ympäristömyrkyt ja nautintoaineet.

”Metabolomiikka mahdollistaa aineenvaihdunnallisten ilmiöiden laaja-alaisen tarkastelun. Näin saadaan erittäin laaja kuva esimerkiksi elimistön biokemiallisesta tilasta,” sanoo professori Seppo Auriola Itä-Suomen yliopiston farmasian laitokselta. Auriola on myös Kuopion LC-MS Metabolomiikkakeskuksen johtaja. Keskus on osa Suomen Biokeskuksen infrastruktuuriverkostoa.

Yksi metabolomiikassa käytetty analyyttinen työkalu on nestekromatografia yhdistettynä korkean erotuskyvyn massaspektrometriaan. Nestekromatografia-massaspektrometriaa (LC-MS) käytetään näytteistä löytyvien yhdisteiden seulomiseen ja tunnistamiseen. Nestekromatografi erottelee yhdisteet niiden rasvaliukoisuuden mukaan ja massaspektrometrilla mitataan eroteltujen yhdisteiden tarkat molekyylipainot. Metabolomiikassa käytetään termiä ”molekyyliluonne”, joka tarkoittaa ionisaatiossa ja mittauksessa yhdisteestä syntyvää signaalia.

”Metabolomiikassa pyrimme löytämään tilastollisesti eroavat molekyyliluonteet eri tutkimusryhmien välillä. Näitä voivat olla esimerkiksi sairaat versus terveet. Metabolomiikka pyrkii myös tunnistamaan nämä molekyyliluonteet molekyyleiksi erilaisten spektroskopiaan perustuvien tekniikoiden avulla. Meidän laboratoriomme hyödyntää tähän massaspektrometriaa,” sanoo laboratorionjohtaja Marko Lehtonen.

Metabolomiikkamittaukset voidaan jakaa kohdentamattomiin ja kohdennettuihin menetelmiin. Lähtökohta kohdentamattomassa analyysissä on se, että tutkittavasta näytteestä pyritään löytämään mahdollisimman laaja joukko metaboliitteja. Kohdennetussa analyysissä puolestaan seurataan rajattua joukkoa tunnettuja metaboliitteja.

Kohdentamattomat mittaukset voivat toimia hyvänä lähtökohtana hypoteesin luomiseen.

”Ensimmäisellä seulonnalla nähdään niitä aineenvaihduntatuotteita, jotka ovat muuttuneet esimerkiksi tietyn altistuksen jälkeen. Sitten mietitään teoriaa eli miksi näin on käynyt”, sanoo Auriola, joka on keskittynyt työssään analyyttiseen kemiaan ja tutkittavien näytteiden mittaustekniikkaan.

 

Ruokavalio ja elintavat näkyvät aineenvaihduntatuotteissa

 

Metabolomiikan avulla voidaan tutkia ravintoaineiden vaikutuksia. Miksi jotkut ravintoaineet ovat välttämättömiä, mihin aineenvaihduntareaktioihin ne osallistuvat tai mitä reittejä ne rajoittavat.

 

Koska metabolomiikan mittausmenetelmät tehostuvat, saadaan parempaa mittausdataa esimerkiksi ihmisten elintapojen ja ympäristön vaikutuksesta terveyteen. Ruokavalio on yksi merkittävimmistä ulkoisista tekijöistä, jotka vaikuttavat aineenvaihduntaan.

”Metabolomiikka soveltuu erinomaisesti juuri ravitsemustutkimuksiin.

Analyyseissa löytyy selviä markkereita, mitä joku on syönyt ja miten ne vaikuttavat ihmisten endogeenisiin yhdisteisiin,” Auriola sanoo.

Endogeeniset aineita ovat kaikki kehon tuottamat yhdisteet, kuten hormonit ja välittäjäaineet. Niitä ovat esimerkiksi endokannabinoidit, steroidit sekä endorfiinit.

”Voimme tutkia, vaikuttaako elintapojen muuttaminen terveellisemmäksi myös metaboliittien tasoihin. Tämä olisi osoitus siitä, että elimistö voi paremmin. Metabolomiikan avulla voidaan myös etsiä sairauksien biomarkkereita varhaisessa vaiheessa ennen sairauksien puhkeamista. ”

 

Vierasaineiden vaikutukset ihmiseen

 

Sairauden, ruokavalion tai lääkityksen aiheuttamia muutoksia aineenvaihdunnassa voidaan seurata ja ymmärtää Mittauksista saadaan biologisen näytteen metaboliittipitoisuudet Pitoisuuksia ja niiden muutoksia analysoimalla saadaan selville esimerkiksi vierasaineen vaikutus elimistössä.

 

Toinen merkittävä metabolomiikan analyysikohde ovat eksogeeniset eli elimistön ulkopuoliset yhdisteet, kuten lääkkeet ja ympäristömyrkyt. Tällöin etsitään biomarkkereita esimerkiksi siitä, miten lääke vaikuttaa elimistössä.

Tärkeä kysymys on Auriolan mielestä myös se, miksi joku aine vaikuttaa meihin negatiivisesti. Silloin voidaan etsiä aineenvaihduntatuotteista sellaisia biomarkkereita, jotka osoittavat ihmisen altistumista vierasaineelle tai vierasaineen vaikutusta ihmiseen. Sellaisia on esimerkiksi torjunta-aineiden vaikutus ihmisten terveyteen.

”Torjunta-aineiden kaikkia vaikutusmekanismeja ei tiedetä.

Kun menetelmät kehittyvät, nähdään paremmin minkälaisia vaikutuksia on elimistössä tiettyjen altistusten yhteydessä. Voidaan mitata ihmispopulaatioista, mikä on ympäristömyrkkyjen taso ja vastaavasti endogeenisten metaboliittien taso. ”

Itä-Suomen yliopiston ja Karolinska Instituten tutkimuksessa selvitettiin polykloorattujen bifenyylien eli PCB-yhdisteiden vaikutusta hiirten jälkeläisiin. Pitkään on tiedetty, että suurin näiden aineiden vaikutus kohdistuu kehittyvään elimistöön. Eläinkokeissa on todettu eri elinten kehityshäiriöitä. Kun jälkeläisten metabolomiikkaprofiileja tutkittiin, huomattiin, että tiettyjä muutoksia havaittiin koirailla. Nämä muutokset kuitenkin puuttuivat naarailla. PCB -yhdisteiden aiheuttamat metaboliittien muutokset koirailla vaikuttivat maksan ja hermoston toimintaan.

”Voidaan seurata minkälaisia muutoksia seuraavassa sukupolvessa on, tietämättä etukäteen, mitä sieltä pitäisi etsiä, sanoo Auriola.

”LC-MS -laitteistojen ja kohdentamattoman metabolomiikka -menetelmän avulla löydetään tuhansien mitattavien molekyylien joukosta ne molekyylit, jotka ovat muuttuneet.”

Molekyyliluonteita etsitään algoritmien avulla. Helsingin ja Itä-Suomen yliopiston tutkimuksessa analysoitiin vastasyntyneiden napanuorista löytyneitä yhdisteitä. Raskausmyrkytys (pre-eklampsia) on yksi yleisimmistä äitiyskuoleman ja ennenaikaisen synnytyksen syistä. Sen kehittymisen syitä ei tunneta tarkasti. Sen tiedetään lisäävän äidin ja lapsen riskiä sairastua myöhemmin sydän- ja verisuonitauteihin. Ei kuitenkaan tiedetä miten myrkytyksen saaneiden äitien muuttunut aineenvaihdunta vaikuttaa vastasyntyneiden aineenvaihduntaan. Vastasyntyneiden napanuoran kudoksen metaboliitit analysoitiin LC-MS -laitteistolla Kuopiossa raskausmyrkytyksen saaneiden ja terveiden välillä. Tutkimuksessa käytettiin myös suomalaisia FINNPEC (Finnish Genetics of Pre-eclampsia Consortium) -aineistoja. FINNPEC -kohortin keräämiseen ovat osallistuneet kaikki Suomen yliopistosairaalat.

”Useat eri tutkimusprojektit käyttävät laboratoriomme palveluja”, sanoo  Marko Lehtonen. Laboratoriossa on mitattu esimerkiksi diabeteksen ja Alzheimerin tautiin liittyvien tutkimuksen näytteitä. Lehtosen mukaan metabolomiikka tuo paljon lisätietoa myös harvinaisten ja perinnöllisten sairauksien tutkimukseen.

”Vastasyntyneiden seulontaa tehdään kohdennetuilla mittauksilla. Se on myös erinomainen esimerkki, jossa metabolomiikalla voi olla suuri merkitys. Siinä yhteiskunta säästää rahaa. Tietyillä elimistössä esiintyvillä biomarkkereilla voidaan löytää vastasyntyneillä perinnöllisiä sairauksia,” sanoo Lehtonen.

 

 

Kaikkia molekyylejä ei havaita vielä

 

Nykyisillä laitteilla ei kaikkia metaboliitteja voi vielä mitata.

”Yhdisteet ovat näytteessä niin pieninä pitoisuuksina, että nykyisin tarvitaan myös kohdennettuja menetelmiä. Laitetekniikoiden kehittyessä voidaan tulevaisuudessa toivoa, että yhä useamman aiemmin näkemättä jääneet yhdisteet näkyvät myös kohdentamattomilla menetelmillä. Tällöin emme hävitä muuta tietoa näytteestä. Kohdennetut menetelmät nimittäin seuraavat vain ennalta rajattua joukkoa yhdisteitä ja ovat sokeita kaikelle muulle tiedolle”, sanoo Lehtonen ja korostaa, että kohdentamattoman menetelmän data sisältää paljon tietoa, josta voidaan aina etsiä uusi asioita.

Kun laitteiden herkkyydet parantuvat, päästään havainnoimaan todella pieniä molekyylejä. Silloin puhutaan pikogrammoista ja nanogrammoista litraa kohden. Yksi pikogramma on gramman triljoonasosa ja yksi nanogramma on gramman miljardisosa.

”Nyt näemme tuhansia molekyylejä, mutta monia tärkeitä molekyylejä on vielä havaintorajan alapuolella, sanoo Seppo Auriola.

”Esimerkiksi steroideja löydetään näytteistä entistä enemmän mittaustekniikan kehittyessä. Näin voidaan tutkia endogeenisia steroideja ja niiden muutoksia.”

Näitä ovat esimerkiksi sukupuolihormonit, kuten testosteroni ja progesteroni sekä kortikosteroidit (mm. kortisoni ja kortisoli).

”Olemme mukana muun muassa projektissa, jossa tutkitaan lasten ja nuorten liikunnan ja elintapojen vaikutusta steroideihin ja muuhun metaboliaan. Toisissa tutkimuksissa etsitään steroidimetaboliaan valikoivasti vaikuttavia yhdisteitä, joita voitaisiin käyttää lääkkeenä.”

 

Laskentatehoa tarvitaan suuren datamäärän käsittelyyn

 

Massaspektrometriassa tutkittavat aineenvaihduntatuotteet ensin ionisoidaan. Ionisoituneet molekyylit erotellaan toisistaan niiden massan ja varauksen suhdeluvun avulla. Molekyyliluonteiden tunnistaminen on Lehtosen mukaan metabolomiikan viimeinen vaihe, jossa pyritään aukottomasti tunnistamaan tilastollisesti merkittävästi eroava metaboliitti kahden tai useamman tutkittavan ryhmän välillä.

Lehtonen haluaisi mallin, jossa laboratorion ja tutkimusten data olisi koneoppimisen pohjana.

”Vaikka näitä spektrejä voidaan vertailla massakirjastoissa oleviin pilkkoutumisspektreihin (tuoteionipyyhkäisyihin), niin ongelma tunnistamisessa on, että se on hyvin pitkälle manuaalista työtä. Jos siihen saisi oppivan algoritmin, joka etsii automaattisesti pilkkoutumisspektrejä ja vertaa niitä kirjaston muistissa olevaan eli malli voisi aukottomasti tunnistaa laboratorion aiempien mittausten tunnistamat yhdisteet. Se auttaisi tutkimustyössä paljonkin,” sanoo Marko Lehtonen.

Endogeeninen kannabinoidijärjestelmä liittyy moniin fysiologisiin ja patologisiin tiloihin. Jotta voisi paremmin ymmärtää etanolin ja ravinnonpuutteen vaikutusta sukkulamatoihin (C. elegans), tutkimuksessa seurattiin miten metaboliittiprofiili ja tietyt endokannabinoiditasot muuttuivat erilaisissa altistuksissa. Ravinnonpuute merkittävästi lisäsi mm. anandamidin, joka on yksi pääendokannabinoideista, määrää. Kuvassa on esimerkkinä käänteisfaasikromatografialla ja korkean erotuskyvyn massaspektrometrialla saadut tulokset. Hajontakuvio (volcano plot) näyttää tilastollisen merkittävyyden (p- value) verrattuna muutoksen suuruuteen (fold change). Toisessa akselissa ovat p-arvot t-testistä ja toisessa signaalitasojen muutokset tutkittavien ryhmien välillä. Yhdellä tällaisella kuvalla voidaan nähdä kahden eri tutkittavan ryhmän väliset tulokset.

 

Työkalujen ja datan yhdenmukaistaminen

 

Seppo Auriolan mielestä mittausdataa pitäisi pystyä hyödyntämään entistä enemmän. Ongelmana on datan saatavuus ja yhdenmukaisuus.

”ELIXIRissä on menossa useita toimintoja joissa pyritään yhdenmukaistamaan eri työkalujen käyttöä metabolomiikassa, jotta ne toimisivat hyvin yhteen keskenään. Myös mittausdata pyritään saamaan arkistoihin.”

Auriolan mielestä tieteellisen julkaisun lisäksi suuri osa alkuperäisestä mittausdatasta pitäisi olla muiden tutkijoiden käytössä jatkoanalyyseihin.

”Sen toinen vaihe on, mitä metadataa lisätään, minkälaista tietoa näytteistä pitää olla, kuinka ne on mitattu, kuinka valmistettu, minkälaiset tutkimusryhmät ovat olleet kyseessä. Kuinka tämä tieto kulkee mittausdatan mukana? Olennaista olisi, että kerralla suurella työllä mitattu data olisi vielä käytössä myöhempiin analyyseihin ja vertailuihin.”

Toinen haaste on käytössä olevat työkalut: kuinka poimitaan yhdisteitä ja kuinka niitä tunnistetaan, mitä ohjelmistoja tarvitaan kun lasketaan tuloksia, etsitään molekyylejä ja vertaillaan niiden määriä eri näytteissä. Kuinka asiat esitetään? Kuinka muutokset eri metaboliittien tasossa saadaan, kuinka ne löydetään metaboliittikartalta, missä metaboliareiteillä yhdisteet ovat ja mitenkä niiden pitoisuudet keskenään vaihtuvat? Miten tämä kuvataan selkeästi ja miten se tulos esitetään? Kaiken tämän yhdenmukaistamiseen tarvitaan työtä. Nyt tämä kaikki data ja työkalut on pieninä palasina eri ihmisten ohjelmistoissa.” sanoo Auriola.

Ari Turunen

8.4.2020

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Seppo Auriola, Marko Lehtonen, & Tommi Nyrönen. (2020). Metabolomics measures and analyses metabolic changes caused by illness, diet or medication. https://doi.org/10.5281/zenodo.8131264

Lisätietoja

 

LC-MS Metabolomiikkakeskus

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

Syväoppimisalgoritmit auttavat rintasyövän seulonnassa

Tutkija Raju Gudhe on keskittynyt yhdistämään tietojenkäsittelytieteen älykkäisiin järjestelmiin. Hän kehittää syväoppimisalgoritmeja rintasyövän riskien analysoimiseen käyttämällä radiologista ja kliinistä dataa. Näitä algoritmeja on opetettu hyödyntämään massiivisia datajoukkoja, joita on saatu Kuopion yliopistollisesta sairaalasta, jotta ne ennustaisivat rintojen tiheyden mammografiakuvista.

 

”Yritämme paikallistaa kiinnostavia alueita mammografiakuvista ja luokitella kasvaintyypin saatujen tunnusmerkkien perusteella käyttämällä syväoppismisalgoritmeja, sanoo Gudhe, joka työskentelee data-analyytikkona Itä-Suomen yliopiston kliinisen lääketieteen yksikössä Kuopiossa.

Mammografia eli rintojen röntgenkuvantamistekniikka, on yksi yleisimmin käytettyjä menetelmiä varhaisen asteen rintasyövän havaitsemiseksi. Varhainen rintasyövän havaitseminen alentaa merkittäväsi kuolleisuuslukuja. Vuonna 1987 Suomi aloitti ensimmäisenä maana maailmassa maanlaajuisen syöpäseulontaohjelman. Silti mammografia ei ole täydellinen. Mammografiakuvat eivät ole erityisen tarkkoja eivätkä aina havaitse syöpätapauksia ja kuvat voivat näyttäytyä normaaleina, vaikka syöpä olisikin kyseessä.

 

Täysin automaattinen malli arvioimaan rinnan tiheyttä

 

Rinnoissa on vaihtelevia määriä rasvakudosta ja tiivistä kudosta. Tiiviimpi kudos näyttää mammogrammeissa vaaleana röntgensäteiden vaimentumisen takia. Suurin osa rintasyövistä esiintyy tiiviissä kudoksessa, jonka vaaleus peittää alleen noin 25% mammogrammeista havaituista syöpätapauksista.

“Vaaleus voi naamioida syöpien läsnäolon: se on kuin löytäisi lumimiehen sakeassa lumipilvessä”, sanoo Gudhe.

Tiiviin kudoksen kuvioiden ja jakautumisen perusteella radiologit luokittelevat rinnat joko “tiheisiin” tai “rasvaisiin”. Naisilla, joilla on erittäin tiheää rintakudosta, on suurempi riski saada rintasyöpä.

Rintasyöpä sijaitsee yleensä tiheässä kudoksessa. Koska kudos näkyy vaaleana mammografiakuvissa, noin 25% syövistä ei näy mammografiassa. Kuvien vaaleus voi peittää syöpätapaukset.

Tutkijat Itä-Suomen yliopistossa ja Kuopion yliopistollisessa sairaalassa ovat kiinnostuneita kehittämään täysin automaattisen mallin arvioimaan rinnan tiheyttä. Rinnan tiiviys, yksi vahvimpia riskitekijöitä rintasyövässä, on mittaustulos tiiviin kudoksen suhteellisesta osuudesta. Tarkka tiiviin kudoksen segmentointi mammografiakuvassa voi vähentää väärien diagnoosien todennäköisyyttä.

Itä-Suomen yliopistossa kehitetyt algoritmit voivat auttaa radiologisteja arvioimaan rinnantiheyden tarkasti. Merkittävin haaste syväoppimisen malleja käytettäessä on massiivinen datan määrä, jota ne tarvitsevat. Lisäksi lääketieteessä hankittuihin kuviin liittyvät tarkat kuvailutiedot, annotaatiot, lisäävät datan kompleksisuutta.

“Käytämme tuhansia mammografiakuvia, jotka kokeneet radiologit ovat manuaalisesti annotoineet, jotta saataisiin luotua tarkat opetusjoukon luokittelut (ns. ground truth label) syväoppimisen malleihimme. Olemme kehittäneet uudenlaisen arkkitehtuurin, joka perustuu U-Net -malliin, huippuluokan ratkaisuun lääketieteellisten tiiviin kudoksen kuvien segmentoimiseen,” sanoo Gudhe.

Algoritmit voivat tunnistaa kasvaimen mammogrammeista. Rinnan tiheys on yksi yleisemmistä riskitekijöistä. Mitä tiheämpi rinta, sitä suurempi riski. Syväoppimisalgoritmit voivat auttaa radiologeja ennustamaan tarkasti rinnan tiheyden prosenttimäärän.

Koska mammografiakuvat ovat korkearesoluutioisia, suurta laskentatehoa tarvitaan niihin yhdistettyjen syväoppimisen mallien opettamiseen. Suomen ELIXIR -keskuksen CSC:n palveluja käytetään sensitiivisen datan tehokkaaseen käsittelyyn ja mallien opettamiseen CSC:n grafiikkaprosessoreja.

Raju Gudhe korostaa, että kestävän mallin tekemiseksi kliinisille toimenpiteille tutkijoiden täytyy integroida erilaisia kuvantamismuotoja ja muita kliinisiä yksityiskohtia algoritmeihinsa. Näitä ovat – mammografiakuvien lisäksi – ultraääni ja magneettiresonanssikuvantaminen. Seuraava askel on integroida kuvantamisdata ja genomidata syöpäriskin analysoimiseen.

“Mammografiakuvia käyttämällä voimme tunnistaa rinnan tiheyden ja tiheysarvojen perusteella voimme saada aikaan seuraavan kuvantamistavan. Emme voi nojata yhteen kuvien kuvantamistapaan, mikä on syynä, että tietoa ei voi käyttää suoraan kliinisessä työssä. Jotta saisimme päästä-päähän mallin, joka pystyy tekemään hyvän luokittelun ja ennusteen, tarvitsemme myös genomidataa.”

 

Ari Turunen

1.3.2020

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Tommi Nyrönen, & Raju Gudhe. (2020). Deep learning algorithms help in breast cancer screening. https://doi.org/10.5281/zenodo.8131233

Lisätietoja:

Lääketieteen laitos, Itä-Suomen yliopisto

https://www.uef.fi/fi/web/laake

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

Koira haistaa sairauksia

Metabolomiikka tutkii elimistön aineenvaihduntatuotteita, niiden rakennetta ja toimintaa soluissa, veressä ja eritteissä. Olennaista on selvittää aineenvaihduntatuotteiden eli metaboliittien merkitystä ja vaikutusta ihmisen hyvinvointiin ja terveyteen. Soile Rummukainen tutkii koirien ja ihmisten syöpiä metabolomiikan avulla. Tavoitteena on tunnistaa syövän hajun molekyylit.

 

Koirien hajuerottelukoulutukseen erikoistuneen Wise Nosen eli Suomen hajuerottelu ry:n toiminnanjohtaja Susanna Paavilainen huomasi, että hänen Kössi-koiransa haisteli toisesta koirasta tiettyä kohtaa sen iholla. Paavilainen huomasi, että jotain on vialla. Lopulta paljastui, että toisella koiralla oli iensyöpä. Paavilainen päätteli, että koulutettu koira voisi hajuaistinsa avulla havaita lajitovereiltaan syövän.

Syövän havaitseminen 100 prosentin tarkkuudella

Monitieteinen tutkimushanke käynnistyi Helsingin yliopiston eläinlääketieteellisen tiedekunnan, Wise Nosen, Aqsens Health Oy:n ja Itä-Suomen yliopiston välillä. Ensin koirat koulutettiin tunnistamaan koirien nisäsyövän merkkiaineita virtsanäytteistä. Testien mukaan hajukoirien tulokset olivat hyviä ja syöpäsairauksien havaitsemisaste oli lähes 100 prosenttia Nyt tätä menetelmää aletaan laajentaa miesten eturauhassyövän ja naisten rintasyövän havaitsemiseen.

Koirien hajuaisti on erinomainen. Keskikokoisella koiralla on jopa 220 miljoonaa hajureseptoria nenässään, kun ihmisellä on vain 5 miljoonaa. Koirat haistavat tuhansia kertoja paremmin kuin ihmiset. Orgaanisten aineiden tunnistamiseen käytettävä massaspektrometri tarvitsee yleensä noin kymmenen miljardia molekyyliä, ennen kuin mitään näkyy mittauksissa. Koira voi haistaa sairauden huomattavasti pienemmästä määrästä. Itä-Suomen yliopiston mittauksissa Kössi-koiralle riitti näyte, jossa oli vain kymmenen molekyyliä.

Koirien löytämät näytteet analysoidaan massaspektrometrilla

Aineenvaihduntatuotteet eli metaboliitit ovat yhdisteitä, joilla on pieni molekyylipaino ja jotka osallistuvat erilaisiin toimintoihin solujen aineenvaihdunnassa. Näitä pieniä molekyylejä ei voi nähdä eikä havaita suoraan, vaan tarvitaan mittalaitteita, kuten massaspektrometrejä, joiden tuottamia signaaleja analysoidaan.

Itä-Suomen yliopiston farmasian laitoksen nuorempi tutkija Soile Rummukainen tutkii Kuopiossa koirien haistamia ja löytämiä syöpänäytteitä massaspektrometrilla.

“Tarkastelemme näitä syöpänäytteitä ja kontrolliryhmän näytteitä käyttämällä ensin kohdentamattoman metabolomiikan menetelmää. Massaspektrometrin avulla näemme virtsanäytteiden aineenvaihduntatuotteista kymmeniä tuhansia molekyylipiirteitä. Tilastotieteen avulla vertailemme ryhmien välisiä eroja ja pyrimme tunnistamaan mielenkiintoisimmat metaboliitit eli ne, jotka eroavat ryhmien välillä.”

Massaspektrometrin ja nestekromatografian avulla näytteestä voidaan erottaa siinä olevat yhdisteet ja muodostaa niille kullekin massaspektri. Massaspektrin piikkien sijainnista (x-akseli) käy ilmi molekyyleistä muodostuneiden ionien massa ja piikkien korkeudesta (y-akseli) niiden suhteellinen runsaus. Molekyylin pilkkoutumistuotteista voidaan puolestaan päätellä molekyylin rakenne. Nestekromatografia (LC) yhdistettynä massaspektrometriaan (MS) on tehokas analyysitekniikka metaboliittien määritykseen. LC-MS -menetelmiä käytetään paljon lääketutkimuksessa sekä kliinisessä diagnostiikassa.

Metaboliittien tunnistaminen haastavaa

Rummukaisen mukaan metabolomiikassa molekyylien tunnistaminen on haastava osa-alue. On pystyttävä tunnistamaan pilkkoutumisspektriä vastaava molekyylirakenne. Pilkeioneja verrataan maailmanlaajuisiin tietokantoihin ja niiden spektrikirjastojen kokoelmiin sekä omiin standardeihin.

”Oma standardi-kirjastomme on täällä yliopiston laitteilla analysoitujen standardien kokoelma. Niiden avulla saamme tarkimman tunnistuksen metaboliiteille, koska ne on analysoitu samalla menetelmällä ja antavat myös tunnistukselle tärkeän retentioaikatiedon. Oma kirjastomme on kuitenkin kooltaan rajallinen, joten työssä on käytettävä myös muita tietokantoja.”

Retentioaika tarkoittaa aikaa, joka yhdisteeltä kuluu kulkiessa kromatografialaitteiston läpi detektorille.

”Biologisessa näytteessä voi olla on tuhansia aineenvaihduntatuotteita. Kun näyte analysoidaan massaspektrometrilla, saadaan dataa, joka antaa kymmeniä tuhansia molekyylipiirteitä. Nämä piirteet täytyy sitten yhdistää molekyyleiksi. Tarkan massan, pilkkoutumisspektrien ja retentioajan avulla näytteestä saadaan tunnistettua keskimäärin sadasta kahteensataan metaboliittia, mikä on aika pieni määrä.”

 

Massaspektrometrin mittausdataa. Yläkuvassa näkyvät kaikki ionisoituneet eli ioneiksi muodostuneet yhdisteet per ajanhetki (total ion chromatogram). Itse kuvasta ei voi erottaa tutkimukselle merkittyvä ja informaatioita sisältäviä ioneita muista ioneista ennen datan käsittelyä. Raakadata muutetaan ohjelmistojen avulla datamatriisiksi. Tutkijat puhuvat piikin poiminnasta. Vasta piikkien poiminnan, data-analyysin ja tilastollisten käsittelyjen jälkeen saadaan on tieto, mitkä yhdisteet ovat tärkeitä eli tässä tapauksessa ne, jotka eroavat syöpänäytteissä ja vertailunäytteissä. Alempi kuva on yhdestä ajanhetkestä (retentioaika 4.03min,), jossa näkyy, minkä massaisia ioneita täsmälleen tuossa ajassa spektrometri on havainnut. Datamatriisi sisältää yhdistetyn retentioaika- ja ionin massatiedon sekä tämän molekyylipiirteen ionin määrän (abundance tai area). Kun mielenkiintoisimmat yhdisteet on datasta löydetty, ne löytyvät myös näistä kuvaajista ohjelmiston avulla. Lisäksi tarvitaan yhdisteiden pilkkoutumisspektrit, joita käytetään yhdisteiden tunnistamiseen.

Koirat tulevat nyt taas avuksi. Seuraavaksi tehdään fraktiointeja eli näytteistä otetaan osanäytteitä. Sitten käydään uudestaan testaamassa koirilla, onko haju vieläkin osanäytteissä.

Suurin työ on Rummukaisen mukaan fraktioiden tekemisessä ja analysoinnissa.

”Jatkossa tutkimme näitä osanäytteitä ja analysoimme tarkemmin niiden sisältämiä yhdisteitä käyttäen massaspektrometrisiä menetelmiä ja ydinmagneettista resonanssispektroskopiaa (NMR). Tavoitteenamme on hajukoirien ja koirien nisäsyöpänäytteiden avulla kehittää menetelmä, jota hyödynnetään myös ihmisten syöpään liittyvien metaboliittien määrittämiseen.”

Koiria koulutetaan tällä hetkellä haistamaan eturauhassyöpää ja rintasyöpää. Myös datan käsittely on tärkeää. Massaspektrometrin raakadatan käsittely tarvitsee paljon laskentakapasiteettia ja levytilaa.

”Yksittäinen metaboliitti voi liittyä kymmeniin solunsisäisiin signaalireitteihin. Tässä tarvittaisiin avuksi tietokonesimulointia, jotta löydettyjen muutosten biologinen merkitys avautuisi paremmin. Myös genomiikan ja proteomiikan antaman tiedon yhdistäminen metabolomiikkaan olisi mielenkiintoista, kunhan tarvittavat ohjelmistot ja työkalut tulevaisuudessa kehittyvät. ”

 

Ari Turunen

6.2.2020

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, Soile Rummukainen, & Tommi Nyrönen. (2020). A dog can smell diseases. https://doi.org/10.5281/zenodo.8131208

 

Lisätietoja:

 

LC-MS Metabolomiikkakeskus, Itä-Suomen yliopisto

http://www.uef.fi/fi/web/metabolomics-center

 

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org