Tutkijat voivat siirtää laskentansa Googlen Colabista CSC:n ympäristöön uuden sovelluksen avulla. Samanlaista menettelytapaa voidaan soveltaa, jos halutaan vaihtaa yhdestä superlaskentaympäristöstä toiseen.
CSC – Tieteen tietotekniikan keskuksen sovellusasiantuntija Laxmana Yetukuri ja Turun biotiedekeskuksen erikoistutkija Michael Courtney ovat kustomoineet grafiikkaprosessoreilla varustettujen kannettavien tietokoneiden liittämisen CSC:n superlaskentaympäristöön, jotta niitä voidaan käyttää syväoppimisen mallien luomiseen biologisesta kuvantamisdatasta. Kannettavat laitteet on kehitetty Turun biotiedekeskuksen ryhmässä. Tarjolla on myös avoimen lähdekoodin työkalupakki ImageJ/Fiji syväoppimisen mallien luomiseen mikroskopiassa. Sen käyttöä tutkitaan CSC:ssä, ELIXIR-infrastruktuurin Suomen noodissa.
Turun biotiedekeskuksessa on käytetty Googlen Colab Notebook -pilvipalvelua, jonka kautta voi analysoida ja visualisoida dataa. Laajan skaalan data-intensiivinen tutkimus kohtaa kuitenkin rajoitteita, kun käytetään Googlen maksuttomia palveluja. Tutkijat tarvitsevat huomattavasti peruskäyttäjää enemmän tallennus- ja laskentakapasiteettia datankäsittelyyn. CSC:n superlaskentaympäristö tarjoaa akateemisille käyttäjille ylivertaisen maksuttoman tallennus- ja laskentakapasiteetin, ja nyt Google Colab-ympäristön voi vaihtaa CSC:n laskentapalveluun. Henkilökohtaisella tietokoneella pääsee helposti CSC:n laskentaympäristöön web-selaimen avulla, kiitos käyttäjäystävällisen käyttöliittymän.
Tutkijat voivat siirtää laskentansa Googlen Colabista CSC:n ympäristöön käyttämällä sisäisesti kehitettyä konttitekniikkaa. Sovellusten kontittamisen (container wrapper) avulla tutkijat saavat määrittää vakioidun ympäristön, jossa he voivat ajaa tieteellisiä ohjelmistojaan. Ohjelman koodi kirjastoineen ja asetuksineen asetetaan konttiin. Kun ohjelmistot ja data on paketoitu kontissa omaan wrapper-työkaluun, seuraavat käyttäjät voivat aloittaa sovelluksen käytön ilman esiasennuksia. Samanlaista menettelytapaa voidaan soveltaa, jos halutaan vaihtaa yhdestä superlaskentaympäristöstä toiseen.
”Teemme tutkijoiden työn helpommaksi. Meillä on helpot ohjeet sovelluksen asentamiseen kustomoituihin tietokoneisiin. Kun projektin jäsen asentaa sovelluksen, muiden tutkijoiden ei tarvitse asentaa mitään ohjelmistoja käyttääkseen näitä kustomoituja koneita, vaan he voivat heti aloittaa työskentelyn. CSC:n laskentaympäristöön pääsee käyttöliittymän (www.puhti.csc.fi) avulla muutamalla klikkauksella”, sanoo Yetukuri.
”Biologinen kuva-analyysi tarvitsee laajempaa levytilaa tallentamiseen. CSC:n ALLAS tarjoaa hyvän tallennusympäristön. Laskentaympäristöön pääsee, kun on saanut käyttäjätunnuksen CSC:ltä”, Yetukuri jatkaa.
Biologinen kuvantaminen ja kuvien data-analyysi hyödyntää algoritmeja, joiden avulla saadaan kuvista merkittävä määrä lisää informaatiota. Informaatiota voidaan käyttää hahmontunnistukseen ja kuvadatan luokitteluun, jolloin saadaan biologisesti merkittävää informaatiota. Tässä käyttötapauksessa Yetukurin ja Courtneyn tarkoitus on kehittää koneoppimisen malleja aivohäiriöitä aiheuttavien SynGAP1-geenivarianttien tunnistamiseen sekä tulevaisuudessa lääkeseulontaan.
Courtney, tutkijatohtori Li-li Li ja heidän kollegansa selvittävät Turun biotiedekeskuksessa SynGAP1-proteiinien tautia aiheuttavia variantteja. SynGAP1-geeni sijaitsee kuudennessa kromosomissa ja tuottaa SynGAP-proteiinia. Proteiini säätelee synapseja, joiden kautta hermosolut kommunikoivat toistensa kanssa. SynGAP1-geenin variantti aiheuttaa sen, ettei SynGAP-proteiinia muodostu riittävästi. Tämä johtaa siihen, että hermosolujen välinen viestintä vaikeutuu. Tämä puolestaan johtaa monin neurologisiin sairauksiin. Normaaliin aivojen kehittymiseen tarvitaan kaksi virheetöntä geeniä, jotka koodaavat SynGAP1-proteiinia. Mutaatiot voivat johtaa siihen, että toinen geeni ei ilmenny, jolloin tulee kehitysviiveitä.
SynGAP1-enkefalopatia on varhain ilmenevä älyllinen kehitysvamma. Sairaudenkuvalle ominainen kehitysviive havaitaan pääsääntöisesti ensimmäisen tai toisen ikävuoden aikana. Lisäksi noin kahdeksalla enkefalopatia-potilaalla kymmenestä todetaan epilepsia. Epilepsian oirekuva vaihtelee yksilöllisesti, ja se voi olla vaikeahoitoinen. Käyttäytymishäiriöitä ja autismia ilmenee puolella potilaista.
Turun biotiedetiedekeskuksen mikroskopian seulontayksikössä analysoidaan normaaleja SynGAP1-geenejä sekä pistemutaatioita, jotka voivat aiheuttaa proteiinin toiminnan heikentymistä, joissain tapauksissa lähes olemattomalle tasolle. Pistemutaatiot muuttavat vain yhden aminohapon proteiinissa, mutta se mitä tästä seuraa, vaatii lisäselvyyttä.
SynGAP1-proteiini esiintyy vain hermosoluissa. Korkean suoritustehon mikroskoopilla voidaan tarkastella samanaikaisesti 384 elävän hermosolun verkkoa ajan myötä. Hermosoluissa SynGAP1 merkitään fluoresentilla proteiinin tunnisteella, joka voidaan havaita virittyneellä valolla. Jokaisessa hermoverkossa normaali SynGAP1 tai erilainen sairautta aiheuttava muoto voidaan tutkia. Kuvien perusteella voidaan havainnoida poikkeavuuksia proteiinien toiminnassa.
Mikroskooppi tekee automaattisen kuvakaappauksen ja voi ottaa näytteitä hermoverkoista 20 sekunnin välein. Kun tutkitaan proteiinin eri variantteja, voidaan verrata, onko sen toiminta normaalia, tehostunutta tai kokonaan lakannut. Tehostunut tai lakannut toiminta voi johtaa sairauteen.
”Olemme pystyneet tekemään koe- ja analyysijärjestelyitä, jotka selvittävät tavallisuudesta poikkeavia vaurioituneen SynGAP1:n toimintoja. Tämä mahdollisesti tarjoaa tulevaisuudessa väylän lääkeaineseulontaan. On myös sairastuneista potilaista löydettyjä geenivariantteja, mutta ei tiedetä, miten tai ovatko ne ylipäätään aiheuttaneet sairauden. Menetelmämme avulla voimme havaita, onko näillä geenivarianteilla samanlainen puutteellinen toiminto kuin tiedetyillä sairautta aiheuttavilla varianteilla”, sanoo Michael Courtney.
Kun näytteiden valmisteluun liittyvät vaatimukset olivat täyttyneet, olennainen askel oli kehittää syväoppimisen malli, joka automatisoi SynGAP1-pisteiden (puncta) tunnistamisen. Ne ovat yleensä synapseissa. Pisteet ovat erillisiä kuva-alueita, joissa fluoresentti tunniste on näkyvissä.
”Kun nämä on tunnistettu, niiden lukumäärä ja noin 25 ominaisuutta jokaisesta alueesta voidaan poimia. Kun tämä on näytetty toteen, tämä lähestymistapa on tulevaisuudessa erittäin arvokas lääkeseulonnoissa. Seulonnoissa jokainen pistemutaatio altistetaan jokaiselle seulontakirjaston peräti 4000 erilliselle lääkeaineelle.”
Courtneyn mukaan vain lääkeaineita testaamalla on toivoa löytää yhdiste, joka on jo tunnettu kliinisestä turvallisuudesta ja siedettävyydestä. Tämä informaatio on korvaamaton kliinikoille ja potentiaalinen oikotie hyötyjen saamiseksi potilaille.
”Kun tutkimme harvinaisia sairauksia ja proteiinin erilaisia variantteja, on erittäin vaikeaa toteuttaa minkäänlaisia kliinisiä kokeita tehokkaiden lääkkeiden löytämiseksi puhumattakaan jopa eläinmallien tuottamisesta. Tämä tautia aiheuttavien varianttien moninaisuus on erittäin haastavaa. ”
Ari Turunen
20.2.2024
Lue artikkeli PDF-muodossa
Sitaatti
Nyrönen, T., & Turunen, A. (2023). Efficient transfer and analysis of biological image data through web interfaces. https://doi.org/10.5281/zenodo.13691023
Lisätietoja:
Tutkimusta on rahoittanut SynGAP Research Fund US,EU, ja Leon and friends e.V.
A free and open-source notebook for Deep-Learning in microscopy at CSC. Possibility to run Google Colab notebooks at CSC HPC environment via the web interface.
GitHub: https://github.com/yetulaxman/ZeroCostDL4Mic
The story behind ZeroCostDL4Mic, or How to get started with using Deep Learning for your microscopy data
Democratising deep learning for microscopy with ZeroCostDL4Mic
https://www.nature.com/articles/s41467-021-22518-0
Turun biotieteen keskus
CSC – Tieteen tietotekniikan keskus Oy
on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keski- tettyä tietotekniikkainfrastruktuuria.
ELIXIR
rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.