• Suomi
  • English

Uusi koneoppimisen menetelmä nopeuttaa lääkeaineiden seulontaa satakertaisesti

Itä-Suomen yliopistossa seulottiin virtuaalisesti 1,56 miljardia molekyyliä kahdelle lääkekohde-ehdokkaalle. Seulonta oli maailman suurin lajissaan.

Suurin osa käytössä olevista lääkkeistä on suunniteltu niin, että niiden kohdemolekyyleinä ovat elimistön proteiinit. Kun proteiiniperheen yhden jäsenen rakenne on selvitetty, voidaan muiden samaan perheeseen kuuluvien proteiinien rakenne ennustaa mallintamalla. Toimiva lääke voidaan kehittää esimerkiksi siten, että seulotaan isosta kirjastosta molekyyli, jonka kolmiulotteinen rakenne mahdollistaa vuorovaikutuksen kohdeproteiinin kanssa.

Professori Antti Poson tutkimusryhmässä etsittiin kahden lääkevaikutuskandidaatin, SurA-kaperonin ja GAK-kinaasin kanssa reagoivia molekyylejä. Hankkeessa testattiin seulontaan kehitetyn HASTEN-algoritmin toimivuutta ja luotiin uusi koneoppimisen malli.

”Nämä kohdeproteiinit, eli SurA ja GAk, olivat meille entuudestaan tuttuja, olemassa olevista akateemisista tutkimushankkeista. Massiivisten seulontojen tuloksia voidaan nyt hyödyntää muissa tutkimuksissa. Emme siis pelkästään validoineet menetelmää vaan voimme myös auttaa erillisiä akateemisia tutkimushankkeita”, sanoo Poso.

Kaperonit auttavat proteiinien laskostumisessa ja säätelevät proteiinien välisiä vuorovaikutuksia. Kinaasit toimivat mm. solujen signaalienvälittäjinä.

”SurA –kaperoni liittyy Tübingenin yliopiston yhteistyöhankkeeseen, jossa tavoitteena on kehittää uusia antibiootteja. Kinaasit taas ovat iso proteiiniperhe. Syöpälääkkeistä iso osa on kinaasi-inhibiittoreita. Kinaaseja on noin 500 erilaista ja GAK (Cyclin-G-associated kinase) on yksi niistä. GAK:n potentiaali on syöpälääkkeissä ja virusinfektoiden torjunnassa.”

Poson ryhmässä tutkitaan lääkeaineiden vuorovaikutuksia proteiinien kanssa ja rakennetaan kohdeproteiinimalleja. Kohdeproteiinin rakenteesta voidaan yleensä tunnistaa lääkeaineen sitoutumispaikka proteiinin ja saada siten lääkeaine toimimaan. Mallia voidaan erityisesti käyttää virtuaaliseulontaan, jossa suurista molekyylitietokannoista etsitään uusia ideoita lääkekehitykseen.

”Kaperoni on proteiinirakenteeltaan hyvin erityyppinen kuin kinaasi. Kyseessä on siis kaksi hyvin erilaista kohdeproteiinia, joita oli hyvä testata yhdessä.”

 

Tekoäly osasi ennustaa molekyylien sitoutumisen proteiineihin

 

Enamine Real-tietokannan täysi versio sisältää jo 48 miljardia rakennetta. Pelkästään molekyylirakenteiden muuttaminen kolmiulotteiseen muotoon on aikaavievää ja työlästä näin ison datamäärän ollessa kyseessä, mutta HASTEN-algoritmin avulla tämä vaihe voidaan ”ohittaa” ja materiaali käydään läpi muutamassa päivässä. Kuva: Ina Pöhner.

Kahden lääkeaihion rakenteen erilaisuus oli tärkeä tekijä, koska algoritmin pitää toimia kaikissa proteiiniperheissä.

”Kahdella lääkeaineaihiolla testattiin, miten Orionin Tuomo Kalliokosken kehittämä HASTEN-algoritmi toimisi CSC:n superlaskentaympäristössä. Skaalautuvuus onnistui.”

Kohdeproteiinien seulontaa tehtiin vertailun vuoksi HASTEN-algoritmilla ja perinteisellä telakointi -menetelmällä (docking). Telakoinnissa hakualgoritmi laskee vuorovaikutukset proteiinin ja tietokannassa olevan lääkeainekandidaatin välillä. Algoritmin antama lukuarvo kertoo, miten hyvin lääkeaine sitoutuu proteiiniin.

Poson ryhmässä seulottiin 1,56 miljardia lääkeainekandidaattia sisältävää molekyyliä. Molekyylit seulottiin ison ukrainalaisen kemian alan yrityksen Enaminen REAL-tietokannasta.

”Ensin laskettiin joka ikinen tietokannassa oleva piirretty kaksiulotteinen molekyyli ja ne muutettiin kolmiulotteiseen muotoon. Sitten tietokoneohjelma yritti sovittaa kunkin molekyylin GAK:n tai SurA:n sisään. Yksittäinen sovitus voi käsittää jopa satojatuhansia potentiaalisia vaihtoehtoja.”

Sitten tutkijat kokeilivat, miten koneoppimisen malli pärjäsi telakointiin verrattuna. Koneoppimiseen käytettiin HASTEN-algoritmia.

”Valitsimme ensin satunnaisesti miljoona molekyyliä ja katsoimme, miten telakointi sujui. Sitten tämä tulos kerrottiin tekoälylle. Kone siis opetteli miljoonan molekyylin perusteella ennustamaan tuloksen. Eli kun molekyyli näyttää tietynlaiselta, se telakoituu tiettyyn kohtaan.”

Tämän jälkeen tekoälylle syötettiin kaikki 1,56 miljardia molekyyliä ja ennustetiin tulokset perustuen miljoonan molekyylin tuloksiin. Parhaiksi ennustetut telakoitiin ja tulosten perusteella koneoppimine tehtiin uudelleen. Muutaman kierroksen jälkeen tekoäly ennusti telakoinnin 90% tarkkuudella.

”Opetettu kone pystyi tekemään seulonnan huomattavasti nopeammin kuin perinteisen telakointimenetelmän avulla. Kun telakoinnin laskemiseen meni pari kuukautta tehokkaillakin tietokoneilla, koneoppimisen avulla oppimisprosessi ja ennustaminen vei muutaman päivän.”

 

Poson mukaan nyt tutkijat pystyvät rutiininomaisesti seulomaan miljardeja molekyylejä samassa ajassa kuin missä aiemmin seulottiin miljoona. Lisäksi koneoppimisen mallin takia miljardien molekyylien seulonnan voi nyt tehdä ilman supertietokonetta.

”Nyt tietenkin voidaan supertietokoneella seuloa vieläkin suuremmista tietokannoista tuhansia miljardeja molekyylejä tämän menetelmän avulla. ”

Poson ryhmä tutkii seuraavaksi ns. vivid screening-menetelmää.

”Sen sijaan, että ennustetaan jokin tietty yksittäinen aktiivisuus tai telakointi, voidaankin samaan aikaan ennustaa useita erilaisia ominaisuuksia, esim. välttää jotakin sivuvaikutuksen omaavaa sitoutumispaikkaa samalla kun pidetään sitoutuminen oikeaan kohteeseen hyvänä.”

Tutkimuksessa käytettiin Suomen ELIXIR-keskuksen CSC:n superlaskentaresursseja, datantallennusta sekä tarvittavien työkalujen kontitusta.

Ari Turunen

31.8.2024

Lue artikkeli PDF-muodossa

Sitaatti:

Turunen, A., & Nyrönen, T. (2024). New machine learning method speeds up drug screening hundred-fold. https://doi.org/10.5281/zenodo.13691983

 

Lisätietoja:

Toni Sivula, Laxman Yetukuri, Tuomo Kalliokoski, Heikki Käsnänen, Antti Poso & Ina Pöhner (2023): Machine Learning-Boosted Docking Enables the Efficient Structure-Based Virtual Screening of Giga-Scale Enumerated 

Chemical Libraries. J. Chem. Inf. Model. DOI: 10.1021/acs.jcim.3c01239. Available at: https://pubs.acs.org/doi/full/10.1021/acs.jcim.3c01239

 

HASTEN-algoritmi

https://github.com/TuomoKalliokoski/HASTEN

 

Itä-Suomen yliopisto

 

https://www.uef.fi/fi

 

CSC – Tieteen tietotekniikan keskus Oy

on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.

http://www.csc.fi https://research.csc.fi/cloud-computing

 

ELIXIR

rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.

https://www.elixir-finland.org

http://www.elixir-europe.org

 

Puolet lääkeaineista vaikuttaa vain kolmeen proteiiniperheeseen

Jopa 50% hyväksytyistä lääkeaineista vaikuttaa kolmeen proteiiniperheeseen, tumareseptoreihin, G-proteiinireseptoreihin ja ionikanaviin.

 

Lääkeaineet vaikuttavat tavallisesti solujen reseptoreihin tai elimistön entsyymeihin, jotka ovat molemmat proteiineja. Monet lääkeaineet sitoutuvat myös entsyymireseptoreihin ja solukalvolla oleviin kantajaproteiineihin. Lääke voi esimerkiksi sitoutua entsyymin aktiiviseen kohtaan, jolloin se estää entsyymin säätelemän kemiallisen reaktion. Useimmiten entsyymeinä, jotka katalysoivat lääkkeen aiheuttavan kemikaalisen reaktion, ovat sytokromi P450-entsyymit.

Suurin osa lääkkeiden kohdeproteiineista kuuluu vain kymmeneen proteiiniperheeseen, jopa puolet vain kolmeen perheeseen. Tiettyyn perheeseen kuuluvilla proteiineilla on samalla tavalla laskostunut kolmiulotteinen rakenne, toiminta ja merkittävä samankaltaisuus aminohapposekvensseissä, mikä kertoo yleensä yhteisestä muinaisesta historiasta. Saman perheen proteiinit ovat peräisin yhdestä alkuperäisestä kantamuodosta, joka on evoluution myötä muokkaantunut ja erikoistunut ympäristön paineessa myös alkuperäisestä roolistaan poikkeaviin toiminnallisiin rooleihin solujen prosesseissa.

 

Tumareseptorit ja hormoniperäiset sairaudet

Vasemmalta oikealle: estrogeenireseptori, androgeenireseptori, D-vitamiinireseptori ja keltarauhashormonireseptori. Nämä proteiinit ovat rakenteeltaan ja molekyyliseltä toiminnaltaan samanlaisia, vaikka vaikuttavat elimistössä täysin erilaisiin toimintoihin. Reseptorit kuuluvat samaan tumareseptorien proteiiniperheeseen. Tämä tarkoittaa mm. sitä, että reseptoreilla on sama esihistoriallinen alkuperä. Jokaisen reseptorin kanssa vuorovaikuttava pieni molekyyli, esimerkiksi testosteroni androgeenireseptorissa näkyy rakenteen yläosassa harmaana pallo-tikku mallina. Protein Data Bankissa eli PDB-proteiinitietokannassa on yli 100 000 proteiinirakennetta, jotka jakautuvat proteiiniperheisiin. Proteiiniperheen jäsenet ovat yleensä kolmiulotteiselta rakenteeltaan samankaltaisia, ja siksi ne myös toimivat samantapaisesti.

 

Proteiiniperheet keksittiin, kun alettiin tuntea muutaman proteiinin rakenne ja aminohapposekvenssit. Silloin havaittiin että, proteiinit muodostuvat useita itsenäisiä rakenteellisesti erottuvia alueita, jolla on jokin erikoistehtävä. Näitä alettiin kutsua domeeneiksi.

Uusia proteiiniperheitä on löydetty eri sairauksien syntymekanismeja tutkittaessa. Esimerkiksi tumareseptorit löydettiin rintasyöpää tutkittaessa. Pitkään oli tiedetty, että kolmannekselta rintasyöpään sairastuneilta naisista, joilta oli poistettu munasarjat tai lisämunuaiset, kasvaimen kasvu loppui. Rintasyövän molekylaarinen perusta oli kuitenkin vielä mysteeri. Vuonna 1947 lääketieteen tutkija Elwood Jensen alkoi selvittää tätä. Jensen löysi estrogeeni-reseptorin ja havaitsi, että kun estrogeenireseptori aktivoituu, kun siihen sitoutuu sen luontainen estrogeeni, estradioli. Tämän jälkeen aktivoitunut estrogeenireseptori matkustaa solun tumaan, missä se osallistuu geenien toiminnan säätelyyn.

Tumareseptorien perheeseen kuuluva proteiinimolekyyli, estrogeenireseptori, on erittäin tärkeä ihmiselle. Jos sen toiminnassa tapahtuu muutoksia, niillä on suuri merkitys solujen terveyteen. Estrogeenireseptorilla on diagnosoitu olevan tärkeä rooli rintasyövän synnyssä. Normaalisti estrogeenit säätelevät estrogeenireseptorin aktiivisuutta solussa. Estrogeenireseptorin muuttunut muoto on koko ajan aktiivinen, eivätkä solun normaalit estrogeenipitoisuuteen perustuvat säätelymekanismit siten toimi oikein. Tämä voi johtaa syövän, eli säätelemättä kasvavien normalista poikkeavien solukkojen syntyyn.

Elwood Jensen osoitti, että rintasyöpäpotilaat, joilla oli alhainen estrogeenireseptoripitoisuus syöpäsoluissaan eivät hyötyneet munasarjojen poistosta. Munasarjat tuottavat suuren osan naisten aktiivisesta estrogeenista. Reseptoripitoisuus osoittaa, kenen kannattaa mennä leikkaukseen ja kenen kannattaa jättää se väliin. 1970-luvun puolivälissä Jensen ja hänen kollegansa Craig Jordan havaitsivat, että syöpäpotilaat, joiden kasvaimien muuttuneissa soluissa oli suuri määrä estrogeenireseptoreja ovat myös todennäköisesti niitä, jotka hyötyvät tamoksifeenista. Se on antiestrogeeni eli se kumoaa estrogeenin vaikutusta soluissa. Ne potilaat, joilla oli vähäisiä määriä reseptoreja, voitiin puolestaan heti siirtää muihin hoitoihin. Vuoteen 1980 mennessä Jensenin kehittämästä testistä, jolla mitataan reseptorien määrää rintasyöpänäytteistä, oli tullut standarditesti rintasyöpäpotilailla.

Estradioli kuuluu estrogeneenihormoonien ryhmään.
Estrogeenireseptori ja tamoksifeeni. Estrogeeni on kehon oma solujen estrogeenireseptorin toimintaa aktivoiva hormooni. Rintasyöpäsolussakin estrogeeni toimii myös aktivoivana tekijänä, mikä voi pahentaa tautia lisäämällä syöpäsolujen kasvua. Tamoksifeeni on nk. antiestrogneeni. Sitä käytetään syövän hoidossa estämään estrogeenin toimintaa. Tamofikseeni on pieni lääkeainemolekyyli, joka matkii estrogeenin muotoa ja sitoutuu tiukasti estrogeenireseptoriin. Kun se sitoutuu, se muuttaa reseptorin pinnalla olevan, signaalien välitykseen osallistuvan aminohapposilmukan muodon, joka on kuvattuna vihreänä. Alemmassa rakenteessa näkyy lääkesidos. Koska lääkemolekyyli on suurempi kuin estrogeenihormoni, se pakottaa silmukan ei-aktiiviseen muotoon ja estää siten kasvainta kasvamasta. Kuva: Protein Data Base

 

Löydöt paljastivat soluissa toimivan proteiinien superperheen, tumareseptorit, joihin estrogeenireseptori kuuluu. Tumareseptoriperheeseen kuuluvat mm. estroneegireseptorit alfa ja beta, androgeenireseptori, keltarauhashormonireseptori ja D-vitamiinireseptori. Tumareseptoreille on yhteistä, että ne aktivoituvat solukalvon läpäisevän viestimolekyylin eli ligandin, tumareseptorihormonin, sitouduttua niihin ja matkustavat tämän jälkeen tumaan vaikuttamaan solun prosesseihin. Hormonit, jotka aktivoivat tumareseptorien suurperheeseen kuuluvia jäseniä ovat mm. testosteroni, estradioli, progesteroni eli keltarauhshormoni, glukokortikoidit, mineralokortikoidit ja D-vitamiini ja lääkeainesuunnittelun avulla luodut luonnollisten ligandien rakennetta matkivat molekyylit. Esimerkiksi Norjan vuoden 2016 hiihtomaajoukkueen Therese Johaugin huulivoiteessa saattoi olla klostebolia, joka on androgeenireseptorin ligandi. Klosteboli toimii anabolisena eli lihassolujen proteiinien kasvua edistävänä tekijänä.

Ihmisen elimistöön lääkeiden tai muun reitin kautta tulevat pienet molekyylit voivat siten vaikuttaaa tumareseptoreihin niitä aktivoimalla tai sammuttamalla, ja siten vaikuttavat solun geenien toimintaan. Tumareseptorien löytäminen on muuttanut vallankumouksellisesti biokemiallisen endokrinologian tutkimuksen. Endokrinologia on erikoisala, joka tutkii ja hoitaa hormoneja tuottavien elinten sairauksia. Sairaudet voivat johtua hormonien liikatuotannosta tai niiden puutteesta, lisäksi hormoneja tuottavissa kudoksissa voi ilmetä sekä hyvän- että pahanlaatuisia kasvaimia. Ennen tumareseptoreiden keksimistä ihmiskehon hormoonien toiminta oli täysi mysteeri, nyt toimintaa osataan jo hieman muokata.

 

G-proteiinit ja solujen signaalinvälitys

 

Jotta organismi voisi toimia, signaalien pitää välittyä kehon soluissa ja niistä muodostuneissä elimissä. Elimistö kokonaisuutena lähettää ja vastaanottaa signaaleita sähkövirtojen ja tiettyjen molekyylien avulla. Martin Rodbell ja Alfred Gilman selvittivät , miten signaalinvälitys tapahtuu solukalvon läpi molekyylien yhteistoiminnan kautta. Vuonna 1970 Martin Rodbell osoitti, että signaalinsiirto tapahtuu kolmessa vaiheessa: signaalin vastaanotto, siirto ja vahvistus. Siirto tapahtuu siten, että solun pinnan proteiinista välitetään käsky vaihtaa solukalvon toisella puolella sijaitsevaan proteiiniin sitoutunut guanisiinidifosfaatti (GDP) guanosiinitrifosfaattiin (GTP). Tämä ilmiö on tiedonsiirtoa molekyylitasolla.

Vuonna 1980 Alfred Gilman tutki leukemiasoluja ja havaitsi, että ne eivät vastanneet hormonien välittämään ulkoiseen signaaliin. Syynä oli reseptoriproteiinin mutaatio, joka aiheutti sen, että hormonien signaalinvälitys estyi. Gilman eristi proteiinin normaaleista soluista ja näillä proteiineilla hän pystyi korjaamaan vaurioituneen solun. Molekyylit, jotka ovat mukana signaalinvälityksessä ovat suuri perhe proteiineja, jotka sitoutuvat guanosiinitrifosfaattiin. Kun ne ovat sidoksissa GTP:hen, ne ovat ”päällä” ja kun ne ovat sidoksissa GDO:hen, ne ovat ”pois päältä.” Gilman kutsui niitä G-proteiineiksi (guanine nucleotide-binding proteins).

G-proteiinit ovat kenties tärkeimpiä signaalinvälitykseen osallistuvia molekyylejä. Ne liittyvät joidenkin syöpämuotojen lisäksi diabetekseen, alkoholismiin sekä monien muiden sairauksien molekyylaarisiin syntymekanismeihin.

Solukalvossa olevien G-proteiineihin kytkeytyneiden reseptorien proteiiniperhe kuljettaa signaalit solun G-proteiineille solukalvon sisäpuolella. G-proteiinit puolestaan ottavat vasteen vaihtamalla GDP:n GTP:ksi. Seuraus tästä aktivoitumisesta on esimerkiksi solun sisäpuolella solulimassa pilkkomistyöhön vapautuva entsyymi, solukalvossa sijaitsevan ionikanavan avautuminen tai sulkeutuminen.

Tällä mekanismilla toimii esimerkiksi silmässä rodopsiini, joka on avulla havaitsemme silmillämme valon eli näemme. Kolmasosa tunnetuista lääkeaineista vaikuttaa G-proteiineihin kytkeytyneisiin reseptoreihin. Katekoliamiinit (mm. adrenaliini, noradrenaliini ja dopamiini), peptidit, glykoproteiinihormonit sekä rodopsiini ovat esimerkkejä ligandeista, jotka sitoutuvat näihin reseptoreihin. Alfred Gilman ja Martin Rodbell saivat 1994 Nobelin lääketieteen palkinnon G-proteiinien keksimisestä. Kemian Nobel myönnettiin vuonna 2012 Robert Lefkowitzille and Brian Kobilkalle G-proteiineihin kytkeytyneiden proteiinien toiminnan selittämisestä.

Dopamiini.

Proteiinit suorittavat työtään syklisesti ja tarkasti vaihtamalla muotoja ja molekyylejä signaalien perusteella. G-proteiinin ja G-proteiinikytkettyjen reseptorien muodot ovat jatkuvassa dynaamisesti muuttuvassa biokemiallisessa tasapainoreaktiossa keskenään. G-proteiinien herkässä tasapainossa tapahtuvat muutokset voivat aiheuttaa sairauksia. Esimerkiksi kolerabakteerin myrkky lukitsee G-proteiinit yhteen muotoon ja vaikuttaa hermoihin, jotka ohjaavat suolan ja nesteen imeytymistä suolistossa.

 

Ionikanavareseptorien aktiivisuus addiktion hoidossa

Beta-amyloidi on peptidi. Amyloidiplakkia kertyy Alzheimerin tautia sairastavan aivoihin.

Ionikanavat kuuluvat integraalisiin solukalvon proteiineihin eli proteiineihin, jotka ovat osa solukalvon rakennetta. Ne voivat olla ligandivälitteisiä, reseptoriohjattuja ja jänniteohjattuja.

Jotkin ionikanavat ovat monimutkaisia moniosaisia ja molekyylikooltaan valtavia rakennelmia. Valtavat ionikanavien toimintaan kytkeytyneet reseptorit reagoivat suoraan pienen pieniin ligandimolekyyleihin, kuten aivoissa sijaitseva ionotrooppinen glutamaatti-aminohappoon reagoiva reseptori. Neljästä domeenista muodostuva proteiini muuttaa auliisti muotoaan tuhansia kertoja pienemmän glutamaatin sitoutuessa signaalinvälitykseen tarkoitettuun domeeniin ja avaa solukalvon läpisevä ionikanavan. Memantiinia käytetään Alzheimerin tautiin. Se suojaa aivojen hermosoluja tuhoutumiselta estämällä liiallisen glutamaatti-välittäjäaineen vaikutuksen.

Reseptoriohjatut ionikanavat aukeavat, kun niihen kiinnittyy tietty kemiallinen yhdiste. Kemiallinen yhdiste voi olla solun ulkoinen molekyyli kuten hormoni, hermoston välittäjäaine, lääkeaine tai myrkky tai solun sisäinen molekyyli. Ymmärtämällä ionikanavareseptorien toimintaa tutkijat voivat kehittää esimerkiksi addiktion hoitomuotoja muuttamalla reseptorien aktiivisuutta.

 

Ari Turunen

Tommi Nyrönen

14.6.2018

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, & Tommi Nyrönen. (2018). Half of all drug ingredients affect only three protein families. https://doi.org/10.5281/zenodo.8113184

 

 

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org

 

 

Hyvää lääkeainemolekyyliä etsimässä

Hyvää lääkeainemolekyyliä ei synny, ellei tiedetä, mihin proteiineihin se elimistössämme vaikuttaa. Siksi lääkeainesuunnittelussa on tärkeää hyödyntää massiivisia tietokantoja, joihin on tallennettu löydettyjä proteiinirakenteita ja proteiiniperheitä sekä tietoja, miten ne toimivat soluissa.

Suurin osa käytössä olevista lääkkeistä on suunniteltu niin, että niiden kohdemolekyyleinä ovat elimistön biomolekyylit eli proteiinit. Useimmat lääkeaineet vaikuttavat elimistössä sitoutumalla viestimolekyylien, kuten hermoston välittäjäaineiden ja hormonien, reseptoreihin. Reseptorit ovat solun erikoistuneita proteiineja, jotka käynnistävät siihen kytkeytyvät solun signaalinvälitysmekanismit.

Lääkeaineiden suunnittelun lähtökohtana on rakentaa pieniä synteettisiä molekyylejä, jotka vaikuttavat valikoivasti juuri haluttuihin proteiineihin. Suurin osa lääkkeiden kohdeproteiineista kuuluu vain kymmeneen proteiiniperheeseen, jopa puolet vain kolmeen perheeseen. Pienet molekyylit pystyvät imeytymään hyvin verenkiertoon, jolloin lääke alkaa vaikuttaa. Proteiinin sijainnista riippuen lääkeainemolekyylin täytyy tunkeutua soluihin tai välittää solun ulkopuolelta signaali, joka vaikuttaa solun sisällä tapahtuviin prosesseihin. Molekyylit pyritään suunnittelemaan esimerkiksi siten, että ne hidastavat tai kiihdyttävät jonkin tietyn proteiinin toimintaa.

Aiemmin ei tiedetty paljonkaan siitä, missä kohdassa solua lääkeaine vaikuttaa. Vuonna 1980 näitä vaikutuskohteita tunnettiin 150. Määrä on eri eliöiden genomien selvittämisen myötä kuitenkin kasvanut huimasti, sillä nyt on tiedossa jo yli 5 000 mahdollista vaikutuskohdetta. Lääketieteen käytettävissä on noin 2500 lääkeainemolekyyliä. Ihmisen genomin toimintaa selvitetään yhä tarkemmin, ja mahdollisia lääkeaineiden vaikutuskohteita tunnetaan lähivuosina ehkä jo 10 000.

Viimeisten arvioiden mukaan elimistössämme on 2000 – 3000 proteiinia, jotka ovat mahdollisia kohdeproteiineja lääkeaineelle. Nykyisten lääkkeiden on osoitettu toimivan vasta noin 450 lääkeaineen kohteen kautta rajalliseen määrään tauteja. Siten lääkeaineiden suunnittelijoilla on kaksi merkittävää tavoitetta – rakentaa uusia turvallisia molekyylejä, joilla tunnettuihin kohteisiin voidaan turvallisesti vaikuttaa ja toisaalta tutkia tunnettujen turvallisten lääkeaineiden käyttöä uusiin sairauksiin, joihin ei tällä hetkellä ole viranomaisten hyväksymää lääkettä. Tutkijoiden tavoitteena on muun muassa ymmärtää, mitkä lääkeaineen rakenteelliset ja kemialliset ominaisuudet ovat avainasemassa, kun ne muokkaavat proteiinien toimintaa solutasolla.

Toimiva lääke voidaan kehittää, kun löydetään sellainen kohdeproteiinin kolmiulotteinen rakenne, joka mahdollistaa vuorovaikutuksen lääkeainemolekyylin kanssa. Lääkemolekyyliin rakennetaan kemialliset vastakappaleet, jotka tunnistavat proteiinin sitoutumiskohdassa olevat aminohapot. Kun tällainen molekyyli törmää elimistössä kohdeproteiiniin, se hakeutuu automaattisesti proteiinin sitoutumiskohtaan, koska siihen kiinnittyminen on sille energeettisesti edullista.

Hyvin suunnitellun lääkeainemolekyylin sitoutumista kohdeproteiiniin voisi verrata villakäsineen pukemiseen. Se istuu napakasti nimenomaan viisisormiseen käteen: kuusi- tai seitsemänsormiselle se olisi erittäin epämukava. Vasemman käden käsine myös istuu huonosti oikeaan käteen.

Proteiinien muoto kertoo molekyylin toiminnasta enemmän kuin aminohappojärjestys. Muodoltaan samanlaiset proteiinit voivat biokemiallisesti toimia samankaltaisesti, vaikka niiden aminohappojärjestykset poikkeaisivat toisistaan yli 80 prosenttia.

Kun proteiiniperheen yhden jäsenen rakenne on selvitetty, voidaan muiden samaan perheeseen kuuluvien proteiinien rakenne ennustaa mallintamalla. Tietokoneen avulla tehtävä mallintaminen nopeuttaa tutkimusta, sillä proteiinien aminohappojärjestyksiä tunnetaan satoja kertoja enemmän kuin sellaisia proteiinirakenteita, jotka on jo ehditty määrittää kokein. Karkeasti voidaan sanoa, että genomiikan tehtävänä on selvittää nukleotidien järjestys. Tämä järjestys muuttuu solussa aminohappopolymeeriksi, mutta vasta kun proteiini laskostuu kolmiulotteiseen muotoonsa, se alkaa toimia. Tätä toimintaa selvittää proteomiikka. Siten genomiikan, proteomiikan ja lääkemolekyylimallituksen asiantuntijoiden yhteistyö tukee toisiaan.

 

Monissa kipulääkkeissä käytettävä ibuprofeiini estää syklo-oksigenaasi-entsyymin toimintaa, mikä puolestaan vähentää kipureseptoreiden viestinnässä tarvittavien kemikaalien ja prostaglandiineiksi kutsuttujen hormoonien tuotantoa. Näin kipuaistimus heikkenee.

 

Tietokannoissa proteiinien rakenteet ja paikat

 

Vaikka tietoa on paljon, uusien lääkkeiden kehitys on varsin haasteellista. Vain viisi prosenttia lääkeaine-ehdokkaista etenee laboratoriotestauksen kautta edes eläimillä tehtäviin hoitokokeisiin asti. Niistäkin vain pari prosenttia sopii lopulta lääkkeiksi. On arvioitu, että jopa 75 prosenttia lääkkeiden hinnasta johtuu epäonnistuneiden lääkekehityshankkeiden kustannuksista.

Yksi suuri haaste on sivuvaikutusten minimointi. Genomiikan kehityksen myötä lääkeaineiden on todettu vaikuttavan yksilöllisesti. Historiallisesti lääkeaineet on kehitetty olettaen, että ihmiset ovat samanlaisia biokemialtaan, mutta todellisuudessa olemme solutasolla yksilöllisiä samalla tavalla kuin ihmiset ovat fyysisesti hieman erilaisia. Kun pienillä lääkeainemolekkyleillä pyritään vaikuttamaan sairastuneen elimistön tilanteeseen parantavasti, nämä yksilölliset molekyylitason erot voivat vaikuttaa lääkeaineen toimivuuteen.

Keräämällä ja tallentamalla ihmisen biologista tietoa, voidaan tulevaisuudessa kohdistaa hoitotarkoituksiin lääkemolekyylejä, jotka tekevät juuri sen mitä niiden pitääkin ja juuri siinä tilanteessa ja räätälöitynä sille ihmiselle, joka lääkehoitoa tarvitsee. Tätä kutsutaan yksilöllistetyksi lääketieteeksi.

Tietty geeni tuottaa tiettyä proteiinia, joihin lääkeaineet vaikutavat. Kun tunnetaan ihmisen perimän DNA:n emäsjärjestys, voidaan päätellä myös vastaavan proteiinin perusrakenne tällä ihmisellä. Kuten DNA, proteiinikin on rihma, joka koostuu peräkkäisistä rakennuspalikoista. Geenin tiettyä palikkaa vastaa aina proteiinin tietty palikka.

Yhdellä ihmisellä voi olla perittynä tai ympäristön aiheuttaman muutoksena yhden DNA:n nukleotidin muutos, joka tämän ketjun kautta heijastuu proteiiniin. Tuo muutos voi olla juuri siinä kohdassa proteiinia, jolla sen pitäisi ottaa vastaan signaaleita muualta elimistöstä tai vuorovaikuttaa lääkeaineen kanssa. Proteiinin rakenteet tallentamalla ja jakamalla ne tutkijoiden käyttöön voidaan tämä ilmiö hallita ja ymmärtää. Lääkemolekyylin ja proteiinimolekyylin muodot osataan sovitella toisiinsa niin, että lääkettä muokataan sopeuttaen se tilanteeseen, jolloin lääke tarttuu ja vaikuttaa mahdollisimman tehokkaasti. Monet syöpähoidot perustuvat tähän. Kasvaimen perimä muuttuu ajan kuluessa. Eri vaiheessa oleviin kasvaimiin voi vaikuttaa lääkeaineilla, mutta lääkeaineiden muodon on otettava huomioon kasvua kiihdyttävien proteiinin muodon muutokset.

Lääkeainesuunnittelussa tutkitaan siksi erityisesti proteiineja, joiden kolmiulotteinen rakenne voidaan selvittää kokein tai ennustaa mallintamalla. Lääkemolekyylin tarttumista voi tutkia tietokoneen moderneilla mallinnusohjelmilla, joissa kolmiulotteista proteiinin ja lääkkeen mallia sovitellaan toisiinsa. Näin voidaan myös räätälöidä ihanteellinen lääkkeen muoto.

Tavallisesti lääke vaikuttaa tarttumalla elimistön vialliseen proteiiniin ja muuttamalla sen toimintaa. Ihanteellinen lääke tekee vain tämän; se ei häiritse terveitä proteiineja eikä aiheuta muita sivuvaikutuksia. Tähän asti on oltu onnellisia, jos on löydetty yksi sairauteen vaikuttava proteiini ja jokin siihen kohtuullisesti tehoava lääkeaine.

Nyt proteiinien ja lääkemolekyylien koko arsenaalia pystytään seulomaan ja valitsemaan parhaat ehdokkaat. Tämä johtuu molekyylibiologian, tietokoneiden laskentatehon ja tietokantojen edistymisestä. Nyt voidaan seuloa elimistön koko proteiinivalikoimaa.

 

 

Protein Data Bankissa eli PDB-proteiinitietokannassa on yli 100 000 proteiinirakennetta, jotka jakautuvat proteiiniperheisiin. Proteiiniperheen jäsenet ovat yleensä kolmiulotteiselta rakenteeltaan samankaltaisia, ja siksi ne myös toimivat samantapaisesti.

PDB-tietokantaa ylläpitää kansainvälinen konsortio Worldwide Protein Data Bank (wwPDB). Sen tehtävänä on ylläpitää yksittäistä makromolekyylien rakennedataa, joka on tutkijoille vapaasti käytettävissä.

Human Protein Atlas on vuonna 2003 Ruotsista alkanut ohjelma, jonka tarkoituksena on kartoittaa kaikki ihmisen proteiinit soluissa, kudoksissa ja elimissä. Kartoituksessa käytetään erilaisia omiikka-tekniikoita eli tekniikoita, joissa kaikkia geenejä tai niiden tuottamia proteiineja tutkitaan samanaikaisesti. Näitä ovat vasta-aineiden kuvantaminen, massaspektromiikkaan perustuva proteomiikka, transkriptiomiikka ja systeemibiologia. Kaikki kerätty data on avoinna tutkijoille.

Tammikuussa vuonna 2015 Human Protein Atlas julkaisi kartan, joka näytti 17 000 eri proteiinin paikat ihmisen kehossa antaen näin arvokasta tietoa lääkeainesuunnitteluun. Kartassa olivat proteiinien sijainnit, jotka olivat hyväksyttyjen lääkkeiden kohdeproteiineja. Tutkijat voivat katsoa proteiineja 32 erilaisessa kudoksessa edustaen kaikki merkittävimpiä kehon kudoksia ja elimiä.

Joulukuussa 2017 Human Protein Atlas julkaisi version 18. Tietokannassa oli tuolloin 26 000 vasta-ainetta, jotka kohdistuivat proteiineihin, joita lähes 17 000 geeniä koodaa. Se vastasi 87% ihmisen proteiineja koodaavista geeneiistä.

Tommi Nyrönen

Ari Turunen

12.6.2018

Lue artikkeli PDF-muodossa

Sitaatti

Ari Turunen, & Tommi Nyrönen. (2018). Looking for a good drug. https://doi.org/10.5281/zenodo.8113165

 

 

 

Lisätietoja:

CSC – Tieteen tietotekniikan keskus Oy

CSC – Tieteen tietotekniikan keskus Oy on valtion omistama, opetus- ja kulttuuriministeriön hallinnoima, voittoa tavoittelematon osakeyhtiö. CSC ylläpitää ja kehittää valtion omistamaa keskitettyä tietotekniikkainfrastruktuuria.
http://www.csc.fi
https://research.csc.fi/cloud-computing

ELIXIR

ELIXIR rakentaa infrastruktuurin bioalan tutkimuksen tueksi. Se yhdistää 21 Euroopan maan ja Euroopan molekyylibiologian laboratorion EMBL:n johtavat organisaatiot yhteiseksi biologisen informaation infrastruktuuriksi. Sen Suomen keskus on CSC – Tieteen tietotekniikan keskus Oy.
https://www.elixir-finland.org
http://www.elixir-europe.org