Medaffcon esitteli suomalaista tosielämän tietoa Euroopan keuhkosyöpäkongressissa
Medaffconin Euroopan keuhkosyöpäkongressin (ELCC) posterissa esiteltiin keskeisiä tuloksia tuoreesta ei-pienisoluista keuhkosyöpää (NSCLC) koskevasta tutkimuksesta.
Koneoppimisalgoritmi kehitettiin alun perin poimimaan tupakointitietoja potilasteksteistä, jotta voitiin analysoida tupakoinnin vaikutuksia leikkauksen jälkeisiin komplikaatioihin. Nykyään sitä hyödynnetään myös keuhkosyöpätutkimuksessa.
Hyvin suunniteltu koneoppimisväline voidaan mukauttaa erilaisiin tutkimustarkoituksiin. Juuri näin toimii Medaffconin tupakointitietoja poimiva algoritmi. Aluksi sitä käytettiin analysoimaan, miten tupakointi vaikuttaa leikkauksen jälkeisiin komplikaatioihin retrospektiivisessä tutkimuksessa. Medaffconin Data Scientist Olivia Hölsä esitteli mallin tammikuun lopussa 5. pohjoismaisessa RWE- ja AI-konferenssissa.
Medaffcon hyödynsi algoritmia ensin tutkimuksessa, johon osallistui puoli miljoonaa Helsingin yliopistollisessa sairaalassa (HUS) leikattua potilasta. Tupakoinnin tunnistaminen potilastiedoista saattaa kuulostaa yksinkertaiselta, mutta käytännössä se ei ole sitä. Tupakointiin liittyvät tiedot eivät ole strukturoituja, vaan ne on kirjattu vapaana tekstinä laajoihin potilasasiakirjoihin. Haasteena on: miten tupakointitilanne voidaan tehokkaasti poimia valtavasta tekstimäärästä?
Medaffcon ja tutkimusryhmä kehittivät koneoppimiseen perustuvan luokittelijan, joka auttaa tietojen analysoinnissa. Mallin kouluttamiseksi kliiniset asiantuntijat luokittelivat manuaalisesti yhteensä 20 000 tupakointiin liittyvää lausetta. Kaksi kliinistä asiantuntijaa suoritti tämän tehtävän yhdessä päivässä Medaffconin esikäsittelytekniikoiden ja erikoistyökalujen tukemana. Tämän jälkeen analysoitiin ja luokiteltiin yhteensä puoli miljoonaa tupakointiin liittyvää lausetta koneoppimisalgoritmin avulla.
Sittemmin algoritmia on sovellettu leikattuja potilaita koskevien tutkimusten lisäksi myös keuhkosyövän terveydenhuollon resurssien käyttöön, eloonjäämiseen ja ennustetekijöihin HUS-alueella.
Olivia Hölsän mukaan skaalautuvuus edellyttää, että algoritmi koulutetaan riittävän suurella ja monipuolisella populaatiolla.
”Kehittämämme algoritmi perustuu suureen ja edustavaan potilaskohorttiin, johon kuuluu monenlaisia potilaita.”
Hölsä kertoo, että tästä syystä Medaffconin koneoppimismalli on riittävän vankka analysoimaan sekä suuria potilaspopulaatioita että tarkempia potilaiden alaryhmiä.
”Koneoppimisessa on ratkaisevan tärkeää varmistaa, että harjoitustiedot on johdonmukaisesti merkitty ja verrattavissa todelliseen dataan, jolle malli on tarkoitettu, jotta malli voi tulkita oikein ja poimia asiaankuuluvaa tietoa kliinisestä dokumentaatiosta.”
Hölsä sanoo, että olisi myös mielenkiintoista verrata tietylle potilasryhmälle kehitettyjä koneoppimismalleja eri yliopistosairaaloissa Suomessa, jotta voitaisiin arvioida, kuinka skaalautuvia mallit ovat eri alueilla.
Kun koneoppimismallia skaalataan erilaisiin tutkimustarpeisiin, on tärkeää varmistaa joustavuus ja välttää sen liiallinen sovittaminen yhteen tiettyyn käyttötarkoitukseen.
”Esimerkiksi tupakoinnin osalta on otettava huomioon, että tupakointitilanne voi muuttua ajan myötä. Henkilö voi olla tupakoitsija, mutta lopettaa myöhemmin tupakoinnin. Siksi malliin pitäisi pystyä sisällyttämään ajalliset rajoitukset.”
Laadukkaat tiedot ovat olennaisen tärkeitä tehokkaan koneoppimismallin kehittämiseksi. Medaffconilla on laaja kokemus Real-World Evidence (RWE) -tutkimuksista. Tämän ansiosta sen asiantuntijat tuntevat luotettavat tietolähteet ja osaavat ottaa huomioon kriittiset tekijät tiedonkeruun aikana.
”Ymmärrämme, missä tiedot on dokumentoitu ja mitä tietoja on saatavilla. Tiedämme, mitä kysymyksiä kliinikoilta kannattaa kysyä tietojen syöttämisestä, ja osaamme määritellä tarvittavat tiedot tiedonkeruuta varten.”
Hölsä korostaa, että on tärkeää tunnistaa tietojen rajoitukset. Kiinnostavat tiedot voivat olla tallennettuna esimerkiksi eri terveydenhuoltojärjestelmissä, kuten tietyt laboratoriokokeet, jotka tehdään perusterveydenhuollossa eikä erikoissairaanhoidossa. Tämä on otettava huomioon jo varhaisessa vaiheessa tutkimuksen suunnittelua, mukaan lukien tiedonkeruuta koskevat määrittelyt, ja sitä on tarkasteltava edelleen mallin kehittämisen aikana.
Tupakointistatuksen lisäksi muita hoitoon liittyviä kriittisiä tekijöitä, kuten syövän etenemistä ja etäpesäkkeitä, dokumentoidaan edelleen rakenteettomasti. Hölsän mukaan koneoppimista voitaisiin käyttää tehokkaasti näiden tietojen analysoimiseen ja arvokkaiden oivallusten poimimiseen.
Tämä artikkeli on kirjoitettu englanniksi ja käännetty tekoälyn avulla suomenkielelle.
Medaffconin Euroopan keuhkosyöpäkongressin (ELCC) posterissa esiteltiin keskeisiä tuloksia tuoreesta ei-pienisoluista keuhkosyöpää (NSCLC) koskevasta tutkimuksesta.
Tekoäly (AI) muuttaa tutkimusta ja työelämää eri toimialoilla. Mutta mikä on sen merkitys terveystiedon analysoinnissa ja RWE tutkimuksessa?
Tupakoitsijan riski saada mitä tahansa komplikaatioita leikkauksen jälkeen on huomattavasti suurempi kuin savuttomien potilaiden, osoittaa laajaan data-aineistoon perustuva rekisteritutkimus.
Data Scientist
MSc (Tech.)
Olivia aloitti Medaffconilla diplomityöntekijänä kesällä 2021 ja viimeistelee bioinformatiikan ja digitaalisen terveydenhuollon opintoja Aalto-yliopistossa. Ennen Medaffconille siirtymistä hän on toiminut opetus- ja kurssiassistenttina yliopistolla opintojen ohessa. Hän ymmärtää hyvin monimutkaisiakin asiakokonaisuuksia, on oma-aloitteinen, ja hänellä on analyyttinen ja ratkaisukeskeinen työskentelyote.
Alassa häntä kiehtoo sosiaali- ja terveydenhuollon tuottaman monipuolisen tiedon tuominen yhteen ja sen analysointi päätöksenteon tueksi sotepalvelujen kehittämisessä sekä resurssien järkevässä kohdentamisessa.
Biostatistician
Data Analysis Lead
MSc (Tech.)
+358 44 314 1597
iiro.toppila@medaffcon.com
Iiro aloitti Medaffconilla tilastotieteen asiantuntijatehtävissä maaliskuussa 2017. Ennen tätä hän on toiminut neljä vuotta tutkimusassistenttina akateemisessa tutkimusryhmässä analysoiden kliinistä ja geneettistä potilasdataa. Koulutukseltaan Iiro on bioinformaatioteknologian diplomi-insinööri.
Iiron vahvuuksiin kuuluu tilastotieteen ja data-analyysin vahva tuntemus ja hands-on kokemus sensitiivisen potilasdatan kanssa työskentelystä, sekä poikkitieteellinen kommunikaatio eri alan asiantuntijoiden välillä. Alalla Iiroa kiinnostaa erityisesti teknologian murroksen avaamat suuret datamäärät ja se, kuinka tästä datasta saatavaa tietoa voidaan potentiaalisesti hyödyntää konkreettisten johtopäätösten tekoon, niin sairauksien luonteen ymmärtämiseksi kuin lääketeollisuuden tavoitteiden ja potilaiden hoidon edistämiseksi.
”Koneoppiminen ja tekoälypohjaiset työkalut mullistavat terveydenhuoltoa nyt ja tulevaisuudessa, mutta näitäkin tärkeämpää on saattaa jo olemassa oleva terveysdata tehokkaaseen käyttöön terveyden edistämiseksi.”