Hyppää sisältöön
    • FI
    • ENG
  • FI
  • /
  • EN
OuluREPO – Oulun yliopiston julkaisuarkisto / University of Oulu repository
Näytä viite 
  •   OuluREPO etusivu
  • Oulun yliopisto
  • Avoin saatavuus
  • Näytä viite
  •   OuluREPO etusivu
  • Oulun yliopisto
  • Avoin saatavuus
  • Näytä viite
JavaScript is disabled for your browser. Some features of this site may not work without it.

Radiologisten lausuntojen luokittelu tekoälyn menetelmin

Myllylä, Elisa (2024-06-28)

 
Avaa tiedosto
nbnfioulu-202406285058.pdf (1.084Mt)
nbnfioulu-202406285058_mods.xml (11.70Kt)
nbnfioulu-202406285058_supplementary_agreement.pdf (144.5Kt)
nbnfioulu-202406285058_pdfa_report.xml (337.9Kt)
Lataukset: 


Myllylä, Elisa
E. Myllylä
28.06.2024
© 2024, Elisa Myllylä. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202406285058
Tiivistelmä
Terveysrekistereissä on paljon hyödyntämätöntä dataa, jota voidaan valjastaa käyttöön erilaisin koneoppimis- ja luonnollisen kielen käsittelyn (NLP) menetelmin. Potilastietojärjestelmien data koostuu pääosin tekstimuotoisista kliinisistä lausunnoista, jotka sisältävät paljon hyödyllistä tietoa, mutta jotka eivät ole saatavilla rakenteellisena tietona. Tiedon tehokas poiminta kliinisistä teksteistä edellyttää edistyneitä NLP-ratkaisuja. Tämän tutkimuksen tarkoituksena oli tutkia keinoja suomenkielisten kliinisten tekstien luokittelutehtäviin ja selvittää, miten perinteiset koneoppimismallit suoriutuvat suhteessa laajempiin ja monimutkaisempiin kielimalleihin näissä tehtävissä. Lisäksi tutkittiin valmiiksi viritettyjen mallien siirtoa uuteen dataan. Käytetyt menetelmät sisälsivät perinteisistä koneoppimismalleista tukivektorikoneen, logistisen regression, naiivi Bayesin, satunnaismetsän ja gradienttitehostamisen, sekä opinnäytetyössä kehitetyn konvoluutioneuroverkon (CNN) ja esikoulutetut mallit FinBERT, Finnish ConvBERT, Finnish RoBERTa ja XLNet. Mallien suorituskykyä arvioitiin sekä MIMIC- että rintasyöpädatassa, ja tulokset analysoitiin useiden mittareiden, kuten tarkkuuden, täsmällisyyden, herkkyyden ja F1-arvon, avulla. Parhaimmat F1-arvot MIMIC-datassa saavuttivat FinBERT, Finnish ConvBERT ja Finnish RoBERTa arvolla 98%. CNN sai arvoksi 93% ja yksinkertaisemmista malleista tukivektorikone sai korkeimman arvon 91%. Rintasyöpädataan sovellettiin tässä työssä vain CNN:ää ja perinteisiä menetelmiä, joista parhaimman F1-arvon sai tukivektori keskiarvolla 88%. Tulokset osoittavat, että kehitetyt menetelmät voivat tehostaa sähköisten terveystietojen hyödyntämistä ja tiedon poimintaa. Erityisesti Transformerpohjaiset kielimallit osoittautuivat tehokkaiksi tekstiluokittelutehtävien suorittamisessa.
Kokoelmat
  • Avoin saatavuus [43095]
oulurepo@oulu.fiOulun yliopiston kirjastoOuluCRISLaturiMuuntaja
SaavutettavuusselosteTietosuojailmoitusYlläpidon kirjautuminen
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatAsiasanatUusimmatSivukartta

Omat tiedot

Kirjaudu sisäänRekisteröidy
oulurepo@oulu.fiOulun yliopiston kirjastoOuluCRISLaturiMuuntaja
SaavutettavuusselosteTietosuojailmoitusYlläpidon kirjautuminen