Level set clustering in a flow cytometry dataset
Herrala, Sauli (2016-04-15)
Herrala, Sauli
S. Herrala
15.04.2016
© 2016 Sauli Herrala. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-201604191509
https://urn.fi/URN:NBN:fi:oulu-201604191509
Tiivistelmä
Pro Gradu -työn tarkoituksena oli testata kuinka hyvin tasopuumenetelmä soveltuu virtaussytometria-aineiston klusterointiin, ja verrata sitä k-lähimmän naapurin menetelmään. Tasopuumenetelmää myös parannettiin lisäämällä Nelder-Mead (NM) -optimointimenetelmä yhteen työvaiheeseen, jotta laskenta-ajat pysyisivät hallinnassa.
Virtaussytometriassa mitataan yksittäisia soluja ja niiden ominaisuuksia, kun ne kulkevat laserin läpi. Ennen mittausta näyte on käsitelty fluerosoivalla aineella, jolloin solu hohtaa valon aallonpituuksia kulkiessaan laserin läpi. Nykyaikaiset laitteet pystyvät mittaamaan satoja tuhansia soluja ja kymmeniä aallonpituuksia kerralla. Tälläisen aineiston käsittely perinteisillä menetelmillä on erittäin raskasta.
FlowCAP-konsortio perustettiin testaamaan kuinka hyvin erilaiset klusterointi- ja luokittelumenetelmät soveltuvat sytometria-aineiston käsittelyyn. Tässä gradussa käytetään FlowCAP II -kisasta “akuutti myelooinen leukemia” -aineistoa, joka sisältää 43 sairastunutta ja 359 tervettä verrokkia. Henkilön luokitteleminen terveisiin ja sairaisiin tehtiin tukivektorikoneella tasopuumenetelmästä tai k-lähimmän naapurin menetelmästä saatuja klustereita hyödyntäen.
NM-menetelmällä saatiin selvä ajallinen hyöty ilman suurempaa menetystä tarkkuudessa, koska NM-menetelmä pääsi aina hyvin lähelle alkuperäisen algoritmin tulosta. Tasopuumenetelmä itsessään ei ollut k-lähimmän naapurin menetelmää parempi. Tämä johtui osaksi siitä, että variaatio tasopuumenetelmän tuloksien välillä oli hyvin suuri. Ero tasopuumenetelmän ja k-lähimmän naapurin menetelmän välillä oli kuitenkin pieni.
Virtaussytometriassa mitataan yksittäisia soluja ja niiden ominaisuuksia, kun ne kulkevat laserin läpi. Ennen mittausta näyte on käsitelty fluerosoivalla aineella, jolloin solu hohtaa valon aallonpituuksia kulkiessaan laserin läpi. Nykyaikaiset laitteet pystyvät mittaamaan satoja tuhansia soluja ja kymmeniä aallonpituuksia kerralla. Tälläisen aineiston käsittely perinteisillä menetelmillä on erittäin raskasta.
FlowCAP-konsortio perustettiin testaamaan kuinka hyvin erilaiset klusterointi- ja luokittelumenetelmät soveltuvat sytometria-aineiston käsittelyyn. Tässä gradussa käytetään FlowCAP II -kisasta “akuutti myelooinen leukemia” -aineistoa, joka sisältää 43 sairastunutta ja 359 tervettä verrokkia. Henkilön luokitteleminen terveisiin ja sairaisiin tehtiin tukivektorikoneella tasopuumenetelmästä tai k-lähimmän naapurin menetelmästä saatuja klustereita hyödyntäen.
NM-menetelmällä saatiin selvä ajallinen hyöty ilman suurempaa menetystä tarkkuudessa, koska NM-menetelmä pääsi aina hyvin lähelle alkuperäisen algoritmin tulosta. Tasopuumenetelmä itsessään ei ollut k-lähimmän naapurin menetelmää parempi. Tämä johtui osaksi siitä, että variaatio tasopuumenetelmän tuloksien välillä oli hyvin suuri. Ero tasopuumenetelmän ja k-lähimmän naapurin menetelmän välillä oli kuitenkin pieni.
Kokoelmat
- Avoin saatavuus [26782]