Roskapostin tunnistaminen koneoppimisen avulla sosiaalisessa mediassa
Kinnunen, Nuutti (2022-06-02)
Kinnunen, Nuutti
N. Kinnunen
02.06.2022
© 2022 Nuutti Kinnunen. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202206022513
https://urn.fi/URN:NBN:fi:oulu-202206022513
Tiivistelmä
Tämä työn tarkoitus on selvittää, miten koneoppimista hyödynnetään suodattamaan roskapostia sosiaalisesta mediasta. Tämän lisäksi koneoppimista vertaillaan muihin tapoihin suodattaa roskapostia. Aihe on tärkeä, koska lähivuosina roskapostista on tullut suuri ongelma sosiaalisen median alustoille. Roskapostin tunnistamiseen manuaalisesti liittyy kuitenkin haittoja, joita ovat suurella sosiaalisen median alustalla suuret kulut sekä epäkäytännöllisyys suuren viestimäärän tarkastamiseen.
Työ suoritettiin kirjallisuuskatsauksena. Aiempien tutkimusten perusteella koneoppimista voidaan hyödyntää tämän ongelman lieventämiseen. Koneoppimisen avulla roskapostia pystytään suodattamaan automatisoidusti ilman että tarvitsee tehdä monimutkaisia käsin kirjoitettuja sääntöjä. Koneoppimisalgoritmeina voidaan käyttää esimerkiksi Naive Bayesia ja neuroverkkoja. Työssä käsitellyn aiemman tutkimuksen mukaan Naive Bayes suoriutuu roskapostin suodattamisesta kokonaisuudessa neuroverkkoja paremmin. Työ tarjoaa yleisen katsauksen aiheeseen.
Työ suoritettiin kirjallisuuskatsauksena. Aiempien tutkimusten perusteella koneoppimista voidaan hyödyntää tämän ongelman lieventämiseen. Koneoppimisen avulla roskapostia pystytään suodattamaan automatisoidusti ilman että tarvitsee tehdä monimutkaisia käsin kirjoitettuja sääntöjä. Koneoppimisalgoritmeina voidaan käyttää esimerkiksi Naive Bayesia ja neuroverkkoja. Työssä käsitellyn aiemman tutkimuksen mukaan Naive Bayes suoriutuu roskapostin suodattamisesta kokonaisuudessa neuroverkkoja paremmin. Työ tarjoaa yleisen katsauksen aiheeseen.
Kokoelmat
- Avoin saatavuus [34166]