Voin kuvitella, että p*ska lensi hienosti :D : syntaktis-semanttinen analyysi sanoista paska ja p*ska Suomi24-aineistossa
Jokela, Sara (2025-02-07)
Jokela, Sara
S. Jokela
07.02.2025
© 2025 Sara Jokela. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202502061500
https://urn.fi/URN:NBN:fi:oulu-202502061500
Tiivistelmä
Tässä tutkielmassa tutkin sanojen paska ja p*ska samankaltaisuutta vertailemalla sanojen syntaktisia esiintymisympäristöjä ja semanttisia merkitysryhmiä kognitiivisen semantiikan kehyksessä. Tutkimusaineistoni on Suomi24-osakorpus, joka on kerätty Korp-konkordanssihakuohjelmaa käyttäen. Referenssikorpusaineistoni ovat kumpikin sadan osuman laajuisia, ja olen suorittanut syntaktis-semanttisen analyysin kumpaankin korpusaineistoon.
Aineistoni lausetyyppitulokset jakaantuvat viiteen pääkategoriaan, ja nämä ovat: kopula-lauseet, transitiivi- ja intransitiivilauseet, verbittömät ilmaukset sekä muu-kategoria. Lausetyyppianalyysin perusteella voidaan todeta sanan paska syntaktisen esiintymisympäristön olevan vakiintuneempi kuin sensuroidun sanan. Sensuroimattomassa korpusaineistossa kopula-lauseita on yli puolet (51 kappaletta). Vastaava luku sensuroidussa korpusaineistossa on 37 kappaletta. Muu-kategoria pitää sisällään yksittäiset erikoislause-esiintymät sekä määrittelemättömät tapaukset. Erikoislauseiden esiintyvyys on määrällisesti suurempi, mutta myös laadultaan moninaisempi sensuroidussa korpuksessa.
Määrittelemäni merkitysryhmät ovat uloste, lika, idiomaattiset ilmaukset, huono, luokittelevat merkitykset, loukkaus, voimalause sekä ryhmä muu. Määrällisesti merkittävimmät merkitysryhmien väliset eroavaisuudet ovat kategorioissa uloste, muu ja idiomaattiset ilmaukset. Idiomaattiset ilmaukset ja merkitysryhmä uloste ovat suhteellisesti suurempia sensuroidussa aineistossa. Merkitysryhmä muu on suurempi sensuroimattomassa aineistossa. Voimalausemerkitys esiintyy ainoastaan sensuroimattomassa aineistossa, sensuroidussa esiintymiä ei ole. Muiden merkitysluokkien osalta suhteelliset eroavaisuudet ovat tasaisia.
Yhteenvetona sana paska näyttäisi tämän tutkielman valossa vakiintuneen predikoimaan kopulalauseen subjektia merkityksessä ’huono’. Myös sanan p*ska yleisin käyttö on sa-mansuuntaista, tosin lausetyypeittäin sanan jakaantuminen on tasaisempaa. Suurin ero merkityksessä on kategoriassa uloste.
Aineistoni lausetyyppitulokset jakaantuvat viiteen pääkategoriaan, ja nämä ovat: kopula-lauseet, transitiivi- ja intransitiivilauseet, verbittömät ilmaukset sekä muu-kategoria. Lausetyyppianalyysin perusteella voidaan todeta sanan paska syntaktisen esiintymisympäristön olevan vakiintuneempi kuin sensuroidun sanan. Sensuroimattomassa korpusaineistossa kopula-lauseita on yli puolet (51 kappaletta). Vastaava luku sensuroidussa korpusaineistossa on 37 kappaletta. Muu-kategoria pitää sisällään yksittäiset erikoislause-esiintymät sekä määrittelemättömät tapaukset. Erikoislauseiden esiintyvyys on määrällisesti suurempi, mutta myös laadultaan moninaisempi sensuroidussa korpuksessa.
Määrittelemäni merkitysryhmät ovat uloste, lika, idiomaattiset ilmaukset, huono, luokittelevat merkitykset, loukkaus, voimalause sekä ryhmä muu. Määrällisesti merkittävimmät merkitysryhmien väliset eroavaisuudet ovat kategorioissa uloste, muu ja idiomaattiset ilmaukset. Idiomaattiset ilmaukset ja merkitysryhmä uloste ovat suhteellisesti suurempia sensuroidussa aineistossa. Merkitysryhmä muu on suurempi sensuroimattomassa aineistossa. Voimalausemerkitys esiintyy ainoastaan sensuroimattomassa aineistossa, sensuroidussa esiintymiä ei ole. Muiden merkitysluokkien osalta suhteelliset eroavaisuudet ovat tasaisia.
Yhteenvetona sana paska näyttäisi tämän tutkielman valossa vakiintuneen predikoimaan kopulalauseen subjektia merkityksessä ’huono’. Myös sanan p*ska yleisin käyttö on sa-mansuuntaista, tosin lausetyypeittäin sanan jakaantuminen on tasaisempaa. Suurin ero merkityksessä on kategoriassa uloste.
Kokoelmat
- Avoin saatavuus [42456]

