Swearing on Twitter : examining tweeted profanities from the United States and the Nordic countries
Anttila, Tapio (2018-01-04)
Anttila, Tapio
T. Anttila
04.01.2018
© 2018 Tapio Anttila. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-201801111060
https://urn.fi/URN:NBN:fi:oulu-201801111060
Tiivistelmä
Communicating in English and using the social media platform Twitter have both become increasingly common all around the world, for example the Nordic countries. As a site of authentic language material, Twitter is very popular among researchers. Moreover, the Twitter Application Programming Interface (API) is very accessible, and it is relatively easy to write programming scripts for collecting large amounts of Twitter data. However, the topic of swearing on Twitter has not attracted much attention. This thesis investigates a limited set of swear words and their derivatives, and how they are used on Twitter in the United States and the Nordic countries of Sweden, Norway, Denmark, and Finland. Two corpora of English tweets, originating from the US and the Nordic countries, were collected through the Twitter Streaming API, utilizing the programming language Python. The frequencies and relative frequencies of swear words in both corpora were calculated with the computer software WordSmith Tools, and compared with each other. The results from the relatively small samples indicate that people from the US swear more on Twitter, and also use more offensive swear words. Descriptions of numerous future research opportunities conclude this thesis. Englannin käyttö kommunikaation kielenä ja Twitterin käyttö sosiaalisen median alustana ovat yleistyneet huomattavasti kaikkialla maailmassa, esimerkiksi Pohjoismaissa. Tutkijoiden keskuudessa Twitter on hyvin suosittu autenttisen kielimateriaalin lähteenä. Tämän lisäksi Twitterin ohjelmointirajapinta (engl. API) on helposti lähestyttävä, ja tietokoneohjelmien laatiminen suurien datamäärien keräämiseksi on suhteellisen vaivatonta. Silti, kiroileminen Twitterissä on todella vähän tutkittu aihe. Tämä tutkielma keskittyy rajoitettuun joukkoon kirosanoja ja niiden johdannaisia, ja tutkii niiden käyttöä Twitterissä Yhdysvalloissa ja neljässä Pohjoismaassa: Ruotsissa, Norjassa, Tanskassa ja Suomessa. Näissä maissa kirjoitetuista englanninkielisistä tviiteistä koottiin kaksi korpusta, hyödyntäen Python-ohjelmointikieltä ja Twitterin Streaming API:tä. Kirosanojen esiintymistaajuudet ja suhteelliset esiintymistaajuudet molemmissa korpuksissa laskettiin tietokoneohjelma WordSmith Tools -tietokoneohjelman avulla, ja saatuja lukuja verrattiin keskenään. Suhteellisen pienestä otannasta saatujen tulosten mukaan yhdysvaltalaiset ihmiset kiroilevat enemmän Twitterissä, ja käyttävät myös loukkaavampia kirosanoja. Lukuisten mahdollisten jatkotutkimusaiheiden kuvaukset päättävät tämän tutkielman.
Kokoelmat
- Avoin saatavuus [34547]