Ekoakustinen luokittelija : äänimaiseman äänityypit luokittelevan koneoppimismallin suunnittelu ja toteutus
Mäkitalo, Mikko (2024-11-14)
Mäkitalo, Mikko
M. Mäkitalo
14.11.2024
© 2024 Mikko Mäkitalo. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202411146746
https://urn.fi/URN:NBN:fi:oulu-202411146746
Tiivistelmä
Ihmisen toiminnan vaikutukset ovat nähtävissä ympäristössämme monilla tavoilla. Vaikka ympäristömelun vaikutukset ihmisiin ja ympäröivään luontoon on tunnettu jo pidempään, on vasta viime aikoina tultu tietoisiksi äänen vaikutuksista ympäristöön huomattavasti melua laajemmassa mittakaavassa. Ekoakustiikka on monitieteellinen tieteenala, joka tutkii äänen aiheuttamia ympäristövaikutuksia laaja-alaisesti. Tieteenä ekoakustiikka yhdistää akustiikkaa, ekologiaa, tietojenkäsittelytiedettä ja biologiaa.
Ekoakustiikassa äänimaisemien äänet määritellään koostuviksi kolmesta äänityypistä, jotka ovat eläinperäisistä äänistä koostuva biofonia, elottoman luonnon äänistä muodostuva geofonia ja ihmisen tuottama elektromekaaninen antropofonia. Yksittäisiä ääniä tunnistavia koneoppimismalleja on tutkittu suhteellisen paljon. Sen sijaan vähemmälle huomiolle aiemmassa tutkimuskirjallisuudessa ovat jääneet koneoppimismallit, jotka kykenevät tunnistamaan ja luokittelemaan äänimaiseman äänityypit. Tällaiselle luokittelijalle on tarvetta, sillä sen avulla saadaan tietoa ihmisen ääneen perustuvista vaikutuksista ympäristöön ja sitä voidaan käyttää meluntorjunnan, viihtyvyyden sekä ihmisten ja eläinlajien hyvinvoinnin kohentamiseen.
Tässä tutkielmassa kehitettiin ekoakustinen luokittelija, joka luokittelee äänimaiseman äänityypit. Kehitetty luokittelija perustuu akustiikan, signaalinkäsittelyn ja koneoppimisen menetelmiin. Tutkimuksessa keskityttiin erityisesti löytämään signaalinkäsittelymenetelmät, joita hyödyntämällä voitiin kouluttaa koneoppimismalli luokittelemaan äänimaisemista peräisin oleva äänidata äänityypeittäin. Tutkielmassa osoitettiin, minkälaisilla akustiikan, signaalinkäsittelyn ja koneoppimisen menetelmillä ekoakustinen luokittelija voidaan suunnitella ja ottaa käyttöön. Lisäksi osoitettiin datan huolellisen ja asiantuntevan esikäsittelyn merkitys koneoppimismallin kouluttamisen tehokkuudessa. In this master's thesis, an ecoacoustic classifier was developed to classify the sound types in a soundscape. The developed classifier is based on methods of acoustics, signal processing and machine learning. In particular, the research focused on finding signal processing methods that could be used to train a machine learning model to classify soundscape sound data by sound type. This study demonstrates which acoustics, signal processing and machine learning methods can be used to design and implement an ecoacoustic classifier. The importance of careful preprocessing of the data in the performance and accuracy of training the machine learning model is also demonstrated.
The effects of human activity can be seen in our environment in many ways. Although the effects of environmental noise have been recognized for some time, it is only recently that awareness of the impact of sound on the environment on a much larger scale has emerged. Ecoacoustics is a multidisciplinary field of science that studies the environmental impact of sound. As a science, it combines acoustics, ecology, computer science, soundscape science and biology.
In ecocoustics, the different sounds of soundscapes are defined as being composed of three types of sound: biophony, which consists of animal sounds; geophony, which consists of sounds from inanimate nature; and anthropophony, which is produced by human beings through electromechanical means. There has been a relatively large amount of research on machine learning models that recognise individual sounds. In contrast, machine learning models capable of identifying and classifying the sound types in a soundscape have received very little attention in the previous research literature. There is a need for such a classifier, as it provides information on human sound-based effects on the environment and can be used to improve noise reduction, comfort and the well-being of humans and animal species.
Ekoakustiikassa äänimaisemien äänet määritellään koostuviksi kolmesta äänityypistä, jotka ovat eläinperäisistä äänistä koostuva biofonia, elottoman luonnon äänistä muodostuva geofonia ja ihmisen tuottama elektromekaaninen antropofonia. Yksittäisiä ääniä tunnistavia koneoppimismalleja on tutkittu suhteellisen paljon. Sen sijaan vähemmälle huomiolle aiemmassa tutkimuskirjallisuudessa ovat jääneet koneoppimismallit, jotka kykenevät tunnistamaan ja luokittelemaan äänimaiseman äänityypit. Tällaiselle luokittelijalle on tarvetta, sillä sen avulla saadaan tietoa ihmisen ääneen perustuvista vaikutuksista ympäristöön ja sitä voidaan käyttää meluntorjunnan, viihtyvyyden sekä ihmisten ja eläinlajien hyvinvoinnin kohentamiseen.
Tässä tutkielmassa kehitettiin ekoakustinen luokittelija, joka luokittelee äänimaiseman äänityypit. Kehitetty luokittelija perustuu akustiikan, signaalinkäsittelyn ja koneoppimisen menetelmiin. Tutkimuksessa keskityttiin erityisesti löytämään signaalinkäsittelymenetelmät, joita hyödyntämällä voitiin kouluttaa koneoppimismalli luokittelemaan äänimaisemista peräisin oleva äänidata äänityypeittäin. Tutkielmassa osoitettiin, minkälaisilla akustiikan, signaalinkäsittelyn ja koneoppimisen menetelmillä ekoakustinen luokittelija voidaan suunnitella ja ottaa käyttöön. Lisäksi osoitettiin datan huolellisen ja asiantuntevan esikäsittelyn merkitys koneoppimismallin kouluttamisen tehokkuudessa.
The effects of human activity can be seen in our environment in many ways. Although the effects of environmental noise have been recognized for some time, it is only recently that awareness of the impact of sound on the environment on a much larger scale has emerged. Ecoacoustics is a multidisciplinary field of science that studies the environmental impact of sound. As a science, it combines acoustics, ecology, computer science, soundscape science and biology.
In ecocoustics, the different sounds of soundscapes are defined as being composed of three types of sound: biophony, which consists of animal sounds; geophony, which consists of sounds from inanimate nature; and anthropophony, which is produced by human beings through electromechanical means. There has been a relatively large amount of research on machine learning models that recognise individual sounds. In contrast, machine learning models capable of identifying and classifying the sound types in a soundscape have received very little attention in the previous research literature. There is a need for such a classifier, as it provides information on human sound-based effects on the environment and can be used to improve noise reduction, comfort and the well-being of humans and animal species.
Kokoelmat
- Avoin saatavuus [38865]