Myötäsyötteiset neuroverkot
Käyrä, Jimi (2023-06-14)
Käyrä, Jimi
J. Käyrä
14.06.2023
© 2023 Jimi Käyrä. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202306142451
https://urn.fi/URN:NBN:fi:oulu-202306142451
Tiivistelmä
Tämän kandidaatintutkielman tavoitteena on perehtyä neuraalilaskentaan, joka on koneoppimisen alalla laajasti käytetty ja erityisesti viime aikoina suosiotaan kasvattanut koneoppimisen menetelmä. Tutkielman alussa esitetään lyhyt johdatus koneoppimiseen aiheen taustan hahmottamiseksi. Neuraalilaskentaa toteutetaan keinotekoisilla neuroverkoilla, joista tässä työssä rajoitutaan tarkastelemaan myötäsyötteisiä neuroverkkoja. Myötäsyötteiset neuroverkot eivät sisällä syklejä, minkä ansiosta niillä on erityinen kerrosmainen rakenne. Keinotekoinen neuroverkko koostuu useista toisiinsa kytketyistä keinotekoisista neuroneista, jotka pohjautuvat karkeasti biologisen neuronin ja hermoston rakenteeseen sekä toimintaan.
Neuroverkon rakenteen tarkastelun lisäksi tutkielmassa perehdytään siihen, miten myötäsyötteisen neuroverkon lähtö määrätään syötteestä myötäsyöttöprosessin avulla. Myötäsyöttöprosessi etenee vaiheittain siten, että edeltävän kerroksen neuronien lähtöjä käytetään seuraavan kerroksen neuronien syötteinä. Näin jatkaen edetään verkon lähtökerrokseen, josta voidaan lukea koko verkon lähtö. Prosessi muotoillaan matriisiesitykseksi selkeyden ja laskentatehokkuudessa saavutettavien etujen vuoksi.
Lopuksi tarkastellaan neuroverkon opettamista. Työssä määritellään virhefunktio, joka kuvaa todellisten kohdemuuttujan arvojen ja verkon antamien ennusteiden välistä eroa. Tämän pohjalta neuroverkon opettaminen kuvataan optimointiongelmana, jossa tavoitteena on etsiä sellaiset malliparametrit, että virhefunktio saavuttaa pienimmän arvonsa. Tämä minimi etsitään gradienttilaskeutumisella, joka on eräs numeerinen optimointimenetelmä. Gradienttilaskeutumista varten tarvitaan virhefunktiosta malliparametrien suhteen lasketut osittaisderivaatat, jotka voidaan määrittää tehokkaasti vastavirta-algoritmin avulla. Vastavirta-algoritmin toiminnan tarkastelun jälkeen opetusalgoritmi kuvataan kokonaisuudessaan matriisimuodossa.
Neuroverkon rakenteen tarkastelun lisäksi tutkielmassa perehdytään siihen, miten myötäsyötteisen neuroverkon lähtö määrätään syötteestä myötäsyöttöprosessin avulla. Myötäsyöttöprosessi etenee vaiheittain siten, että edeltävän kerroksen neuronien lähtöjä käytetään seuraavan kerroksen neuronien syötteinä. Näin jatkaen edetään verkon lähtökerrokseen, josta voidaan lukea koko verkon lähtö. Prosessi muotoillaan matriisiesitykseksi selkeyden ja laskentatehokkuudessa saavutettavien etujen vuoksi.
Lopuksi tarkastellaan neuroverkon opettamista. Työssä määritellään virhefunktio, joka kuvaa todellisten kohdemuuttujan arvojen ja verkon antamien ennusteiden välistä eroa. Tämän pohjalta neuroverkon opettaminen kuvataan optimointiongelmana, jossa tavoitteena on etsiä sellaiset malliparametrit, että virhefunktio saavuttaa pienimmän arvonsa. Tämä minimi etsitään gradienttilaskeutumisella, joka on eräs numeerinen optimointimenetelmä. Gradienttilaskeutumista varten tarvitaan virhefunktiosta malliparametrien suhteen lasketut osittaisderivaatat, jotka voidaan määrittää tehokkaasti vastavirta-algoritmin avulla. Vastavirta-algoritmin toiminnan tarkastelun jälkeen opetusalgoritmi kuvataan kokonaisuudessaan matriisimuodossa.
Kokoelmat
- Avoin saatavuus [37957]