Humanoidirobotin puheentunnistussovellus meluisassa ympäristössä
Romppainen, Veikko; Haataja, Ida (2024-06-14)
Romppainen, Veikko
Haataja, Ida
V. Romppainen; I. Haataja
14.06.2024
© 2024 Veikko Romppainen, Ida Haataja. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202406174654
https://urn.fi/URN:NBN:fi:oulu-202406174654
Tiivistelmä
Ihmisten ja robottien välinen vuorovaikutus sekä sosiaaliset robotit ovat kehittyneet merkittävästi vuosien varrella. Robotit kykenevät ymmärtämään puhetta sekä keskustelemaan sujuvasti ihmisten kanssa, ja ne toimivatkin jo laajasti eri tehtävien, kuten asiakaspalvelun parissa. Tärkeä osa sosiaalisia robotteja ovat toimiva puheentunnistusjärjestelmä kuin myös kehittynyt keskustelutekoäly.
Tässä opinnäytetyössä kehitettiin 3d-tulostettuun InMoov-robottiin puheentunnistusjärjestelmä sekä sen kanssa toimiva keskustelutekoäly. Robotin on tarkoitus olla osana esittelemässä tietotekniikan alaa Oulun yliopiston Hakijan päivillä messumaisessa ympäristössä. Ympäristön takia melunsuodatus on tärkeä osa puheentunnistusjärjestelmän toteutusta. Työssä hyödynnetään puheentunnistukseen valmista Python-ohjelmointikielen SpeechRecognition -kirjastoa sekä keskustelutekoälyä varten ChatterBot -kirjastoa.
Työn tuloksena robotille saatiin kehitettyä toimiva puheentunnistusjärjestelmä sekä yksinkertainen sääntöpohjainen keskustelutekoäly, joiden ansiosta robotti kykenee toimimaan sille tarkoitetussa ympäristössä. Järjestelmät tosin vaativat vielä jatkokehitystä melunsuodatuksen ja erityisesti keskustelutekoälyn osalta, jotta robotti hallitsisi laajemman sanavaraston ja siten kykenisi sujuvampaan vuorovaikutukseen ihmisten kanssa. Lisäksi ihmismäisemmän kokemuksen luomiseksi muun muassa robotin eleiden olisi hyvä toimia synkronoidusti puheen kanssa.
Tässä opinnäytetyössä kehitettiin 3d-tulostettuun InMoov-robottiin puheentunnistusjärjestelmä sekä sen kanssa toimiva keskustelutekoäly. Robotin on tarkoitus olla osana esittelemässä tietotekniikan alaa Oulun yliopiston Hakijan päivillä messumaisessa ympäristössä. Ympäristön takia melunsuodatus on tärkeä osa puheentunnistusjärjestelmän toteutusta. Työssä hyödynnetään puheentunnistukseen valmista Python-ohjelmointikielen SpeechRecognition -kirjastoa sekä keskustelutekoälyä varten ChatterBot -kirjastoa.
Työn tuloksena robotille saatiin kehitettyä toimiva puheentunnistusjärjestelmä sekä yksinkertainen sääntöpohjainen keskustelutekoäly, joiden ansiosta robotti kykenee toimimaan sille tarkoitetussa ympäristössä. Järjestelmät tosin vaativat vielä jatkokehitystä melunsuodatuksen ja erityisesti keskustelutekoälyn osalta, jotta robotti hallitsisi laajemman sanavaraston ja siten kykenisi sujuvampaan vuorovaikutukseen ihmisten kanssa. Lisäksi ihmismäisemmän kokemuksen luomiseksi muun muassa robotin eleiden olisi hyvä toimia synkronoidusti puheen kanssa.
Kokoelmat
- Avoin saatavuus [36616]