Kohteentunnistusohjattu kuvanparannus
Latva, Roni (2024-10-16)
Latva, Roni
R. Latva
16.10.2024
© 2024 Roni Latva. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202410166354
https://urn.fi/URN:NBN:fi:oulu-202410166354
Tiivistelmä
Tekoälypohjaisista kohteentunnistusohjelmistoista on tullut merkittävä osa nyky-yhteiskunnan toimintaa. Näitä ohjelmistoja hyödynnetään muun muassa turvallisuusjärjestelmissä, autonomisessa ajamisessa ja lääketieteellisessä kuva-analyysissä. Yksi keskeisistä haasteista tämän teknologian osalta on riittävän kuvanlaadun varmistaminen haastavissa kuvantamisolosuhteissa, kuten pimeässä valaistuksessa, jolloin kuvaan muodostuva kohina voi heikentää kohteentunnistuksen tarkkuutta voimakkaasti.
Tähän haasteeseen voidaan vastata niin ikään tekoälyyn pohjautuvilla menetelmillä, jotka oppivat poistamaan kuvasta kohinaa lukuisten kohinaisten ja puhtaiden kuvien muodostamien kuvaparien statistiikkaa mallintamalla. Kuvanparannusneuroverkkojen minimoimat häviökomponentit perustuvat tyypillisesti ihmisten aistimaa kuvanlaatua mittaaviin suureisiin kuten signaali-kohinasuhteeseen, eivätkä ne huomioi eksplisiittisesti parannuksen jälkeisten konenäkötehtävien tarpeita. Tässä diplomityössä selvitetään, miten kohteentunnistusmetriikoista johdettuja häviökomponentteja voidaan käyttää kuvanparannusprosessin ohjaamiseen, jotta sen tuottamat kuvat olisivat jatkotehtävien näkökulmasta optimaalisia.
Tulokset osoittavat, että ehdotetulla kuvanparannusmenetelmällä saavutetaan korkeampi kohteentunnistussuorituskyky verrattuna pelkkään kohinanpoistoon tilanteissa, joissa kohinataso on korkea. Oikealla kohinanpoisto- ja kohteentunnistushäviöiden välisellä painotuksella koulutettu verkko tuottaa terävämpiä ja korkeamman kontrastin omaavia kuvia, joista kohteiden tunnistus on helpompaa. Tarkkuuden parannus ei myöskään johda kuvanlaadun heikkenemiseen vaan jopa kasvattaa sitä tarkasteltujen metriikkojen perusteella.
Tähän haasteeseen voidaan vastata niin ikään tekoälyyn pohjautuvilla menetelmillä, jotka oppivat poistamaan kuvasta kohinaa lukuisten kohinaisten ja puhtaiden kuvien muodostamien kuvaparien statistiikkaa mallintamalla. Kuvanparannusneuroverkkojen minimoimat häviökomponentit perustuvat tyypillisesti ihmisten aistimaa kuvanlaatua mittaaviin suureisiin kuten signaali-kohinasuhteeseen, eivätkä ne huomioi eksplisiittisesti parannuksen jälkeisten konenäkötehtävien tarpeita. Tässä diplomityössä selvitetään, miten kohteentunnistusmetriikoista johdettuja häviökomponentteja voidaan käyttää kuvanparannusprosessin ohjaamiseen, jotta sen tuottamat kuvat olisivat jatkotehtävien näkökulmasta optimaalisia.
Tulokset osoittavat, että ehdotetulla kuvanparannusmenetelmällä saavutetaan korkeampi kohteentunnistussuorituskyky verrattuna pelkkään kohinanpoistoon tilanteissa, joissa kohinataso on korkea. Oikealla kohinanpoisto- ja kohteentunnistushäviöiden välisellä painotuksella koulutettu verkko tuottaa terävämpiä ja korkeamman kontrastin omaavia kuvia, joista kohteiden tunnistus on helpompaa. Tarkkuuden parannus ei myöskään johda kuvanlaadun heikkenemiseen vaan jopa kasvattaa sitä tarkasteltujen metriikkojen perusteella.
Kokoelmat
- Avoin saatavuus [38840]