Visuaaliset kehoteinjektiot tekoälyjä vastaan
Rosberg, Christian; Sarala, Severi; Nikula, Miko (2025-06-03)
Rosberg, Christian
Sarala, Severi
Nikula, Miko
C. Rosberg; S. Sarala; M. Nikula
03.06.2025
© 2025 Christian Rosberg, Severi Sarala, Miko Nikula. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202506034082
https://urn.fi/URN:NBN:fi:oulu-202506034082
Tiivistelmä
Tässä kandidaatintyössä tutkitaan tekoälyjen haavoittuvuuksia. Aihe on ajankohtainen tekoälymallien lisääntyessä yleisessä käytössä, ja malleja kehitetään jatkuvasti. Työn teoriaosuudessa esittelemme yleiset tekoälymalleja vastaan käytetyt hyökkäysmenetelmät. Tuomme esille myös edellisiä tutkimuksia visuaalisista kehoteinjektioista ja niiden tuloksista. Ne ovat myös tuoneet esille uusia tapoja hyökätä tekoälymalleja vastaan. Teknisessä toteutuksessa lähetämme ottamiamme kuvia sekä englanniksi että suomeksi tekoälymalleille. Käytämme joko tekoälymallien nettisivuja tai ajamme mallia omilla koneillamme Lmstudiolla. Lopuksi vertailemme vastauksia toisiinsa sekä kuinka hyvin injektiomme toimi ja vedämme tästä johtopäätöksiä mallien puolustuksista visuaalista kehoteinjektiota vastaan. Tuloksissa havaitsimme, kuinka ChatGPT on altis visuaaliselle kehoteinjektiolle.
Kokoelmat
- Avoin saatavuus [38618]