Hyppää sisältöön
    • FI
    • ENG
  • FI
  • /
  • EN
OuluREPO – Oulun yliopiston julkaisuarkisto / University of Oulu repository
Näytä viite 
  •   OuluREPO etusivu
  • Oulun yliopisto
  • Avoin saatavuus
  • Näytä viite
  •   OuluREPO etusivu
  • Oulun yliopisto
  • Avoin saatavuus
  • Näytä viite
JavaScript is disabled for your browser. Some features of this site may not work without it.

Deep Learning for Visual Speech Analysis: A Survey

Sheng, Changchong; Kuang, Gangyao; Bai, Liang; Hou, Chenping; Guo, Yulan; Xu, Xin; Pietikäinen, Matti; Liu, Li (2024-03-13)

 
Avaa tiedosto
nbnfioulu-202403272465.pdf (3.958Mt)
Lataukset: 

URL:
https://doi.org/10.1109/TPAMI.2024.3376710

Sheng, Changchong
Kuang, Gangyao
Bai, Liang
Hou, Chenping
Guo, Yulan
Xu, Xin
Pietikäinen, Matti
Liu, Li
IEEE
13.03.2024

C. Sheng et al., "Deep Learning for Visual Speech Analysis: A Survey," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 46, no. 9, pp. 6001-6022, Sept. 2024, doi: 10.1109/TPAMI.2024.3376710.

https://rightsstatements.org/vocab/InC/1.0/
© 2024 IEEE. Personal use of this material is permitted. Permission from IEEE must be obtained for all other uses, in any current or future media, including reprinting/republishing this material for advertising or promotional purposes, creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works.
https://rightsstatements.org/vocab/InC/1.0/
doi:https://doi.org/10.1109/tpami.2024.3376710
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202403272465
Tiivistelmä
Abstract

Visual speech, referring to the visual domain of speech, has attracted increasing attention due to its wide applications, such as public security, medical treatment, military defense, and film entertainment. As a powerful AI strategy, deep learning techniques have extensively promoted the development of visual speech learning. Over the past five years, numerous deep learning based methods have been proposed to address various problems in this area, especially automatic visual speech recognition and generation. To push forward future research on visual speech, this paper will present a comprehensive review of recent progress in deep learning methods on visual speech analysis. We cover different aspects of visual speech, including fundamental problems, challenges, benchmark datasets, a taxonomy of existing methods, and state-of-the-art performance. Besides, we also identify gaps in current research and discuss inspiring future research directions.
Kokoelmat
  • Avoin saatavuus [37798]
oulurepo@oulu.fiOulun yliopiston kirjastoOuluCRISLaturiMuuntaja
SaavutettavuusselosteTietosuojailmoitusYlläpidon kirjautuminen
 

Selaa kokoelmaa

NimekkeetTekijätJulkaisuajatAsiasanatUusimmatSivukartta

Omat tiedot

Kirjaudu sisäänRekisteröidy
oulurepo@oulu.fiOulun yliopiston kirjastoOuluCRISLaturiMuuntaja
SaavutettavuusselosteTietosuojailmoitusYlläpidon kirjautuminen