Digitala Vetenskapliga Arkivet

Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Exploring the Predictability of Non-Unique Acoustic-to-Articulatory Mappings
KTH, Skolan för datavetenskap och kommunikation (CSC), Tal, musik och hörsel, TMH.
KTH, Skolan för datavetenskap och kommunikation (CSC), Tal, musik och hörsel, TMH.ORCID-id: 0000-0003-4532-014X
KTH, Skolan för datavetenskap och kommunikation (CSC), Tal, musik och hörsel, TMH.
2012 (Engelska)Ingår i: IEEE Transactions on Audio, Speech, and Language Processing, ISSN 1558-7916, E-ISSN 1558-7924, Vol. 20, nr 10, s. 2672-2682Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

This paper explores statistical tools that help analyze the predictability in the acoustic-to-articulatory inversion of speech, using an Electromagnetic Articulography database of simultaneously recorded acoustic and articulatory data. Since it has been shown that speech acoustics can be mapped to non-unique articulatory modes, the variance of the articulatory parameters is not sufficient to understand the predictability of the inverse mapping. We, therefore, estimate an upper bound to the conditional entropy of the articulatory distribution. This provides a probabilistic estimate of the range of articulatory values (either over a continuum or over discrete non-unique regions) for a given acoustic vector in the database. The analysis is performed for different British/Scottish English consonants with respect to which articulators (lips, jaws or the tongue) are important for producing the phoneme. The paper shows that acoustic-articulatory mappings for the important articulators have a low upper bound on the entropy, but can still have discrete non-unique configurations.

Ort, förlag, år, upplaga, sidor
2012. Vol. 20, nr 10, s. 2672-2682
Nyckelord [en]
Acoustic-to-articulatory inversion, entropy of GMM (Gaussian mixture model), many-to-one-mapping
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Identifikatorer
URN: urn:nbn:se:kth:diva-104992DOI: 10.1109/TASL.2012.2210876ISI: 000309600500005Scopus ID: 2-s2.0-84867169172OAI: oai:DiVA.org:kth-104992DiVA, id: diva2:570068
Forskningsfinansiär
Vetenskapsrådet, 80449001
Anmärkning

QC 20121116

Tillgänglig från: 2012-11-16 Skapad: 2012-11-15 Senast uppdaterad: 2018-01-12Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltextScopus

Sök vidare i DiVA

Av författaren/redaktören
Ananthakrishnan, GopalEngwall, OlovNeiberg, Daniel
Av organisationen
Tal, musik och hörsel, TMH
I samma tidskrift
IEEE Transactions on Audio, Speech, and Language Processing
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 382 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf