Change search
ReferencesLink to record
Permanent link

Direct link
Enhancement and optimization of speech pick-up using vibration sensor and microphone
KTH, School of Electrical Engineering (EES).
2016 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

In recent years, various auxiliary acoustic and non-acoustic sensors have been used for enhancing the speech quality in noisy environment. Among those sen-sors, the bone conducted (BC) microphone, in our case the Sonion vibration sensor, obtains speech signal through the vibration of the human skull, and thus unlike conventional microphone speech, is typically less affected by exter-nal noise, making it attractive for digital communication applications using as an alternative or a complement to regular air-conducted (AC) microphone in noisy situations. However, the BC speech levels are significantly lower than the normal speech counterparts in the region of frequencies higher than 1 kHz due to transmission loss, therefore the BC signal suffers relatively low speech quality and is not recommended for direct use in communication. In this the-sis, the characteristics of BC speech acquired from the vibration sensor are studied, including distortion in frequency domain, noise immunity and effect of articulation. By employing the noise rejection property of BC microphone, a real-time automatic on/off scheme based on the voice activity detection (VAD) using narrowband BC speech signal is presented. Since vibration sensor is an optimized accelerometer in essence, tap on the vibration sensor is significantly different from speech activity in terms of magnitude and time interval, thus can be distinguished from speech and noise. This thesis incorporates single tap and double tap detection capabilities on the vibration sensor as inputs to hearing device allowing users to enjoy an easier interaction with the device. This re-port also gives an overview of the speech enhancement algorithms supported by bone conduction microphone. A phone-dependent equalization method for BC speech taking the articulation dependency into consideration is proposed. Equalization improves speech quality in extremely low SNR conditions but has limited effect when SNR gets higher. Then the equalized BC speech is used combined with noisy AC speech for speech enhancement in an extended DD approach for a prior SNR estimation using Wiener filter. Experiments are con-ducted on simultaneously recorded air-conducted and bone-conducted speech in various noise environments. The resulting speech estimation is evaluated via spectrogram, segmental SNR and speech intelligibility index. We show that the algorithm using equalized BC speech together with noisy AC speech in ex-tended DD approach can operate effectively even under low SNR conditions, and generally outperforms the other methods.

Abstract [sv]

På senare år, olika hjälp akustisk och icke-akustiska sensorer har använts för att förbättra talkvaliteten i bullrig miljö. Bland dessa sensorer, ben fördes (BC) mikrofon, i vårt fall Sonion vibrationssensor , erhåller talsignalen genom vibrationer i mänsklig skalle, och därmed till skillnad från konventionell mikrofon tal, finns typiskt mindre påverkas av yttre buller, tillverkning gör det attraktivt för digitala kommunikationstillämpningar som använder som ett alternativ eller komplement till vanlig luftgenomförs (AC) mikrofon i bullriga miljöer. Men BC tal nivåerna är betydligt lägre än de normala tal motsvarigheter i regionen frekvenser högre än 1 kHz på grund av transmissionsförlust, därför BC-signalen lider relativt låg talkvalitet och finns Inte rekommenderad för direkt kommunikation. I denna avhandling, egenskaperna hos BC tal förvärvade från vibrationssensor är studeras, inklusive distorsion i frekvensdomänen , buller immunitet och effekten av artikulation. Genom att använda brusundertryckning egendom BC mikrofon, en realtids automatisk on / off schema baserat på röstaktivitetsdetektering (VAD) med användning av smalbandig BC talsignal är presenterad. Eftersom vibrationssensor finns en optimerad accelerometer i huvudsak, Eftersom vibrationssensor finns en optimerad accelerometer i huvudsak, kran på vibrationssensor finns signifikant skild från talaktiviteten i fråga om omfattning och tidsintervall, vilket kan skiljas från tal och buller. Denna avhandling innehåller enda tryck och dubbla funktioner peka upptäckt på vibrationssensor som indata till hörapparat, så att användarna kan njuta av en lättare interaktion med enheten. Denna rapport ger också en översikt över de tal förbättringsalgoritmer som stöds av käkbensmikrofon. En telefon beroende utjämning metod för BC tal tar artikulation beroendet beaktas freslås. Utjämning förbättra talkvalitet i extremt låga SNR förhållanden, men har begränsad effekt när SNR blir högre. Då equalizer BC tal är används i kombination med bullriga AC tal för förbättrad taluppfattning i en förlängd DD strategi för a priori SNR uppskattning med hjälp av Wiener-filter. Experiments är utförs på samtidigt registreras luftledningen och ben genomförd tal i olika bullermiljöer. Den resulterande tal uppskattning finns utvärderas via spektrogram, segment SNR och taluppfattbarhet index. Vi visar att algoritmen använder utjämnade BC tal tillsammans med bullriga AC tal i utökad DD strategi kan fungera effektivt även under låga SNR förhållanden, och i allmänhet överträffar de andra metoderna.

Place, publisher, year, edition, pages
2016. , 51 p.
Series
EES Examensarbete / Master Thesis, TRITA-EE 2016:112
National Category
Electrical Engineering, Electronic Engineering, Information Engineering
Identifiers
URN: urn:nbn:se:kth:diva-195168OAI: oai:DiVA.org:kth-195168DiVA: diva2:1044199
External cooperation
Sonion NL
Examiners
Available from: 2016-11-02 Created: 2016-11-02 Last updated: 2016-11-15Bibliographically approved

Open Access in DiVA

fulltext(1974 kB)15 downloads
File information
File name FULLTEXT01.pdfFile size 1974 kBChecksum SHA-512
9eb5f8622e1765af413477cdecc9961fbbddd4c52b734e13200dd2e4d2a046d779838714034d78fd6fc8be60cac1248d60ce9da9995ac9b88535d1e88debc794
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering (EES)
Electrical Engineering, Electronic Engineering, Information Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 15 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 13 hits
ReferencesLink to record
Permanent link

Direct link