Change search
ReferencesLink to record
Permanent link

Direct link
Natural image distortions and optical character recognition accuracy
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2016 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Förvrängningar av naturliga bilder ochträffsäkerhet hos optiskteckenigenkänning (Swedish)
Abstract [en]

Current state of the art optical character recognition tools are trained using high quality image datasets. In practical applications, natural images used for character recognition willnot always be of high quality. This report examines the accuracy of a state of the art optical character recognition tool using three distorted natural image datasets. The performed distortions were lossy JPEG compression, contrast reduction and white gaussian noise injection. The accuracy is presented as an average percentage of correct and located text using the Levenshtein distance algorithm. The results indicate that white gaussian noise injection significantly reduced OCR accuracy. On the other hand, lossy JPEG compressionand contrast reduction had a similar, but less of an effect.

Abstract [sv]

Nuvarande moderna verktyg för optisk teckenigenkänning tränas med bilder av hög kvalité. I praktiska situationer kommer naturliga bilder som används för optisk teckenigenkänning inte alltid vara av hög kvalité. Denna rapport använder tre förvrängda datauppsättningar av naturliga bilder för att utvärdera träffsäkerheten hos ett modernt verktyg för optiskteckenigenkänning. De utförda förvrängningarna var förstörande JPEG komprimering, kontrastreducering och injektion av vitt gaussiskt brus. Träffsäkerheten presenteras som en genomsnittlig procentenhet av korrekt och lokaliserad text genom användning av algoritmen Levenshteinavstånd. Resultaten indikerar att injektion av vitt gaussiskt brus försämrade träffsäkerheten hos optisk teckenigenkänning avsevärt. Vidare hade förstörande JPEG­ komprimering och kontrastreducering en liknande, men mindre, effekt.

Place, publisher, year, edition, pages
National Category
Computer Science
URN: urn:nbn:se:kth:diva-187234OAI: diva2:929325
Available from: 2016-05-18 Created: 2016-05-18 Last updated: 2016-05-18Bibliographically approved

Open Access in DiVA

fulltext(3946 kB)36 downloads
File information
File name FULLTEXT01.pdfFile size 3946 kBChecksum SHA-512
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 36 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 64 hits
ReferencesLink to record
Permanent link

Direct link