Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Evaluation of the Effects of Different Preprocessing Methods on OCR Results from Images with Varying Quality
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Utvärdering av effekterna av olika förbehandlingsmetoder på resultatet från OCR i bilder med varierande kvalitet (Swedish)
Abstract [en]

Counterfeited products present a serious problem in many aspects of society. More specifically, counterfeited mechanical components in machines and structures can cause great health risks. For consumers it can be very difficult to identify a counterfeited product, and many industries try to find ways to easily detect a counterfeit. One straightforward way of finding counterfeits is reading the information on the product box and confirming that it is valid. This thesis project explores the effect of different image preprocessing methods on the results of existing Optical Character Recognition engines (OCR). The study is done by applying preprocessing methods, one by one, to images of product boxes and sending them to two different OCR engines, Tesseract OCR and Microsoft Azure’s OCR engine. The results show that for Tesseract OCR, preprocessing is improving the performance regarding correctly read characters in the image. For Azure OCR however, some care has to be taken to not interfere with Azure’s internal processing. Cropping of the images as a preprocessing method stood out as most promising but needs some further development. Usage of OCR for counterfeit detection is possible but the types of images and OCR engines used must be considered when deciding on preprocessing methods.

Abstract [sv]

Förfalskade produkter är ett allvarligt problem i många delar av samhället. Förfalskade mekaniska komponenter i maskiner och byggnader kan medföra stora hälsorisker. För konsumenter kan det vara mycket svårt att identifiera en förfalskad produkt och många branscher försöker hitta sätt att enkelt upptäcka förfalskningar. Ett enkelt sätt att upptäcka förfalskningar vore att läsa in informationen på produktetiketten och bekräfta att informationen är giltig. Det här examensarbetet har utforskat effekten av olika förbehandlingsmetoder för bilder på resultaten av befintliga teckenigenkänningsmotorer (OCR). Undersökningen gjordes genom att applicera förbehandlingsmetoderna, en efter en, på bilder av produktlådor och skicka bilderna till två olika OCR-motorer, Tesseract OCR och Microsoft Azures OCR-motor. Resultaten visar att för Tesseract OCR förbättrar förbehandlingen prestandan när det gäller att korrekt läsa in texten i bilden. För Azure OCR måste dock en viss försiktighet iakttas för att inte påverka dess interna förbehandlingsmetoder. Beskärning av bilderna som förbehandlingsmetod utmärkte sig den mest lovande, men den behöver en viss vidareutveckling. Användning av OCR för upptäckande av falska produkter är möjlig men de typer av bilder och OCR-motorer som används måste has i åtanke vid beslut om vilka förbehandlingsmetoder som skall användas.

Place, publisher, year, edition, pages
2019. , p. 43
Series
TRITA-EECS-EX ; 2019:562
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-263319OAI: oai:DiVA.org:kth-263319DiVA, id: diva2:1368177
External cooperation
Random Forest AB
Supervisors
Examiners
Available from: 2019-11-22 Created: 2019-11-06 Last updated: 2019-11-22Bibliographically approved

Open Access in DiVA

fulltext(12353 kB)7 downloads
File information
File name FULLTEXT01.pdfFile size 12353 kBChecksum SHA-512
242be20ed0219a0b9b12f06ff31aabb75f540543def73846c0d763c7212d35fc2519a5af77a16d385b1c80f84d122aebd249c5778c1f03af02a63ce8e3af8c0f
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 7 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 11 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf