Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Augmented Reality Stationary Platform Controlled by Image Processing Interface
KTH, School of Electrical Engineering and Computer Science (EECS).
2018 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

The development of dynamic and user-friendly embedded platforms for game rooms requires resource efficient software that successfully delivers a satisfying experience. Noran AB wants to make it inclusive and handicap-oriented. Augmented reality integrated with image recognition powered by OpenCV offers a plausible solution, where a virtual robot can be controlled through head movements. A functional prototype is developed and experiments with users are forwarded and documented. The focus of this work is to identify and evaluate criteria to manipulate the performance of the image processing algorithm for feature detection. This has been established knowing that an individual image is usually scanned by a relatively small filter. Reducing the image size would therefore reduce the area to scan. The time the algorithm would take to go through the whole matrix of pixels would be directly reduced. From user input, the sequence of images has been shrunk from 307 200 down to 117 pixels going through 10 intermediate steps, the average time to detect a face for a specific frame size is registered. A correlation between the size and the time to detect the face should be found. This is compared with the detection rate of each frame size, which confirms if in this case the algorithm was successfully executed with respect to the original resolution. Detection performance can, therefore, be improved by achieving a higher detection speed with no hardware enhancements. The experience is also analyzed through feedback and behavior of the user, both collected or observed during the experiments. Results lead to finding a lower image size that still satisfies the same detection rate as the original resolution and to figure out how the interface can be further improved.

Abstract [sv]

Utvecklingen av dynamiska och användarvänliga plattformar för fysiska spelrum kräver programvara som ger en stabil och bra upplevelse. Noran AB vill erbjuda handikappanpassade funktioner med hjälp av integrerad bildigenkänning som drivs av OpenCV. Systemet visar en virtuell robot kan styras genom huvudrörelser. En funktionell prototyp utvecklas och experiment med användare genomförs och dokumenteras. Inriktningen för detta arbete är att identifiera och utvärdera kriterier för att manipulera bildhanteringsalgoritmens prestanda för funktionsdetektering. Det har fastställts att en enskild digital bild vanligtvis skannas av ett relativt litet filter. Att minska bildstorleken skulle därför också minska området att skanna. Den tid som algoritmen skulle ta för att gå igenom hela matrixen av pixlar skulle minskas direkt. Från användarinmatning har sekvensen av bilder krympt från 307 200 ner till 117 pixlar genom 10 mellansteg, den genomsnittliga tiden för att upptäcka ett ansikte för en viss bildstorlek registreras. En korrelation mellan storlek och tid för att upptäcka ansiktet bör hittas. Detta jämförs med detekteringsgraden för varje ramstorlek, vilket bekräftar om i detta fall exekveringen av algoritmen utfördes med avseende på originalupplösning. Detekteringsprestanda kan därför förbättras genom att uppnå en högre detekteringshastighet utan några hårdvaruförbättringar. Erfarenheten analyseras också genom användarens feedback och beteende, båda samlade eller observerade under experimenten. Resultat leder till att hitta en lägre bildstorlek som fortfarande uppfyller samma detekteringsnivå som den ursprungliga upplösningen och för att se hur gränssnittet kan förbättras ytterligare.

Place, publisher, year, edition, pages
2018. , p. 60
Series
TRITA-EECS-EX ; 2018:686
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-254878OAI: oai:DiVA.org:kth-254878DiVA, id: diva2:1335821
Subject / course
Computer Science
Educational program
Degree of Master
Supervisors
Examiners
Available from: 2019-07-08 Created: 2019-07-08 Last updated: 2019-07-08Bibliographically approved

Open Access in DiVA

fulltext(6790 kB)19 downloads
File information
File name FULLTEXT01.pdfFile size 6790 kBChecksum SHA-512
4de1e15289875c05eff2afa1bcc2ab737f2e8b19f302c8eeb17e5e040e77bd814fbdf66c79d53fdedfdcc4ff67a1df7ed68ac594d48052efef13d9ae9c06a855
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 19 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 49 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf