Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
3D Bounding Box Detection from Monocular Images
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
3D-objektdetektering från monokulära bilder (Swedish)
Abstract [en]

Object detection is particularly important in robotic applications that require interaction with the environment. Although 2D object detection methods obtain accurate results, these are not enough to provide a complete description of the 3D scenario. Therefore, many models have recently showed promising progress in this challenging field.

In this work, the goal is to predict 3D bounding boxes from single images without using temporal data or any explicit depth estimation. We propose an approach for 3D monocular object detection based on Deep3DBox. We replace the geometric constraints taken into account to predict the 3D location of objects by a deep learning module. Moreover, we undertake a study on the different parameters for the modules that are used to predict dimensions and orientation of objects.

We conduct experiments in order to search for the best hyperparameters of our model for KITTI cars and we report and compare our results on KITTI and the challenging NuScenes benchmarks for cars and pedestrians with other state of the art methods. Therefore, we conclude that our approach performs on par with similar methods and improves Deep3DBox results.

Abstract [sv]

Objektsdetektion är särskild viktigt i robotikapplikationer som kräver interaktion med miljön. Fastän metoder för objektssdetektion i 2D ger precisa resultat, så krävs det mer för en komplett beskrivning av 3D-scenariot. Därför har flera modeller nyligen visat lovande framsteg i detta utmanande område.

I detta arbete är målet att förutsäga inkapslande 3D-lådor från en bild utan användning av temporal data eller explicit beräkning av djup. Tillvägagångssättet vi föreslår för 3D monokulär objektsdetektion baseras på Deep3DBox. Vårt mål är att ersätta de geometriska gränserna som har använts för förutsägning av 3D-position med en djupinlärningsmodul. Dessutom genomför vi en studie på olika modulparametrar som används för förutsägelse av dimension och orientering av objekt.

Vi gör experiment för att finna de bästa hyperparametrarna för vår model för KITTI-bilar och vi rapporterar och jämför våra resultat med KITTI och NuScenes utmanande riktmärken för bilar och fotgängare med andra toppresterande metoder. Vi kan därför dra slutsatsen att vårt tillvägagångssätt presterar likvärdigt med liknande metoder och förbättrar Deep3DBox-resultaten.

Place, publisher, year, edition, pages
2019. , p. 50
Series
TRITA-EECS-EX ; 2019:503
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-261593OAI: oai:DiVA.org:kth-261593DiVA, id: diva2:1358670
External cooperation
Univrses AB
Supervisors
Examiners
Available from: 2019-10-08 Created: 2019-10-08 Last updated: 2019-10-08Bibliographically approved

Open Access in DiVA

fulltext(27588 kB)2 downloads
File information
File name FULLTEXT01.pdfFile size 27588 kBChecksum SHA-512
71d640fa8d5927282a5ff4cdab3abaa4fe2179627ba2cf12ecf9d2bf66d845b745449646a851afa6b3f24510a39f5ebdcbf0a26e7ed44a6103d6692c6246bdfb
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 2 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 19 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf