Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Predicting vehicle trajectories with inverse reinforcement learning
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Autonomous driving in urban environments is challenging because there are many agents located in the environment all with their own individual agendas. With accurate motion prediction of surrounding agents in the environment, autonomous vehicles can plan for more intelligent behaviors to achieve specified objectives, instead of acting in a purely reactive way. The objective of this master thesis is to predict the future states of vehicles in a road network. A machine learning method is developed for trajectory prediction that consists of two steps: the first step is an inverse reinforcement learning algorithm that determines the reward function corresponding to an expert driver behavior extracted from real world driving, the second step is a deep reinforcement learning module that associates high level policies based on vehicles observations. Regular drivers take into account many factors while making tactical driving decisions, which cannot always be represented by the conventional rule-based models. In this work, a novel approach to learn the driver behavior by extracting suitable features from the training dataset is proposed. The accuracy of predictions is evaluated using the NGSIM I-80 dataset. The results show that this framework outperforms a constant velocity model when predicting further than 6 seconds into the future.

Abstract [sv]

Autonom körning i stadsmiljöer är utmanande eftersom det finns många agenter i miljön, alla med egna individuella agendor. Med en exakt rörelseskattning av omgivande agenter i miljön, kan autonoma fordon planera för mer intelligenta beteenden för att uppnå specifika mål, istället för en reaktiv interaktion. Målet med denna mastersuppsats är att förutsäga framtida tillstånd för fordon i ett vägnät. En maskininlärningsmetod utvecklades för rörelseskattning, bestående av två steg: det första steget är en invers förstärkningslärande (inverse reinforcement learning) algoritm som bestämmer belöningsfunktionen som motsvarar en expertbilists beteende, extraherad från verklig data. Det andra steget är en djup förstärkningslärande modul som associerar en högnivåpolicy baserad på ett fordons observationer. Vanliga förare tar hänsyn till många faktorer samtidigt när de fattar taktiska körbeslut, vilket inte alltid kan representeras av konventionella regelbaserade modeller. I detta arbete föreslås ett nytt tillvägagångssätt för att lära sig förarbeteenden genom att extrahera lämpliga funktioner från träningsdatan. Precisionen av förutsägelser utvärderas med hjälp av datasetet NGSIM I-80. Resultaten visar att denna metod överträffar en konstant hastighetsmodell när man förutspår beteenden längre än 6 sekunder in i framtiden.

Place, publisher, year, edition, pages
2019. , p. 60
Series
TRITA-EECS-EX ; 2019:547
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-263154OAI: oai:DiVA.org:kth-263154DiVA, id: diva2:1366887
External cooperation
Scania
Supervisors
Examiners
Available from: 2019-11-18 Created: 2019-10-31 Last updated: 2019-11-18Bibliographically approved

Open Access in DiVA

fulltext(1454 kB)14 downloads
File information
File name FULLTEXT01.pdfFile size 1454 kBChecksum SHA-512
3c003d0277bab873961bd2ec9e555e7208cd23f424e4ce2ef12c5cea01d6fc93d74c290704b1c79d5c3b8bea4087a4764190d51cf29ae822bac7fe82fdca82c4
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 14 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 116 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf