Digitala Vetenskapliga Arkivet

Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Using Graph Neural Network to Analyze Multi-Relational Objects in Dynamic Driving Scenarios
KTH, School of Industrial Engineering and Management (ITM), Engineering Design.
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Användning av grafiska neurala nätverk för att analysera multirelationella objekt i dynamiska körscenarier (Swedish)
Abstract [en]

Understanding dynamic driving scenarios poses significant challenges in the development of Automated Driving Systems (ADS). ADS need to perceive crucial information from dynamic driving scenarios to maintain functional safety. The information from the scenarios is perceived through sensors (e.g., cameras, IMU, LiDAR) and is usually unstructured data. Current approaches often rely on Convolutional Neural Networks (CNNs) to process this data. However, while CNNs are effective at handling unstructured sensor inputs, they struggle to capture the complex relational dynamics between traffic participants, which are crucial for a deeper understanding of the driving environment. To address this gap, Graph Neural Networks (GNNs), designed for relational data, offer a promising alternative. This thesis proposes a framework by adopting Relational Graph Convolutional Networks (RGCNs), a special-designed GNNs for relational data, to understand the relational data regarding dynamic driving scenarios. Specifically, by categorizing the types of traffic participants, a workflow is designed to convert unstructured data into spatial relational data. By analyzing the frames within a time series using the rule-based approach, the spatial relational data is converted into spatial-temporal relational data. Next, the RGCNs model infers the behaviours of the traffic participants and the relationships among them. As results, with the adoption of the RGCNs, the framework outperforms in classifying nodes and predicting their relationships in the open-source real-world dataset. Compared to classic Graph Convolutional Networks (GCNs), the proposed methods achieve an improvement of about 10% in prediction accuracy, increasing from 0.77 to 0.85 in node classification, and from 0.74 to 0.82 in link prediction. Furthermore, apart from the tasks on node classification and link prediction, this thesis supports the reasoning of unknown conditions by encoding known relationships with a top-1 accuracy of 0.78 and hits@2 of 0.91, which can help improve comprehension of the risk of the scenario.

Abstract [sv]

Förståelsen av dynamiska körscenarier innebär betydande utmaningar vid utvecklingen av Automatiserade Körsystem. Automatiserade Körsystem behöver uppfatta viktig information från dynamiska körscenarier för att upprätthålla funktionell säkerhet. Informationen från scenarierna uppfattas genom sensorer (t.ex. kameror, IMU, LiDAR) och är vanligtvis ostrukturerad data. Nuvarande tillvägagångssätt förlitar sig ofta på CNN-modeller för att bearbeta denna data. Men även om CNN-modeller är effektiva på att hantera ostrukturerade sensorinmatningar, har de svårt att fånga de komplexa relationella dynamikerna mellan trafikdeltagare, vilka är avgörande för en djupare förståelse av körmiljön. För att hantera detta problem erbjuder GNN-modeller, som är designade för relationell data, ett lovande alternativ. Denna avhandling föreslår ett ramverk genom att använda RGCN-modeller, en speciellt designad typ av GNN-modeller för relationell data, för att förstå den relationella datan i dynamiska körscenarier. Specifikt, genom att kategorisera typerna av trafikdeltagare, har ett arbetsflöde utformats för att omvandla ostrukturerad data till spatial relationell data. Genom att analysera ramarna inom en tidsserie med en regelbaserad metod, omvandlas den spatiala relationella datan till spatial-temporal relationell data. Därefter utför RGCN-modellen inferenser om trafikdeltagarnas beteenden och relationerna mellan dem. Resultaten visar att med antagandet av RGCN-modeller blir ramverket enastående när det gäller att klassificera noder och förutsäga deras relationer i en öppen källkodsdataset från verkliga världen. Jämfört med klassiska GCN-modeller uppnår de föreslagna metoderna en förbättring på cirka 10% i prediktionsnoggrannhet, från 0,77 till 0,85 i nodklassificering och från 0,74 till 0,82 i länkprediktion. Dessutom, förutom uppgifterna om nodklassificering och länkprediktion, stödjar denna avhandling också resonering kring okända förhållanden genom att koda kända relationer med en top-1 noggrannhet på 0,78 och hits@2 på 0,91, vilket kan hjälpa till att förbättra förståelsen av riskscenarier.

Place, publisher, year, edition, pages
2024. , p. 54
Series
TRITA-ITM-EX ; 2024:595
Keywords [en]
Automated Driving Systems, Dynamic Driving Scenarios, Relational Graph Convolutional Networks, Multi-Relational Data
Keywords [sv]
Automatiserade Körsystem, Dynamiska Körscenarier, Relationella Grafiska Neurala Nätverk, Multirelationella Data
National Category
Mechanical Engineering
Identifiers
URN: urn:nbn:se:kth:diva-362106OAI: oai:DiVA.org:kth-362106DiVA, id: diva2:1950518
Educational program
Master of Science - Embedded Systems
Presentation
2024-10-11, 00:00
Supervisors
Examiners
Available from: 2025-04-08 Created: 2025-04-08 Last updated: 2025-04-08Bibliographically approved

Open Access in DiVA

fulltext(4445 kB)34 downloads
File information
File name FULLTEXT01.pdfFile size 4445 kBChecksum SHA-512
54e2c3e4b6286567ce037dd5e82356caaac3918acdfaddd208cdbdf4a3b2d8202311c1523dedc29afd47c0f9437ce06e76660f3eaffda280680e879078974bc6
Type fulltextMimetype application/pdf

By organisation
Engineering Design
Mechanical Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 34 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 318 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf