Using Graph Neural Network to Analyze Multi-Relational Objects in Dynamic Driving Scenarios
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Användning av grafiska neurala nätverk för att analysera multirelationella objekt i dynamiska körscenarier (Swedish)
Abstract [en]
Understanding dynamic driving scenarios poses significant challenges in the development of Automated Driving Systems (ADS). ADS need to perceive crucial information from dynamic driving scenarios to maintain functional safety. The information from the scenarios is perceived through sensors (e.g., cameras, IMU, LiDAR) and is usually unstructured data. Current approaches often rely on Convolutional Neural Networks (CNNs) to process this data. However, while CNNs are effective at handling unstructured sensor inputs, they struggle to capture the complex relational dynamics between traffic participants, which are crucial for a deeper understanding of the driving environment. To address this gap, Graph Neural Networks (GNNs), designed for relational data, offer a promising alternative. This thesis proposes a framework by adopting Relational Graph Convolutional Networks (RGCNs), a special-designed GNNs for relational data, to understand the relational data regarding dynamic driving scenarios. Specifically, by categorizing the types of traffic participants, a workflow is designed to convert unstructured data into spatial relational data. By analyzing the frames within a time series using the rule-based approach, the spatial relational data is converted into spatial-temporal relational data. Next, the RGCNs model infers the behaviours of the traffic participants and the relationships among them. As results, with the adoption of the RGCNs, the framework outperforms in classifying nodes and predicting their relationships in the open-source real-world dataset. Compared to classic Graph Convolutional Networks (GCNs), the proposed methods achieve an improvement of about 10% in prediction accuracy, increasing from 0.77 to 0.85 in node classification, and from 0.74 to 0.82 in link prediction. Furthermore, apart from the tasks on node classification and link prediction, this thesis supports the reasoning of unknown conditions by encoding known relationships with a top-1 accuracy of 0.78 and hits@2 of 0.91, which can help improve comprehension of the risk of the scenario.
Abstract [sv]
Förståelsen av dynamiska körscenarier innebär betydande utmaningar vid utvecklingen av Automatiserade Körsystem. Automatiserade Körsystem behöver uppfatta viktig information från dynamiska körscenarier för att upprätthålla funktionell säkerhet. Informationen från scenarierna uppfattas genom sensorer (t.ex. kameror, IMU, LiDAR) och är vanligtvis ostrukturerad data. Nuvarande tillvägagångssätt förlitar sig ofta på CNN-modeller för att bearbeta denna data. Men även om CNN-modeller är effektiva på att hantera ostrukturerade sensorinmatningar, har de svårt att fånga de komplexa relationella dynamikerna mellan trafikdeltagare, vilka är avgörande för en djupare förståelse av körmiljön. För att hantera detta problem erbjuder GNN-modeller, som är designade för relationell data, ett lovande alternativ. Denna avhandling föreslår ett ramverk genom att använda RGCN-modeller, en speciellt designad typ av GNN-modeller för relationell data, för att förstå den relationella datan i dynamiska körscenarier. Specifikt, genom att kategorisera typerna av trafikdeltagare, har ett arbetsflöde utformats för att omvandla ostrukturerad data till spatial relationell data. Genom att analysera ramarna inom en tidsserie med en regelbaserad metod, omvandlas den spatiala relationella datan till spatial-temporal relationell data. Därefter utför RGCN-modellen inferenser om trafikdeltagarnas beteenden och relationerna mellan dem. Resultaten visar att med antagandet av RGCN-modeller blir ramverket enastående när det gäller att klassificera noder och förutsäga deras relationer i en öppen källkodsdataset från verkliga världen. Jämfört med klassiska GCN-modeller uppnår de föreslagna metoderna en förbättring på cirka 10% i prediktionsnoggrannhet, från 0,77 till 0,85 i nodklassificering och från 0,74 till 0,82 i länkprediktion. Dessutom, förutom uppgifterna om nodklassificering och länkprediktion, stödjar denna avhandling också resonering kring okända förhållanden genom att koda kända relationer med en top-1 noggrannhet på 0,78 och hits@2 på 0,91, vilket kan hjälpa till att förbättra förståelsen av riskscenarier.
Place, publisher, year, edition, pages
2024. , p. 54
Series
TRITA-ITM-EX ; 2024:595
Keywords [en]
Automated Driving Systems, Dynamic Driving Scenarios, Relational Graph Convolutional Networks, Multi-Relational Data
Keywords [sv]
Automatiserade Körsystem, Dynamiska Körscenarier, Relationella Grafiska Neurala Nätverk, Multirelationella Data
National Category
Mechanical Engineering
Identifiers
URN: urn:nbn:se:kth:diva-362106OAI: oai:DiVA.org:kth-362106DiVA, id: diva2:1950518
Educational program
Master of Science - Embedded Systems
Presentation
2024-10-11, 00:00
Supervisors
Examiners
2025-04-082025-04-082025-04-08Bibliographically approved