Accident Detection in E-scooters: Segmenting Multivariate Time Series with Inertial Measurement Unit Data via Probabilistic Models
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesis
Abstract [en]
This thesis aims to establish the ground truth of accidents and their defining characteristics through probabilistic models and feature extraction, focusing on the segmentation of multivariate time series data from e-scooter rides. The thesis evaluates the capability of Hidden Markov Model (HMM) and Multiple Regression Model with a Hidden Logistic Process (MRHLP) models against a threshold-based algorithm by analyzing rides where HMM and the threshold-based algorithm coincided. These common detected segments facilitated the use of common start indices to compute the mean and variance for both detected and undetected data points.
The findings reveal limitations in the MRHLP model's ability to precisely detect relevant segments compared to the HMM, which consistently identified significant overlaps with the threshold-based algorithm. The evaluation used the start indices of these overlapping segments to calculate the mean and variance of selected features, assessing data points 5 seconds before and after the identified segments. A linear classifier was employed to differentiate between the data points, yielding in high accuracy, recall, precision, and F1-score, with the variance of the features emerging as crucial discriminators.
Despite the limited size of the dataset, the results of this thesis indicate that the proposed method for characterizing potential accidents is promising and merits further exploration.
Abstract [sv]
Denna uppsats syftar till att fastställa den grunden för olyckor och deras definierande kännetecken genom probabilistiska modeller och extrationsmetoder, med fokus på segmentering av multivariata tidsseriedata från el-scooter resor. Uppsatsen utvärderar förmågan hos HMM och MRHLP-modellerna jämfört med en tröskelbaserat algoritm genom att analysera resor där HMM och den tröskelbaserade algoritmen överlappade. Dessa gemensamt upptäckta segment gjorder det möjligt att använda ett gemensamma startindex för att beräkna medelvärde och varians för både upptäckta och oupptäckta datapunkter.
Resultaten visar begränsningar hos MRHLP-modellens förmåga att exakt detektera relevanta överlappande segment till den tröskelbaserade algoritmen i jämförelse med HMM. Utvärderingen använde startindexen för dessa överlappande segment för att beräkna medelvärdet och variansen för dem utvalda egenskaper och bedömde datapunkter 5 sekunder före och efter de identifierade segmenten. En linjär klassifieringsmodel användes för att skilja mellan datapunkterna, vilker resulterade i hög noggrannhet, återkallelse, precision och F1-poäng, där variansen av egenskaperna framträdde som avgörande diskriminatorer.
Trots den begränsade storleken på datamängden indikerar resultaten av denna uppsats att den föreslagna metoden för att karaktärisera potentiella olyckor är lovande och förjänar ytterligare utforskning.
Place, publisher, year, edition, pages
2024. , p. 52
Series
TRITA-SCI-GRU ; 2024:356
Keywords [en]
Multivariate time series, Hidde Markov Model, Multiple Regression Model with a Hidden Logistic Process, Segmentation, Linear Classifier
Keywords [sv]
Multivariat tidsserie, Hidden Markov Model, Multiple Regression Model with a Hidden Logistic Process, Segmentering, Linjär Klassifieringsmodel
National Category
Other Mathematics
Identifiers
URN: urn:nbn:se:kth:diva-361500OAI: oai:DiVA.org:kth-361500DiVA, id: diva2:1946090
Subject / course
Mathematical Statistics
Educational program
Master of Science - Applied and Computational Mathematics
Supervisors
Examiners
2025-03-202025-03-202025-03-20Bibliographically approved