Machine Learning-Based Prediction of Diagnostic Trouble Codes in Electric Vehicle Batteries: A Multi-Temporal Analysis
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Maskininlärningsbaserad förutsägelse av diagnostiska felkoder i elfordonsbatterier : En multitemporal analys (Swedish)
Abstract [en]
Lithium-ion battery (LiB) dominates the traction battery market for battery electric vehicles (BEVs), in no small part due to its high energy density and long life-cycle. But the safety risks involved with the use of LiBs include overheating of battery cells that can potentially lead to fire incidents. This highlights the need for early fault prediction systems. Moreover, with the adoption of cloud technology, an increasing number of data-driven approaches have been enabled for the fault prediction of BEV LiBs. In particular, machine learning (ML) approaches have found success within this field, but there are some key challenges it faces such as limited fault data and the need for timely detection. This thesis proposes leveraging diagnostic trouble codes (DTCs) as proxy fault labels to predict critical BEV LiB faults using ML. DTCs are alerts generated by a vehicle’s self-diagnosis system and indicate a wide range of battery issues, but they are inherently reactive. By predicting critical DTCs using real-world BEV monitoring data, this work can transform these reactive alerts into proactive tools for fault prediction. Traditional supervised ML models—Decision Tree, Random Forest, and XGBoost—were trained on battery signals such as voltage, current, temperature, and state of charge (SoC) to predict critical DTCs. Short-term (120 minutes) and long-term (30 days) prediction frameworks were explored to explore the influence of temporal differences. The results demonstrates that ML models have robust performance when predicting critical DTCs. Random Forest achieved a F1-score of 0.9722 when predicting critical DTCs 45- minutes ahead while Decision Tree had a F1-score of 0.833 when predicting 3-days ahead on the hold-out test set. Long-term predictions benefited from XGBoost’s ability to handle non-linear feature interactions, with extended prediction windows yielding consistent improvements. Feature importance analysis revealed current-based signals as the most predictive, while SoC emerged as a key factor in identifying slower-evolving faults. This study highlights the potential of DTCs as proxy fault labels for ML-based BEV LiB fault prediction, advancing research for BEV predictive maintenance.
Abstract [sv]
Litiumjonbatterier (LiB) är de föredragna framdrivnings batterier för bat- teridrivet elfordon (BEV) på grund av dess höga energidensitet och långa livscyklar. Men säkerhätsriskerna som kommer med användning av batterierna inkluderar överhettning av batteri celler som kan potentiellt leda till brandincidenter. Detta motiverar behover av tidig felprediktion system. Dessutom har antagandet av moln teknologi möjliggjort användning av data- drivna metoder till felprediktionen av BEV LiB. Särskillt har maskininlärning metoder visat framgång, men de stötter på några utmaningar såsom begränsad feldata och behovet av tidig detektion. Denna avhandling föreslår att använda diagnostiska felkoder som anno- terad feldata för att prediktera krisika felkoder i BEV LiB. DTC är felkoder som genereras av fordones egna diagnos system. DTC:er kan indikera en stort mängd problem, men de är reaktiva och generareas efter ett fel har redan skett. Genom att prediktera kritiska DTC:er med hjälp av verkliga BEV LiB övervaknings data kan vi omvandla dessa reaktiva felkoder till proaktiva verktyg för felprediktion. Traditionella väglett lärande maskinlärnings modeller som Decision Tree, Random Forest och XGBoost tränades på batteri signal data som spänning, ström, temperature och ladningstillstånd för att prediktera kritiska DTC:er. Kortsiktiga (120 minuter) och långsiktiga (30 minuter) prediktions ramverk utforskades för att observera påverkan av tidsmässig skillnader. Reultaten demonstrerar att maskininlärnings modeller har robust prestanda när man prediktar kritiska DTC:er. Random Forest fick en F1-noggranhet av 0.9722 när den predikterar kritiska DTC:er 45 minuter i förväg, medans Decision Tree fick en F1-noggranhet av 0.833 när den predikterade 3 dagar i förväg på test data. XGBoost hade mest stabil prestanda över långsiktiga prediktioner, med ökande prestanda över längre prediktions fönster. Inbyggda funktions betydelsen visade att ström-baserade signaler hade mest betydelse, medans laddningstillståndets betydelse ökade vid långsiktiga prediktions ramverket. Den här studien visar potentialet hos DTC:er som annoterad feldata för maskininlärnings baserad felprediktion för batteridrivna elfordons litjumjon- batterier.
Place, publisher, year, edition, pages
2025. , p. 58
Series
TRITA-EECS-EX ; 2025:64
Keywords [en]
Battery Electric-Vehicle, Diagnostic Trouble Codes, Lithium-ion Battery, Machine Learning, Multivariate Time Series
Keywords [sv]
Batterielektriskt fordon, Diagnostiska felkoder, Litiumjonbatteri, Maskinin- lärning, Multivariat tidsserie
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-362107OAI: oai:DiVA.org:kth-362107DiVA, id: diva2:1950529
External cooperation
Scania CV AB
Supervisors
Examiners
2025-04-112025-04-082025-04-11Bibliographically approved