Bayesian Models for Spatiotemporal Data from Transportation Networks
2023 (English)Doctoral thesis, comprehensive summary (Other academic)Alternative title
Bayesianska modeller för spatiotemporal data från transportnätverk (Swedish)
Abstract [en]
Urbanization has caused a historical transformation at a global scale, and humanity is moving towards a fully connected society where cities will concentrate population, infrastructure and economic activity. A key element in the cities’ infrastructure is the transportation system, as it facilitates the mobility of people and goods. Transportation systems are constantly generating data from, e.g., GPS, sensors and cameras, and the statistical modeling is challenging due to the complex structure and dynamics of the system, and the inherent uncertainty. In this thesis, we develop Bayesian models with applications to transportation. We specifically focus on models that can be trained on spatiotemporal data coming from transport networks to make predictions on, e.g., bus delays or the actual network topology. Special attention has been given to model scalability issues and uncertainty quantification. We have used real-world data from transportation systems in every study to keep a balance between statistical rigor, novelty, and applicability.
The thesis consists of four papers. The first study presents a state-of-the-art probabilistic latent network model to forecast multilayer dynamic graphs. The model uses stochastic blockmodeling to reduce the computational burden, and is illustrated on a sample of 10-year data from four major airlines within the US air transportation system. In the second paper, we develop a robust model for real-time bus travel time prediction that departs from Gaussian assumptions by using Student-t errors, and show how Bayesian inference naturally allows for predictive uncertainty quantification in a highly stochastic environment. Experiments are performed using data from high-frequency buses in Stockholm, Sweden. The third paper shows the potential of multi-output Gaussian processes to tackle network-wide travel time prediction in an urban area. We develop a responsive online model based on a coregionalized covariance and test its accuracy on real data from GPS-equipped taxis. Finally, we propose a novel regularization strategy for the vector autoregressive model that is based on a graphical spike-and-slab prior, and present a case study with real airline delay data to assess its predictive performance and analyze network patterns related to the propagation of delays across airports.
Abstract [sv]
Urbaniseringen har orsakat en historisk förändring på en global skala, och mänskligheten går mot ett uppkopplat globalt nätverkssamhälle där städer kommer att koncentrera befolkning, infrastruktur och ekonomisk aktivitet. Ett nyckelelement i städernas infrastruktur är transportsystemet, eftersom det underlättar rörligheten av människor och varor. Transportsystem genererar ständigt data från tex. GPS, sensorer och kameror, och den statistiska modelleringen är utmanande på grund av systemets komplexa struktur och dynamik, samt dess naturliga osäkerheter.
I denna avhandling utvecklar vi Bayesianska modeller med tillämpningar för transporter. Vi fokuserar specifikt på modeller som kan tränas på spatiotemporala data från transportnätverk för att göra prediktioner av t ex. bussförseningar eller verklig nätverkstopologi. Särskild uppmärksamhet har ägnats åt modellskalbarhetsfrågor och kvantifiering av osäkerhet. Vi har använt data från riktiga transportsystem i varje studie för att skapa en balans mellan statistisk korrekthet, praktiskt tillämpbarhet och vetenskaplig höjd. Avhandlingen består av fyra artiklar. Den första artikeln presenterar en probabilistisk latent nätverksmodell för att prognostisera dynamiska grafer med multipla lager. Modellen använder stokastisk blockmodellering för att minska beräkningsbördan, och illustreras på ett datamaterial bestånde av tio års data från fyra stora flygbolag inom det amerikanska lufttransportsystemet. I den andra artikeln utvecklar vi en robust modell för realtidsprognoser av bussförseningar genom att använda Student-t fördelning och vi visar hur Bayesiansk inferens ger en naturlig kvantifiering av osäkerhet i en mycket stokastisk miljö. Experiment utförs med hjälp av högfrekventa data från bussar i Stockholm. Den tredje artikeln visar potentialen hos fler-dimensionella Gaussiska processer för att generera nätverksövergripande prediktioner av trafikflöden i en tätortsmiljö. Vi utvecklar en responsiv onlinemodell baserad på en co-regionaliserad kovariansstruktur och utvärderar prognosförmåga på verkliga data från GPS-utrustade taxibilar. Slutligen föreslår vi en ny regularisering av den vektorautoregressiva modellen via en nätverksbaserad variabelsselektionsprior, och presenterar en fallstudie på verkliga data över förseningar i kommersiell flygtrafik där vi utvärderar prediktiv förmåga och analyserar nätverksmönster för hur förseningar sprids mellan flygplatser.
Place, publisher, year, edition, pages
Linköping: Linköping University Electronic Press, 2023. , p. 38
Series
Linköping Studies in Arts and Sciences, ISSN 0282-9800 ; 848Linköping Studies in Statistics, ISSN 1651-1700 ; 17
Keywords [en]
Bayesian statistics, Transportation networks, Spatiotemporal data, Machine learning
Keywords [sv]
Bayesiansk statistik, Transportnätverk, Spatiotemporal data, Maskininlärning
National Category
Probability Theory and Statistics
Identifiers
URN: urn:nbn:se:liu:diva-191153DOI: 10.3384/9789180750363ISBN: 9789180750356 (print)ISBN: 9789180750363 (electronic)OAI: oai:DiVA.org:liu-191153DiVA, id: diva2:1729371
Public defence
2023-02-17, Ada Lovelace, Building B, Campus Valla, Linköping, 13:15 (English)
Opponent
Supervisors
Note
Funding agencies: This work was partially supported by the Wallenberg AI, Autonomous Systems and Software Program (WASP) funded by the Knut and Alice Wallenberg Foundation, Sweden. The computations were enabled by resources provided by the Swedish National Infrastructure for Computing (SNIC), partially funded by the Swedish Research Council through grant agreement no. 2018-05973.
2023-01-202023-01-202023-02-15Bibliographically approved
List of papers