Joint Optimization of Pricing and Resource Allocation in Serverless Edge Computing: A Game-Theoretic Perspective
2025 (English)Doctoral thesis, comprehensive summary (Other academic)
Abstract [en]
The rapid advancement of Internet of Things (IoT), Augmented Reality (AR), autonomous systems, and intelligent automation is transforming daily life and revolutionizing industrial processes. These technologies demand significant computational resources while also imposing stringent latency requirements. A common approach to meet computational resource demand is leveraging Cloud Computing (CC), which offers scalable processing capabilities through centralized data centers. Nonetheless, this centralized approach often fails to meet stringent latency requirements due to communication delays caused by the geographical distance between cloud servers and end users. This limitation has led to the emergence of the novel paradigm of Edge Computing (EC), which addresses the latency issue by placing compute units closer to end users.
EC server clusters are expected to be smaller in scale and more geographically dispersed compared to CC data centers. This introduces new challenges, such as limited computational and storage capacity, making efficient resource allocation crucial. Additionally, the network operator managing edge infrastructure must maintain its financial sustainability under different workload characteristics and application requirements of users, necessitating joint and adaptable resource management and pricing strategies. Function-as-a-Service (FaaS) offers a promising approach in this regard, as its pay-as-you-go pricing model allows users to pay only for the resources they consume, while also enabling dynamic resource management by shifting the entire responsibility of application deployment to the operator. However, this flexibility also makes the choice of computation, memory, and bandwidth resources price-dependent, further complicating resource management and pricing.
The papers included in this thesis are organized into three parts, each addressing distinct challenges related to pricing, resource allocation, and system dynamics in EC. In the first part of the thesis, we first consider a setting where Wireless Devices (WDs) minimize energy and the monetary costs of computing tasks, while the operator maximizes revenue by optimizing pricing and application caching under memory constraints. We consider a dynamic setting where the operator has no prior knowledge of the varying availability of WDs over time. We model this interaction as a Stackelberg Game (SG) and demonstrate the existence of an equilibrium. To address information asymmetry, we use Bayesian optimization to learn pricing strategies, establish an upper bound on its asymptotic regret, and propose a greedy approximation algorithm for application caching. We then investigate the joint optimization of compute, communication, and memory resources in a static network setting, where WDs minimize the costs of executing the tasks of their applications, including monetary and energy expenses. We model this interaction as a SG, show the existence of an equilibrium, and prove that computing an equilibrium is NP-hard. We propose an efficient approximation algorithm with a bounded approximation ratio. An interesting feature of our solution is that the operator's revenue is maximized when the WDs maximize their energy savings through computation offloading. Furthermore, we investigate the rate-adaptation problem, where WDs adjust their offloading rates based on available compute resources and pricing. We model the interaction as a SG and propose a Stackelberg gradient play algorithm that computes the operator’s implicit revenue function with respect to the rate selection of the WDs.
The second part of this thesis explores a dynamic network and pricing setting where WDs arrive at the edge cell according to a non-homogeneous stochastic process, and the operator sets prices based on the availability of WDs and their heterogeneous workload characteristics. We formulate the problem of maximizing the revenue ofthe operator as a sequential decision-making problem under uncertainty, where the operator's price can be piecewise linear or non-linear and could vary over time. In a Markovian steady-state setting, we derive analytical results for the optimal pricing strategy, which also serve as a heuristic for the general case. To address the general case, we introduce a Generalized Hidden Parameter Markov Decision Process and propose a dual Bayesian neural network approximator that approximates the state transitions and the revenue to accelerate the learning of the optimal pricing policy. This approach enables pre-training on synthetic traces while adapting quickly to unseen workload patterns.
The third part addresses computational challenges by examining the impact of server contention on both operator revenue and application latency constraints. To address this, we propose a contention model validated through experiments across applications with varying compute demands, including L1/L2/L3 caches, I/O, and memory bus usage. We develop a novel model-based Bayesian optimization algorithm to maximize operator revenue while ensuring that latency and resource capacity constraints are met.
The algorithmic contributions of this thesis in pricing and resource management are intended to provide efficient, deployable, and scalable solutions that strengthen the robustness and efficiency of resource allocation and pricing in EC.
Abstract [sv]
Den snabba utvecklingen av Internet of Things (IoT), Augmented Reality (AR), autonoma system och intelligent automation ger upphov till förändrade levnadsmönster och revolutionerar industriella processer. Dessa teknologier kräver betydande beräkningsresurser samtidigt som de ställer strikta krav på fördröjning (latens). Ett vanligt tillvägagångssätt för att möta behovet av beräkningsresurser är att utnyttja Cloud Computing (CC), som erbjuder skalbara bearbetningsmöjligheter genom centraliserade datacenter. Detta centraliserade tillvägagångssätt misslyckas dock ofta med att uppfylla strikta latenskrav på grund av kommunikationsfördröjningar orsakade av det geografiska avståndet mellan molnservrar och slutanvändare. Denna begränsning har lett till framväxten av det nya paradigmet Edge Computing (EC), som hanterar latensproblemet genom att placera beräkningsenheter närmare slutanvändarna.
EC-serverkluster förväntas vara mindre i skala och geografiskt mer spridda jämfört med CC-datacenter. Detta introducerar nya utmaningar, inklusive begränsad beräknings- och lagringskapacitet, vilket gör effektiv resursallokering avgörande. Dessutom måste nätverksoperatören som hanterar edge-infrastrukturen säkerställa en ekonomiskt hållbar drift, trots varierande arbetsbelastningar och applikationskrav från användare, vilket kräver gemensamma och anpassningsbara strategier för resursstyrning och prissättning. Function-as-a-Service (FaaS) är ett lovande tillvägagångssätt i detta avseende, eftersom dess betala-per-användning-prismodell gör det möjligt för användare att endast betala för de resurser de förbrukar, samtidigt som det möjliggör dynamisk resursstyrning genom att hela ansvaret för applikationsdistribution överförs till operatören. Denna flexibilitet gör dock att valet av beräkning, minne och bandbreddsresurser blir priskänsligt, vilket ytterligare komplicerar resursstyrning och prissättning.
Artiklarna som ingår i denna avhandling är organiserade i tre delar, där varje del behandlar olika utmaningar relaterade till prissättning, resursallokering och systemdynamik i edge computing. I den första delen av avhandlingen betraktar vi ett sammanhang där Wireless Devices (WD:er) minimerar energi- och penningkostnaderna för beräkningsuppgifter, medan operatören maximerar intäkterna genom att optimera prissättning och applikationscaching under minnesbegränsningar. Vi betraktar ett dynamiskt sammanhang där operatören inte har någon förkunskap om den varierande tillgängligheten av WD över tid. Vi modellerar detta som ett Stackelberg Game (SG) och visar att det finns ett jämviktsläge. För att hantera informationsasymmetri använder vi Bayesiansk optimering för att lära oss prissättningsstrategier, fastställer en övre gräns för dess asymptotiska ånger (en: regret), och föreslår en girig approximationsalgoritm för applikationscaching. Vi undersöker sedan att gemensamt optimera beräknings-, kommunikations- och minnesresurser i ett statiskt nätverkssammanhang, där WDs minimerar kostnaderna för att köra applikationsuppgifter, inklusive penning- och energikostnader. Vi modellerar denna interaktion som ett SG, visar existensen av ett jämviktsläge och bevisar att beräkningen av ett sådant är NP-svårt. Vi föreslår en effektiv approximationsalgoritm med en begränsad approximationskvot. En intressant egenskap hos vår lösning är att operatörens intäkter maximeras när WDs maximerar sina energibesparingar genom beräkningsavlastning. Vidare undersöker vi problemet med hastighetsanpassning, där WDs justerar sina avlastningshastigheter baserat på tillgängliga beräkningsresurser och prissättning. Vi modellerar interaktionen som ett SG och föreslår en Stackelberg gradient play-algoritm som beräknar operatörens implicita intäktsfunktion med avseende på WDs val av avlastningshastighet.
Den andra delen av denna avhandling undersöker en dynamisk nätverks- och prissättningsmodell där WDs anländer till edge-cellen enligt en icke-homogen stokastisk process. Operatören sätter priser baserat på tillgången på WDs och deras heterogena arbetsbelastningskarakteristiska. Vi formulerar problemet att maximera operatörens intäkter som ett sekventiellt beslutsproblem under osäkerhet, där operatörens pris kan vara styckvis linjära eller icke-linjära och kan variera över tid. I ett Markovskt stationärt tillstånd härleder vi analytiska resultat för den optimala prissättningsstrategin, denna fungerar också som en heuristik för det allmänna fallet. För att hantera det allmänna fallet introducerar vi en Generaliserad Markovbeslutsprocess med dolda parametrar och föreslår en dubbel Bayesiansk neurala nätverksapproximator som approximerar tillståndsövergångar och intäkter för att påskynda inlärningen av den optimala prissättningspolicyn. Detta tillvägagångssätt möjliggör förträning på syntetisk data samtidigt som det snabbt anpassar sig till nya belastningsmönster.
Den tredje delen tar upp förbisedda beräkningsutmaningar genom att undersöka påverkan av serverkonkurrens på både operatörens intäkter och applikationers latensbegränsningar. För att hantera detta föreslår vi en konkurrensmodell som valideras genom experiment över applikationer med varierande beräkningsbehov, inklusive L1/L2/L3-cache, I/O och minnesbussanvändning. Vi utvecklar en ny modellbaserad Bayesiansk optimeringsalgoritm för att maximera operatörens intäkter samtidigt som latens- och resurskapacitetskrav uppfylls. De algoritmiska bidragen inom området prissättning och resursstyrning är avsedda att fungera som effektiva, implementerbara och skalbara lösningar som förbättrar robustheten och effektiviteten i resursallokering och prissättning inom EC.
Place, publisher, year, edition, pages
Stockholm, Sweden: KTH Royal Institute of Technology, 2025. , p. 275
Series
TRITA-EECS-AVL ; 2025:58
Keywords [en]
Edge Computing, Resource Allocation, Pricing Strategies, Stackelberg Games, Combinatorial Optimization, Non-linear Optimization, Bayesian Optimization, Reinforcement Learning, Transfer Learning
Keywords [sv]
edge-beräkning, Resursallokering, Prissättningsstrategier, Stackelbergspel, Kombinatorisk optimering, Icke-linjär optimering, Bayesiansk optimering, Förstärkningsinlärning, Överföringsinlärning
National Category
Electrical Engineering, Electronic Engineering, Information Engineering
Research subject
Electrical Engineering; Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-363353ISBN: 978-91-8106-289-2 (print)OAI: oai:DiVA.org:kth-363353DiVA, id: diva2:1958320
Public defence
2025-06-10, https://kth-se.zoom.us/j/68670265353, F3, Lindstedtsvägen 26 & 28, floor 2, KTH Campus, Stockholm, 14:00 (English)
Opponent
Supervisors
Note
QC 20250514
2025-05-152025-05-142025-12-16Bibliographically approved
List of papers