Exploring the Economics of Serverless: An Analysis of Cost Discrepancy in Auto-Scaling
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Utforska ekonomin hos serverless: En analys av kostnadsskillnader vid auto-skalning (Swedish)
Abstract [en]
In the realm of cloud computing, serverless computing emerges as a contemporary paradigm, distinguished by its utilization of auto- scaling—a dynamic resource allocation mechanism that operates seamlessly without manual intervention. Serverless architecture extends cloud computing by unburdening its user from resource management and allocation. It provides pay-as-you-go billing model, where a user only pays for the resources they consume. Cost efficiency is a critical factor in almost every successful serverless use case, and auto-scaling is meant to enable this by managing resources, avoiding overprovisioning, and scaling up or down based on the workload. Although serverless pricing appears straightforward, with a fixed cost per function invocation and a cost per time unit of function execution, it encompasses hidden expenses, notably stemming from factors like cold-start delays. These hidden costs may result in discrepancies between estimated and actual costs for users. Previous research has highlighted that the effective cost hinges on the arrival pattern of the serverless workload, implying the existence of hidden expenses linked to auto-scaling serverless deployments. This thesis investigates the hidden costs associated to auto-scaling through experiments conducted across various workload patterns on the Google Cloud Platform.
Abstract [sv]
Inom området molnberäkning framträder serverlös beräkning som ett samtida paradigm, utmärkt av dess användning av automatisk skalning - en dynamisk resursallokeringsmekanism som fungerar sömlöst utan manuellt ingripande. Serverlös arkitektur utvidgar molnberäkning genom att befria användaren från resurshantering och -allokering. Den tillhandahåller en betalningsmodell baserad på användning, där användaren endast betalar för de resurser de faktiskt förbrukar. Kostnadseffektivitet är en avgörande faktor i nästan varje framgångsrik serverlös tillämpning, och automatisk skalning är avsedd att möjliggöra detta genom att hantera resurser, undvika överallokering och skala upp eller ned baserat på arbetsbelastningen. Även om serverlös prissättning verkar enkel, med en fast kostnad per funktionsanrop och en kostnad per tidsenhet för funktionskörning, innefattar den dolda kostnader, särskilt från faktorer som fördröjningar vid kall start. Dessa dolda kostnader kan resultera i avvikelser mellan uppskattade och faktiska kostnader för användare. Tidigare forskning har framhållit att den effektiva kostnaden beror på anloppsmönstret för den serverlösa arbetsbelastningen, vilket antyder förekomsten av dolda kostnader kopplade till automatisk skalning av serverlösa distributioner. Denna avhandling undersöker de dolda kostnaderna förknippade med automatisk skalning genom experiment som genomförs över olika arbetsbelastningsmönster på Google Cloud Platform.
Place, publisher, year, edition, pages
2024. , p. 64
Series
TRITA-EECS-EX ; 2024:933
Keywords [en]
Cloud Computing, Serverless Computing, Auto Scaling, Resource Allocation, Cloud Functions, Workload Pattern, Cold Start, Cost evaluation, Google Cloud Platform
Keywords [sv]
Molnberäkning, Serverlös beräkning, Automatisk skalning, Resursallokering, Molnfunktioner, Arbetsbelastningsmönster, Kall start, Kostnadsutvärdering, Google Cloud Platform
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-361059OAI: oai:DiVA.org:kth-361059DiVA, id: diva2:1943579
External cooperation
H&M Group
Supervisors
Examiners
2025-03-172025-03-112025-03-17Bibliographically approved