Digitala Vetenskapliga Arkivet

Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Exploring the Economics of Serverless: An Analysis of Cost Discrepancy in Auto-Scaling
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Utforska ekonomin hos serverless: En analys av kostnadsskillnader vid auto-skalning (Swedish)
Abstract [en]

In the realm of cloud computing, serverless computing emerges as a contemporary paradigm, distinguished by its utilization of auto- scaling—a dynamic resource allocation mechanism that operates seamlessly without manual intervention. Serverless architecture extends cloud computing by unburdening its user from resource management and allocation. It provides pay-as-you-go billing model, where a user only pays for the resources they consume. Cost efficiency is a critical factor in almost every successful serverless use case, and auto-scaling is meant to enable this by managing resources, avoiding overprovisioning, and scaling up or down based on the workload. Although serverless pricing appears straightforward, with a fixed cost per function invocation and a cost per time unit of function execution, it encompasses hidden expenses, notably stemming from factors like cold-start delays. These hidden costs may result in discrepancies between estimated and actual costs for users. Previous research has highlighted that the effective cost hinges on the arrival pattern of the serverless workload, implying the existence of hidden expenses linked to auto-scaling serverless deployments. This thesis investigates the hidden costs associated to auto-scaling through experiments conducted across various workload patterns on the Google Cloud Platform.

Abstract [sv]

Inom området molnberäkning framträder serverlös beräkning som ett samtida paradigm, utmärkt av dess användning av automatisk skalning - en dynamisk resursallokeringsmekanism som fungerar sömlöst utan manuellt ingripande. Serverlös arkitektur utvidgar molnberäkning genom att befria användaren från resurshantering och -allokering. Den tillhandahåller en betalningsmodell baserad på användning, där användaren endast betalar för de resurser de faktiskt förbrukar. Kostnadseffektivitet är en avgörande faktor i nästan varje framgångsrik serverlös tillämpning, och automatisk skalning är avsedd att möjliggöra detta genom att hantera resurser, undvika överallokering och skala upp eller ned baserat på arbetsbelastningen. Även om serverlös prissättning verkar enkel, med en fast kostnad per funktionsanrop och en kostnad per tidsenhet för funktionskörning, innefattar den dolda kostnader, särskilt från faktorer som fördröjningar vid kall start. Dessa dolda kostnader kan resultera i avvikelser mellan uppskattade och faktiska kostnader för användare. Tidigare forskning har framhållit att den effektiva kostnaden beror på anloppsmönstret för den serverlösa arbetsbelastningen, vilket antyder förekomsten av dolda kostnader kopplade till automatisk skalning av serverlösa distributioner. Denna avhandling undersöker de dolda kostnaderna förknippade med automatisk skalning genom experiment som genomförs över olika arbetsbelastningsmönster på Google Cloud Platform.

Place, publisher, year, edition, pages
2024. , p. 64
Series
TRITA-EECS-EX ; 2024:933
Keywords [en]
Cloud Computing, Serverless Computing, Auto Scaling, Resource Allocation, Cloud Functions, Workload Pattern, Cold Start, Cost evaluation, Google Cloud Platform
Keywords [sv]
Molnberäkning, Serverlös beräkning, Automatisk skalning, Resursallokering, Molnfunktioner, Arbetsbelastningsmönster, Kall start, Kostnadsutvärdering, Google Cloud Platform
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-361059OAI: oai:DiVA.org:kth-361059DiVA, id: diva2:1943579
External cooperation
H&M Group
Supervisors
Examiners
Available from: 2025-03-17 Created: 2025-03-11 Last updated: 2025-03-17Bibliographically approved

Open Access in DiVA

fulltext(1017 kB)47 downloads
File information
File name FULLTEXT01.pdfFile size 1017 kBChecksum SHA-512
89f5a7e30c2a8e5bf2066d99dec29d6c2a8c1239945d2c1ef15496868dda4d2cd152dd0ea058b38e648fdebeca4d624527c0e339880b2e82908ed85a25352d99
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 49 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 360 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf