Digitala Vetenskapliga Arkivet

Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Evaluation of Automated Cyber Attack Simulations for Cyber Defence Exercises: Predicting Desirable Outcomes of Emulated Red Team Scenarios in Lore Using Machine Learning
KTH, School of Electrical Engineering and Computer Science (EECS).
2024 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Evaluering av automatiserade simuleringar av cyberattacker till cybersäkerhetsövningar : Förutsäga önskvärda utfall av emulerade röda lag scenarier i Lore med hjälp av maskininlärning (Swedish)
Abstract [en]

Training blue teams to defend information technology (IT) infrastructure is crucial for preventing and mitigating cyberattacks against organizations. This training typically occurs during cyber defence exercises (CDXs), where red teams simulate various attack scenarios. To reduce reliance on manual red teams, these attacks can be automated using methods such as Boolean logic or machine learning (ML) models. The Swedish Defence Research Agency (FOI) has developed an automated red team emulation tool called Lore. It is used in CDXs to create attack scenarios against a virtual environment that simulates an organization’s IT environment. The outcomes of these scenarios, such as the number of compromised systems, types of actions executed, and the number of actions performed vary based on parameters such as action blacklisting/whitelisting, target environment, and system exclusions. Depending on exercise conditions such as purpose, number of participants, and budget, some outcomes may be more desirable than others. This thesis examines the desirability of various CDX scenarios under some conditions by analyzing survey responses from exercise leaders, red team members, and white team members. The survey included statistical data from 45 different scenarios executed in a virtual environment. The resulting dataset was used to train and evaluate four regression models to predict scenario desirability based on the outcomes and conditions. This study aimed to answer two research questions: (1) What types of red team scenarios are most desirable for CDXs given some exercise conditions? (2) Which regression models are most effective at predicting the desirability of these scenarios? The analysis revealed that desirable scenarios generally involved a higher number of compromised systems. However, the importance of factors such as the number of alerts from security information and event management (SIEM) tools and the number of actions performed by Lore that may impact the scenario desirability could not be established. Among the models tested, the random forest and elastic net regression models performed best according to the mean absolute error (MAE) metric, outperforming the multilayer perceptron (MLP) and support vector regression (SVR) models. Future studies should focus on training these or other models on more diverse and extensive datasets to improve the predictive power of desirable scenarios and in more detail identify the factors affecting scenario desirability.

Abstract [sv]

Att träna blå lag att försvara informationsteknologi (IT)-infrastruktur är avgörande för att förhindra och mildra cyberattacker mot organisationer. Denna träning sker vanligtvis under cybersäkerhetsövningar (CDXs), där röda lag simulerar olika attackscenarier. För att minska beroendet av manuella röda lag kan dessa attacker automatiseras med metoder som boolesk logik eller maskininlärningsmetoder. Totalförsvarets forskningsinstitut (FOI) har utvecklat ett verktyg som heter Lore som automatiskt emulerar röda lag. Det används i CDXs för att skapa attackscenarier mot en virtuell miljö som simulerar en organisations IT-miljö. Utfallet av dessa scenarier, såsom antalet komprometterade system, typer av utförda aktioner och antalet utförda aktioner, varierar baserat på parametrar som svartlistning/vitlistning av aktioner, målmiljö och systemexkluderingar. Beroende på övningsvillkor, såsom syfte, antal deltagare och budget, kan vissa utfall vara mer önskvärda än andra. Denna uppsats undersöker önskvärdheten av olika CDX-scenarier under vissa förhållanden genom att analysera enkätresultat från övningsledare, röda lag- medlemmar och vita lag-medlemmar. Enkäten inkluderade statistiska data från 45 olika scenarier exekverade i en virtuell miljö. Den resulterande datamängden användes för att träna och utvärdera fyra regressionsmodeller för att förutsäga scenariernas önskvärdhet baserat på utfallen och villkoren. Studien syftade till att besvara två forskningsfrågor: (1) Vilka typer av röda lag-scenarion är mest önskvärda för CDXs givet vissa villkor? (2) Vilka regressionsmodeller är mest effektiva för att förutsäga önskvärdheten av dessa scenarion? Analysen visade att önskvärda scenarion generellt involverade ett högre antal komprometterade system. Däremot kunde betydelsen av faktorer såsom antalet larm från säkerhetsinformations- och händelsehantering (SIEM)-verktyg och antalet aktioner utförda av Lore som kan påverka scenariets önskvärdhet inte fastställas. Bland de testade modellerna presterade random forest och elastic net- regressionsmodellerna bäst enligt prestandametriken medelabsolutfelet (MAE) och överträffade multilayer perceptron (MLP) och stödvektorregression (SVR)-modellerna. Framtida studier bör fokusera på att träna dessa eller andra modeller på mer varierande och omfattande datamängder för att förbättra förutsägelsekraften för önskvärda scenarier och i mer detalj identifiera de faktorer som påverkar önskvärdhet av scenarion.

Place, publisher, year, edition, pages
2024. , p. 87
Series
TRITA-EECS-EX ; 2024:930
Keywords [en]
Red team, Blue team, Cyber attacks, Cyber defence exercises, Machine learning, Regression
Keywords [sv]
Rött lag, Blått lag, Cyberattacker, Cybersäkerhetsövningar, Maskininlärning, Regression
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-361056OAI: oai:DiVA.org:kth-361056DiVA, id: diva2:1943561
External cooperation
Swedish Defence Research Agency (FOI)
Supervisors
Examiners
Available from: 2025-03-17 Created: 2025-03-11 Last updated: 2025-03-17Bibliographically approved

Open Access in DiVA

fulltext(2387 kB)108 downloads
File information
File name FULLTEXT02.pdfFile size 2387 kBChecksum SHA-512
f2d533de56bfc4f27fabefe0c3a20c378acd2768632565e60da593f08bb3cf10910ecbb34b9a77bf5dd8688e3387fe5e3c0d504db5dc16eff8022f022cf65c29
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 108 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 569 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf