Digitala Vetenskapliga Arkivet

Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Deep Learning Prediction of Radiotherapy Machine Parameters
KTH, School of Electrical Engineering and Computer Science (EECS).
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Djupinlärning för prediktion av maskinparametrar för strålbehandling (Swedish)
Abstract [en]

This thesis investigates the application of deep learning to automate and enhance Volumetric Modulated Arc Therapy (VMAT) treatment planning. Traditional VMAT planning relies on solving a dose-mimicking optimization problem to determine machine parameters, a process that is highly sensitive to initial conditions due to its non-convex nature. Commonly, initialization involves fluence map optimization (FMO) followed by leaf conversion, which often results in suboptimal machine parameters for VMAT. Recent studies in deep learning for VMAT machine parameter prediction have explored architectures like 3D U-Nets and encoder-decoder models to directly predict MLC leaf positions and monitor units (MUs). While promising, these approaches face challenges such as data scarcity and limited generalizability. The reliance on 3D inputs, which require large datasets of segmented anatomical structures or dose distributions, has restricted their applicability to single cancer types, often necessitating separate models for each site. The proposed method employs a 2D U-Net model to predict multi-leaf collimator (MLC) apertures directly from beam’s eye view (BEV) dose slices. The predicted apertures are then used to initialize MU-only optimization, producing machine parameters for dose computation or further optimization. This thesis addresses four key research questions related to mitigating data scarcity challenges, assessing model generalizability across cancer sites, and evaluating the resulting plans in terms of dose conformity and optimization efficiency. The methodology involved curating a dataset of breast and prostate cancer plans, implementing a tailored feature extraction process, and training the 2D U-Net model. Model performance was evaluated using metrics such as Dose Mean Absolute Error and Gamma Passing Rates (3%/3 mm). Additionally, the study analyzed optimization efficiency by monitoring objective value curves during dose-mimicking optimization. The results demonstrate that the proposed approach significantly improves dose conformity compared to FMO-based initialization. Plans initialized with predicted MLC apertures achieved higher gamma passing rates and lower dose MAE. The General model, trained on combined breast and prostate data, effectively predicted machine parameters for both cancer sites, demonstrating its capacity to generalize across diverse anatomies. This directly tackles the reliance on 3D model inputs in recent studies, which demand extensive datasets and have limited adaptability across multiple cancer sites. Furthermore, analysis of objective value curves suggests that the proposed initialization method could potentially reduce the number of optimization iterations needed to achieve clinically acceptable dose distributions, improving planning efficiency. While the study is limited to generated, non-clinically approved plans and focuses on a single treatment machine, the findings highlight the potential of this approach to set new benchmarks in VMAT planning. Future research should prioritize validation on clinical plans, extending the method to additional cancer sites and multi-arc treatments, and conducting comparative studies with recent 3D deep learning approaches. This thesis contributes to the growing body of research exploring AI- driven radiotherapy solutions, providing a foundation for more accurate, efficient, and adaptable VMAT treatment planning systems.

Abstract [sv]

Denna avhandling undersöker tillämpningen av djupinlärning för att au- tomatisera och förbättra planeringen av Volumetric Modulated Arc The- rapy (VMAT). Traditionell VMAT-planering bygger på att lösa ett dos- efterliknande optimeringsproblem för att bestämma maskinparametrar, en process som är mycket känslig för initiala förhållanden på grund av dess icke-konvexa natur. Vanligtvis innebär initieringen optimering av fluenskartor (FMO) följt av bladkonvertering, vilket ofta resulterar i suboptimala maskinparametrar för VMAT. Nyare studier inom djupinlärning för prediktion av maskinparametrar vid VMAT har utforskat arkitekturer som 3D U-Nets och encoder-decoder- modeller för att direkt förutsäga MLC-bladspositioner och monitorenheter (MUs). Även om dessa metoder är lovande, står de inför utmaningar som databegränsning och begränsad generaliserbarhet. Användningen av 3D-inmatningar, som kräver stora dataset av segmenterade anatomiska strukturer eller dosfördelningar, har begränsat deras användbarhet till enskilda cancerformer, vilket ofta kräver separata modeller för varje område. Den föreslagna metoden använder en 2D U-Net-modell för att förutsäga öppningar i multi-leaf kollimatorn (MLC) direkt från dosutsnitt i strålögonvy (BEV). De förutsagda öppningarna används sedan för att initiera MU-endast optimering, vilket genererar maskinparametrar för dosberäkning eller vidare optimering. Denna avhandling adresserar fyra centrala forskningsfrågor rela- terade till att hantera utmaningar med databegränsning, utvärdera modellens generaliserbarhet över olika cancerområden och bedöma de resulterande planerna utifrån dosöverensstämmelse och optimeringseffektivitet. Metodiken omfattade skapandet av ett dataset med bröst- och prostatacan- cerplaner, implementering av en anpassad funktionsutvinningsprocess och träning av 2D U-Net-modellen. Modellens prestanda utvärderades med hjälp av metrik som dosens medelfel (Dose MAE) och gammaövergångsfrekvenser (3%/3 mm). Dessutom analyserades optimeringseffektiviteten genom att övervaka målfunktionskurvor under dos-efterliknande optimering. Resultaten visar att den föreslagna metoden avsevärt förbättrar dosöver- ensstämmelsen jämfört med FMO-baserad initiering. Planer som initierades med förutsagda MLC-öppningar uppnådde högre gammaövergångsfrekvenser och lägre Dose MAE. Den generella modellen, som tränades på kombinerad data från bröst- och prostatacancer, förutsåg effektivt maskinparametrar för båda cancerformerna och visade sin kapacitet att generalisera över olika anatomier. Detta adresserar direkt beroendet av 3D-modellinmatningar i nyare studier, som kräver omfattande dataset och har begränsad anpassningsförmåga över flera cancerområden. Vidare tyder analysen av målfunktionskurvor på att den föreslagna initieringsmetoden potentiellt kan minska antalet optimerings- iterationer som behövs för att uppnå kliniskt acceptabla dosfördelningar, vilket förbättrar planeringseffektiviteten. Även om studien är begränsad till genererade, ej kliniskt godkända planer och fokuserar på en enda behandlingsmaskin, framhäver resultaten potentialen hos denna metod att sätta nya standarder för VMAT-planering. Framtida forskning bör prioritera validering på kliniska planer, utvidga metoden till ytterligare cancerformer och multi-arc-behandlingar samt genomföra jämförande studier med nyare 3D-djupinlärningsmetoder. Denna avhandling bidrar till den växande forskningen kring AI-drivna lösningar för strålterapi och lägger en grund för mer exakta, effektiva och anpassningsbara system för VMAT-planering.

Place, publisher, year, edition, pages
2025. , p. 60
Series
TRITA-EECS-EX ; 2025:13
Keywords [en]
Deep Learning, Dose-Mimicking Optimization, Treatment Planning, Volu- metric Modulated Arc Therapy
Keywords [sv]
Djupinlärning, Optimering av dosefterlikning, Behandlingsplanering, Voly- metrisk Modulerad Bågterapi
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-361681OAI: oai:DiVA.org:kth-361681DiVA, id: diva2:1947296
External cooperation
RaySearch Laboratories AB
Supervisors
Examiners
Available from: 2025-03-31 Created: 2025-03-25 Last updated: 2025-03-31Bibliographically approved

Open Access in DiVA

fulltext(1504 kB)27 downloads
File information
File name FULLTEXT02.pdfFile size 1504 kBChecksum SHA-512
b283ea6cd98f73d54e1272dcbd4156d5a5cc11fe3d71911b8385b28e71b08c388bb140f2e67666e3095d30274aec38b4798a9809968b6f99412cf92b3b3280e5
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 28 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 302 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf