Change search
ReferencesLink to record
Permanent link

Direct link
A Statistical Framework for Classification of Tumor Type from microRNA Data
KTH, School of Engineering Sciences (SCI), Mathematics (Dept.), Mathematical Statistics.
2016 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Ett statistiskt ramverk för klassificering av tumörtyp från mikroRNA data (Swedish)
Abstract [en]

Hepatocellular carcinoma (HCC) is a type of liver cancer with low survival rate, not least due to the difficulty of diagnosing it in an early stage. The objective of this thesis is to build a random forest classification method based on microRNA (and messenger RNA) expression profiles from patients with HCC. The main purpose is to be able to distinguish between tumor samples and normal samples by measuring the miRNA expression. If successful, this method can be used to detect HCC at an earlier stage and to design new therapeutics. The microRNAs and messenger RNAs which have a significant difference in expression between tumor samples and normal samples are selected for building random forest classification models. These models are then tested on paired samples of tumor and surrounding normal tissue from patients with HCC. The results show that the classification models built for classifying tumor and normal samples have high prediction accuracy and hence show high potential for using microRNA and messenger RNA expression levels for diagnosis of HCC.

Abstract [sv]

Hepatocellulär cancer (HCC) är en typ av levercancer med mycket låg överlevnadsgrad, inte minst på grund av svårigheten att diagnosticera i ett tidigt skede. Syftet med det här projektet är att bygga en klassificeringsmodell med random forest, baserad på uttrycksprofiler av mikroRNA (och budbärar-RNA) från patienter med HCC. Målet är att kunna skilja mellan tumörprover och normala prover genom att mäta uttrycket av mikroRNA. Om detta mål uppnås kan metoden användas för att upptäcka HCC i ett tidigare skede och för att utveckla nya läkemedel. De mikroRNA och budbärar-RNA som har en signifikant skillnad i uttryck mellan prover från tumörvävnad och intilliggande normal vävnad väljs ut för att bygga klassificaringsmodeller med random forest. Dessa modeller testas sedan på parade prover av tumörvävnad och intilliggande vävnad från patienter med HCC. Resultaten visar att modeller som byggs med denna metod kan klassificera tumörprover och normala prover med hög noggrannhet. Det finns således stor potential för att använda uttrycksprofiler från mikroRNA och budbärar-RNA för att diagnosticera HCC.

Place, publisher, year, edition, pages
2016.
Series
TRITA-MAT-E, 2016:46
Keyword [en]
miRNA, mRNA, random forest, classification, HCC, diagnosis
National Category
Probability Theory and Statistics
Identifiers
URN: urn:nbn:se:kth:diva-191990OAI: oai:DiVA.org:kth-191990DiVA: diva2:957672
External cooperation
Moderna Therapeutics
Subject / course
Mathematical Statistics
Educational program
Master of Science - Applied and Computational Mathematics
Supervisors
Examiners
Available from: 2016-09-03 Created: 2016-09-03 Last updated: 2016-09-03Bibliographically approved

Open Access in DiVA

fulltext(1238 kB)22 downloads
File information
File name FULLTEXT01.pdfFile size 1238 kBChecksum SHA-512
4e88a2befdf601bc87605721b2c9249dd4a38b53ab3f8ec5c6e0238429503fa9899b1f3b5219c16ce2428d8cc69ad4dd77d04056c40a416f6dd959d76bc3ab3d
Type fulltextMimetype application/pdf

By organisation
Mathematical Statistics
Probability Theory and Statistics

Search outside of DiVA

GoogleGoogle Scholar
Total: 22 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

ReferencesLink to record
Permanent link

Direct link