Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
JÄMFÖRELSE AV KLASSIFICERINGSMETODER PÅ DATA FRÅN BETULA-STUDIEN: En jämförande studie mellan Linjär Diskriminantanalys, Gradient Tree Boosting och Support Vector Machines
Umeå University, Faculty of Social Sciences, Umeå School of Business and Economics (USBE), Statistics.
Umeå University, Faculty of Social Sciences, Umeå School of Business and Economics (USBE), Statistics.
2017 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Performance of classifier prediction on Betula-data : A comparative study between Linear Discriminant Analyses, Gradient Tree Boosting and Support Vector Machines (English)
Abstract [sv]

Det saknas idag resultat inom forskning som kan urskilja en klassificeringsmetod som konsekvent presterar bättre än övriga, vilken metod som presterar bäst beror mer på datats karaktäristika än själva metoden. Samtidigt är klassificering ett viktigt och användbart verktyg som används inom flera områden, bland annat medicin där klassificeringsmetoder används i stor utsträckning och resultaten av klassificering kan vara livsavgörande. Det har i tidigare studier visats att kognitiva tester från Betula-studien har signifikant samband med insjuknande i demens upp till 10 år innan klinisk demens bekräftats. Det finns dock inget dokumenterat försök att prediktera demens genom klassificering med kognitiva data från Betula-studien. Syftet med denna uppsats är att undersöka hur tre olika etablerade klassificeringsmetoder, linjär diskriminantanalys, support vector machines, med polynom och radial kärna, samt gradient tree boosting presterar på ett datamaterial med tre klasser. Data kommer från Betula-studien och består av kognitiva minnestester och persondata, klasserna bestäms utifrån hur många år efter inkludering i studien en deltagare blir diagnostiserad med klinisk demens. Klass 1 utvecklade inte demens, klass 2 utvecklade demens mellan 11 och 21 år och klass 3 mellan 1 och 10 år. Eftersom fördelningen av klasserna är obalanserade, klass 1 består av ca 85% av alla observationer, undersöks även en balanserad version av datamaterialet. Resultaten visar på en viss skillnad i fördelningen av korrekta och felaktiga klassificeringar för de olika metoderna. Vad gäller andelen korrekta och felaktiga klassificeringar kan inte någon betydande skillnad påvisas. Slutsatsen är att det inte går att avgöra om någon metod presterar bättre än de övriga.

Place, publisher, year, edition, pages
2017.
National Category
Probability Theory and Statistics
Identifiers
URN: urn:nbn:se:umu:diva-137913OAI: oai:DiVA.org:umu-137913DiVA: diva2:1128851
Available from: 2017-07-30 Created: 2017-07-30 Last updated: 2017-07-30Bibliographically approved

Open Access in DiVA

fulltext(1053 kB)27 downloads
File information
File name FULLTEXT01.pdfFile size 1053 kBChecksum SHA-512
a337345aa70fb6aa534b1626658090917393468b78dbeaac1cc9f22741a398ef86042f35c5592f1ee3ed05ed32dbf190ba524c704f7f1084e67eb8d4667596e9
Type fulltextMimetype application/pdf

By organisation
Statistics
Probability Theory and Statistics

Search outside of DiVA

GoogleGoogle Scholar
Total: 27 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 46 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf