Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Data Mining for Description and Prediction of Antibiotic Treated Healthcare-Associated Infections
KTH, School of Technology and Health (STH).
2014 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Data mining för beskrivning och förutsägelse av antibiotikabehandlade vårdrelaterade infektioner (Swedish)
Abstract [en]

Healthcare-associated infections is the most common healthcare related injury and affect almost every tenth patient. With the purpose of reducing these infections Infektionsverktyget, The Anti-Infection Tool, was developed for registration and feedback of infection data. The tool is now used in all Swedish county councils resulting in a wealth of data. The purpose of this thesis was thus to investigate how data mining can be applied to describe patterns in this data and predict patient outcomes regarding healthcare-associated infections that need to be treated with antibiotics.

Data mining was performed with Microsoft SQL Server 2008 in which models based on six different data mining algorithms with different parameter settings were developed. They used the attributes gender, age and previous diagnoses and medical actions as inputs and antibiotic treated healthcare-associated infection outcome as output. The predictive performance of the models was evaluated using 5-fold cross validation and macro averaged measures of recall, precision and F-measure. Patterns generated by selected models were extracted.

Models based on the Naive Bayes algorithm showed the highest predictive capabilities with respect to recall and models based on the Decision Trees algorithm with low pruning had the highest precision. Although, none were considered to perform sufficiently well and several areas of improvement were identified. The most important factor in the inadequate performance is believed to be the relatively rare occurrences of infections in the dataset. Extracted patterns based on the Association Rules algorithm were considered the easiest to interpret. Patterns included clinically valid and invalid as well as trivial relationships.

Future studies should be focused on further model improvements and gathering of more patient data. The idea is that data mining in Infektionsverktyget in the future could be used both to provide ideas for further medical research and to identify risk patients and prevent healthcare-associated infections in daily clinical work.

Abstract [sv]

Vårdrelaterade infektioner är den vanligaste vårdskadan och drabbar nästan var tionde patient. Med syfte att minska antalet vårdrelaterade infektioner utvecklades Infektionsverktyget för registrering och återkoppling av infektionsdata. Verktyget används nu i alla Sveriges landsting vilket resulterar i stora mängder data. Syftet med detta examensarbete var därför att undersöka hur data mining kan användas för att beskriva mönster i denna data och för att förutsäga om patienter kommer att drabbas av en vårdrelaterad infektion som behöver antibiotikabehandlas.

Data mining genomfördes med Microsoft SQL Server 2008 där modeller baserade på sex olika data mining-algoritmer med olika parameterinställningar utvecklades. De hade inputattributen kön, ålder och tidigare diagnoser och medicinska åtgärder, och outputattributet utfall av antibiotikabehandlad vårdrelaterad infektion. Förutsägelseförmågan hos modellerna utvärderades med 5-delad korsvalidering och makrogenomsnitt av måtten recall, precision och F-measure. Fyra modeller användes även för att ta fram mönster ur datamängden.

Modeller baserade på Naive Bayes-algoritmen hade den bästa förutsägelseförmågan med avseende på recall och modeller baserade på Decision Trees-algoritmen med en låg beskärningsnivå uppnådde bäst precision. Trots detta ansågs ingen av modellerna prestera tillräckligt bra och flera möjliga förbättringsområden hittades. Den viktigaste anledningen till den otillräckliga förutsägelseförmågan tros vara att infektioner är relativt ovanliga i datamängden. Mönster som tagits fram med Association Rules-algoritmen ansågs vara lättast att tolka. Mönstren innehöll både kliniskt relevanta och irrelevanta såväl som triviala samband.

Framtida studier bör fokuseras på att förbättra modellerna ytterligare och att samla in mer patientdata. Idén är att data mining i Infektionsverktyget i framtiden skulle kunna användas för att ge uppslag till medicinsk forskning och för att identifiera riskpatienter och därmed förebygga vårdrelaterade infektioner i den dagliga kliniska verksamheten.

Place, publisher, year, edition, pages
2014. , 79 p.
Series
TRITA-STH, 2014: 89
Keyword [en]
data mining, healthcare-associated infections
National Category
Medical Engineering
Identifiers
URN: urn:nbn:se:kth:diva-154200OAI: oai:DiVA.org:kth-154200DiVA: diva2:755523
External cooperation
Mawell Scandinavia AB
Subject / course
Medical Engineering
Educational program
Master of Science - Medical Engineering
Presentation
2014-09-12, 15:15 (English)
Supervisors
Examiners
Available from: 2014-10-27 Created: 2014-10-14 Last updated: 2014-10-27Bibliographically approved

Open Access in DiVA

emmy_damberg_thesis(1622 kB)506 downloads
File information
File name FULLTEXT01.pdfFile size 1622 kBChecksum SHA-512
eecb7c3b0be58439f16ccfbfa6b364b6620bb902b6991c268ec8ab3e5a1b2c4ab09faa8e9c1f4fb703ec68b626473d7b07f2d294f1bf8d7e888812e5249faddb
Type fulltextMimetype application/pdf

By organisation
School of Technology and Health (STH)
Medical Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 506 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 612 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf