Digitala Vetenskapliga Arkivet

Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Automatic Morphosyntactic Analaysis of Clinical Text
Uppsala universitet, Humanistisk-samhällsvetenskapliga vetenskapsområdet, Språkvetenskapliga fakulteten, Institutionen för lingvistik och filologi. (datorlingvistik)
Uppsala universitet, Humanistisk-samhällsvetenskapliga vetenskapsområdet, Språkvetenskapliga fakulteten, Institutionen för lingvistik och filologi. (datorlingvistik)
2014 (Engelska)Konferensbidrag, Poster (med eller utan abstract) (Refereegranskat)
Abstract [en]

Electronical health records, also called clinical texts, have their own linguistic characteristics and have been shown to deviate from standard language. Therefore, computational linguistics tools trained on standard language presumably do not achieve the same accuracy when applied to clinical data. In this paper, we describe a pipeline of tools for the automatic processing of clinical texts in Swedish from tokenization through part-of-speech tagging and dependency parsing. The evaluation of the components of the pipeline shows that existing NLP tools can be used, but performance drops greatly when models trained on standard language are applied to clinical data. We also present a small, syntactically annotated data set of clinical text to serve as gold standard.

Ort, förlag, år, upplaga, sidor
2014.
Nyckelord [en]
clinical texts, morphosyntactic analysis
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Forskningsämne
Datorlingvistik
Identifikatorer
URN: urn:nbn:se:uu:diva-239451OAI: oai:DiVA.org:uu-239451DiVA, id: diva2:774589
Konferens
The Fifth Swedish Language Technology Conference, SLTC 2014,13-14 November 2014, Uppsala, Sweden
Tillgänglig från: 2014-12-26 Skapad: 2014-12-26 Senast uppdaterad: 2018-01-11Bibliografiskt granskad

Open Access i DiVA

fulltext(316 kB)152 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 316 kBChecksumma SHA-512
206e253008da8fdf2136a1a02963a5c8de1d26bfb863713bc3e8cecdff0c461f36f6e21d7f7e317f1bc61e218f579c21b2db0abcf76d34ab13dee63c863139f0
Typ fulltextMimetyp application/pdf

Sök vidare i DiVA

Av författaren/redaktören
Megyesi, Beata
Av organisationen
Institutionen för lingvistik och filologi
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 152 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 698 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf