Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Bootstrapping Language Description: The case of Mpiemo (Bantu A, Central African Republic)
Department of Computing Science, Chalmers University, Gothenburg.
Department of African Languages, Gothenburg University, Gothenburg.
Department of African Languages, Gothenburg University, Gothenburg.
Uppsala universitet, Humanistisk-samhällsvetenskapliga vetenskapsområdet, Språkvetenskapliga fakulteten, Institutionen för lingvistik och filologi.
2008 (Engelska)Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Linguists have long been producing grammatical decriptions of yet undescribed languages. This is a time-consuming process, which has already adapted to improved technology for recording and storage. We present here a novel application of NLP techniques to bootstrap analysis of collected data and speed-up manual selection work. To be more precise, we argue that unsupervised induction of morphology and part-of-speech analysis from raw text data is mature enough to produce useful results. Experiments with Latent Semantic Analysis were less fruitful. We exemplify this on Mpiemo, a so-far essentially undescribed Bantu language of the Central African Republic, for which raw text data was available.

Ort, förlag, år, upplaga, sidor
2008.
Nyckelord [en]
Mpiemo, Bantu A, Central African Republic, NLP, Latent Semantic Analysis, bootstrapping
Nationell ämneskategori
Studier av enskilda språk Språkteknologi (språkvetenskaplig databehandling)
Identifikatorer
URN: urn:nbn:se:uu:diva-126666OAI: oai:DiVA.org:uu-126666DiVA, id: diva2:326014
Konferens
Sixth international conference on Language Resources and Evaluation, LREC 2008, 28-30 May 2008, Marrakech
Tillgänglig från: 2010-06-30 Skapad: 2010-06-21 Senast uppdaterad: 2018-12-06Bibliografiskt granskad

Open Access i DiVA

fulltext(153 kB)182 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 153 kBChecksumma SHA-512
1003785b34ed450fe11dcc96e0a7b606b55f1b40919d417fb02764670007aa786fb2ae8302fccdfa937ea1083e0262933fb53a4be264757235f8218b498d8324
Typ fulltextMimetyp application/pdf

Övriga länkar

http://www.lrec-conf.org/proceedings/lrec2008/pdf/848_paper.pdf

Sök vidare i DiVA

Av författaren/redaktören
Hammarström, HaraldWesterlund, Torbjörn
Av organisationen
Institutionen för lingvistik och filologi
Studier av enskilda språkSpråkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 182 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 501 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf