Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Ordföljdsvariation inom kardinaltalssystem: Extraktion av ordföljdstypologi ur parallella texter
Stockholm University, Faculty of Humanities, Department of Linguistics.
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Numeral-dependent word order of cardinal numbers (English)
Abstract [sv]

Typologisk klassificering av kardinaltals ordföljdstendenser har generellt utgått från en binär uppdelning i pre- och postnominella språk, men viss inomspråklig variation i ordföljdsmönster mellan olika kardinaltal har hittats bland världens språk. Tillgång till parallelltexter på många olika språk möjliggör storskalig kvantitativ typologisk analys av syntaktiska fenomen som detta, givet en lämplig strategi för språkoberoende parsning av icke-annoterat material.

I denna studie undersöks aspekter av kardinaltalsberoende ordföljdsvariation i 1336 språk genom ordlänkning och annoteringsöverföring i en massivt parallell korpus av Bibelöversättningar.

Källtexter märks upp med syntaktisk och lexikal annotering som förs över till icke-annoterad ordlänkad data på andra språk, och ordföljdstendenser för varje kardinaltal och språk mäts statistiskt. Utvärdering av metodens klassificering av generell kardinaltalsordföljd gav 87 % överensstämmelse med data från den manuellt sammanställda WALS-databasen, i linje med tidigare evalueringar av liknande metoder.

Variation i ordföljdsmönster mellan individuella kardinaltal uppvisades i en väsentlig andel av undersökta språk, vilket motiverar värdet av en mer detaljerad klassificering av kardinaltals ordföljdstypologi. Undersökning av seriell ordföljdsvariation, där ett seriellt gränsvärde finns mellan olika dominerande ordföljdstyper i ett språks kardinaltalssystem, visade att den överlägset vanligaste strukturen för seriell variation i den undersökta datan var prenominella uttryck för 1 i språk där den dominerande kardinaltalsordföljden klassats som postnominell.

Abstract [en]

Typological word order classification for cardinal numerals has generally used a binary pre- or postnominal model, but in some languages word order behaviour has been shown to vary between individual cardinal numerals. This phenomenon can be quantitatively studied on a larger typological scale using massively parallel texts, given a cross-language method for parsing non-annotated texts.

In this study, cardinal numeral-dependent word order variation is extracted from Bible translations in 1336 languages through word alignment and annotation transfer from syntactically and lexically annotated source texts to all translations in the corpus. Classification of dominant numeral word order using the transferred annotations agreed with manually gathered classifications from the WALS database for 87 % of common languages, which is in line with previous similar studies.

Possible numeral-dependent word order variation was identified in a significant number of languages in the sample, supporting the case for use of a more nuanced word order classification structure. Analysis of serial word order variation, where a cardinal numeral of a certain value separates continuous numeral sequences with different dominant word orders, showed the most common structure for this type of variation to be the 1-numeral preceding the noun while all other numerals follow the noun they modify.

Place, publisher, year, edition, pages
2019. , p. 34
Keywords [en]
cardinal numerals, word order typology, annotation transfer, word alignments
Keywords [sv]
kardinaltal, ordföljdstypologi, annoteringsöverföring, ordlänkning
National Category
General Language Studies and Linguistics
Identifiers
URN: urn:nbn:se:su:diva-170300OAI: oai:DiVA.org:su-170300DiVA, id: diva2:1330503
Supervisors
Examiners
Available from: 2019-06-25 Created: 2019-06-25 Last updated: 2019-06-25Bibliographically approved

Open Access in DiVA

fulltext(1326 kB)19 downloads
File information
File name FULLTEXT01.pdfFile size 1326 kBChecksum SHA-512
b97671877ad17e1f6597448896a82db70a932919835e5bb62a2a8990427b7ec29ac2ca1153087e2fbea18585b9415330f08bb28338f2290b1caa3f14a96c8a71
Type fulltextMimetype application/pdf
Bilaga B: Sammanställning av ordföljdskategorisering(172 kB)32 downloads
File information
File name ATTACHMENT01.csvFile size 172 kBChecksum SHA-512
9370b7336cd1145ff17f5d1d13490283d59099f6404a3d12f8a753a3281e1eb46bf4e2a68e73682d800458dec995fc38a9e5f3e80708ad53490f048760e468e1
Type attachmentMimetype text/csv

By organisation
Department of Linguistics
General Language Studies and Linguistics

Search outside of DiVA

GoogleGoogle Scholar
Total: 19 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 49 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf