Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
And the winner is...: Predicting the outcome of Melodifestivalen by analyzing the sentiment value of Tweets
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2017 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Och vinnaren är... : Att med sentimentalanalys på tweets förutspå resultatet av Melodifestivalen (Swedish)
Abstract [en]

In a world where a lot of people post their feelings about things on social media, the interest in using sentiment analysis to be able to collect and understand these feelings has arisen. This thesis aims to investigate the possibility of predicting the outcome of a television competition, decided partly by the viewers’ votes, using sentiment analysis on tweets. The lexicon AFINN and a Swedish translated version of it was used for the lexical sentiment analysis of this report. After pre-processing the tweets gathered from Twitter with the competition's hashtag, the tweets were analysed and mapped to the different competitors. Each mapped tweet was scored with a sentiment value according to the lexicons. Six different predictions were derived from the sentiment values of the tweets. The predictions was compared to the real result of the competition using Kendall tau distance, where shorter distance indicates more similarities between the lists. The result show that it is possible to make a rough prediction of the outcome of the competition where the best prediction was achieved by ranking the top 5 artists based on the sum of positive sentiment value for the songs.

Abstract [sv]

I en värld där människor postar sina känslor och åsikter om saker på sociala medier, har intresset för att genom sentimentalanalys sammanställa och förstå dem ökat. Den här uppsatsen undersöker om det är möjligt att förutspå resultatet av en tävling, där vinnaren delvis väljs av röster från tittarna, genom att göra sentimentalanalys på tweets. Det engelska lexikonet AFINN och en svensk översättning av den användes för att göra den lexikala sentimentalanalysen för den här rapporten. Efter att behandlat alla tweets med tävlingens hashtag, som samlats in från Twitter, genomfördes analysen och mappningen av de olika tweets till de olika bidragen. Varje mappat tweet blev tilldelat ett sentimentalvärde med hjälp av lexikonen. Sex olika alternativa resultatlistor togs fram baserat på sentimentalvärdena från alla sorterade tweets. De olika alternativa resultatlistorna jämfördes med det faktiska utfallet av tävlingen där likheten mellan dem mättes med Kendall tau distance, där kortare distans indikerar större likheter mellan listorna. Resultatet visar att det går att göra en ungefärlig förutsägelse på tävlingsresultatet med hjälp av sentimentalanalys, där det alternativa resultatet som bäst stämde överens med verkligheten togs fram genom att rangordna de 5 populäraste bidragen efter summan av deras positiva sentimentalvärden.

Place, publisher, year, edition, pages
2017.
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-208905OAI: oai:DiVA.org:kth-208905DiVA: diva2:1108725
Supervisors
Examiners
Available from: 2017-06-17 Created: 2017-06-12 Last updated: 2017-06-17Bibliographically approved

Open Access in DiVA

AKoskiJPersson(563 kB)8 downloads
File information
File name FULLTEXT01.pdfFile size 563 kBChecksum SHA-512
e9f519e73c3832f7292e906b7f43a6d6c891f29e6e20e3d7c43fc0aacc5f1f600dfb563a4ee427053f6b34542e47c5004029bacd892548ba3e74856da31809cd
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 8 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 13 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf