Social media has grown extremely fast in recent years and in the vast number of posts being made everyday people express their opinions about all kinds of topics. These opinions are very valuable and there is a need for a way to automatically identify and extract them. This is what sentiment analysis is about but there are a number of issues related to this task. In particular the large number and diversity of the texts to analyze causes problems for ordinary methods of natural language processing. In this thesis a method utilizing a technique called Random Indexing is proposed which tries to overcome some of the issues. The conclusion is that the use of Random Indexing does aid in solving the problem but also that more work is needed in order to have a fully satisfying solution.
Sentimentanalys av svenska sociala medier
Användningen av sociala medier har vuxit snabbt de senaste åren och i den stora mängd inlägg som skrivs varje dag gömmer sig många människors åsikter. Dessa åsikter innehåller värdefull information och det behövs ett sätt att automatiskt identifiera och ta tillvara på den. Sentimentanalys behandlar precis detta men det finns ett antal svårigheter med att lösa denna uppgift. Svårigheterna rör framförallt att det finns en så stor mängd texter att analysera och hur väldigt olika de kan vara. I det här exjobbet föreslås en metod som använder sig av en teknik kallad Random Indexing för att överkomma vissa av dessa svårigheter. Slutsatsen är att användningen av Random Indexing hjälper till att lösa problemen men att det fortfarande krävs mer arbete för att få fram en fullt fungerande lösning.