Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Detektion av “troll” i Twitterflöden med hjälp av klusteralgoritm: Metod för att detektera personer som sprider desinformation
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2016 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Detection of “trolls” in Twitter feeds using clustering algoritm : A method for detecting people spreading disinformation (English)
Abstract [sv]

Sociala medier har alltid varit en plats där personer kan diskutera fritt om sina åsikter och dela nyheter med många. Lätt spridning av nyheter från alla hörn i världen kan komma vara användbart för att ha möjlighet att få opartiska nyheter. Även om det finns klara fördelar med exempelvis Twitter så kan det vara problematiskt med falska och uppgjorda nyheter. Ryktesspridning eller uppgjorda nyheter förekommer i stor utsträckning fortfarande, här testas metod(er) för att upptäcka vilka som kan tänkas sprida desinformation, så kallade ’trolls’. För att kunna upptäcka trolls i Twitter undersöks några attributer som tidigare använts för att detektera spammare. Problem uppstår då det inte finns några fastställda troll att jämföra med. Datasamling från Twitter utfördes och analyserats, genom att klustra data med viktiga attribut som skulle indikera på förekomst av trolls som exempelvis antalet tweets varje dag eller hur ofta det retweetas. Men klustringen ger inte 100% indikation på att det finns trolls utan att det skulle kunna öka sannolikheten att hitta trolls i ett kluster där en typisk twitterkonto har hög andel retweets eller följare genom vänner. Slutsatsen blev att metoden kan inte hitta trolls på egen hand men kan hjälpa till att isolera användare med specifika beteenden som kan vara mer eller mindre troll-lika.

Abstract [en]

Social media has always been a place where people can discuss freely about their opinions and share news with many. Easy dissemination of news from all corners of the world may be useful to be able to get unbiased news. But although there are clear advantages, for example, with Twitter it can be problematic with false and rigged news. Rumor or news-fixing exists and to a large extent still is, this report tests method(s) to detect those that might spread disinformation, so-called ’trolls’. In order to detect a troll in Twitter some attributes previously been used to detect spammers, are being examined. Problems arise as a lack of ground truth facts to compare and back the results with. Data Collection from Twitter were performed and analyzed by clustering the data with the key attributes that would indicate the presence of trolls such as the number of tweets each day or how often it retweets. However, clustering does not give 100% indication that there are trolls but it could increase the probability of finding troll in a cluster where a typical Twitter account has high proportion retweets or followers through friends. The conclusion was that the method can not find trolls by its own. What it can do is isolate specific behaviors that can be more or less troll-like.

Place, publisher, year, edition, pages
2016. , 29 p.
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-187498OAI: oai:DiVA.org:kth-187498DiVA: diva2:930654
Subject / course
Computer Science
Educational program
Master of Science in Engineering - Computer Science and Technology
Supervisors
Examiners
Available from: 2016-05-25 Created: 2016-05-24 Last updated: 2016-05-25Bibliographically approved

Open Access in DiVA

fulltext(1847 kB)125 downloads
File information
File name FULLTEXT01.pdfFile size 1847 kBChecksum SHA-512
7a60a85dd7f12915254e32911ca8577805a4e9f6b7a3c2cc326b71ab4d3d5730ea00f48c8994942a75f584ebfc75b998bd8a1508293e7f5b585042d1e487675b
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Yousef, AndyLansner, Erik
By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 125 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 334 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf