Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Distributed Graph Mining: A study of performance advantages in distributed data mining paradigms when processing graphs using PageRank on a single node cluster
KTH, Skolan för datavetenskap och kommunikation (CSC).
KTH, Skolan för datavetenskap och kommunikation (CSC).
2015 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
Abstract [en]

Distributed data mining is a relatively new area within computer science that is steadily growing, emerging from the demands of being able to gather and process various distributed data by utilising clusters. This report presents the properties of graph structured data and what paradigms to use for efficiently processing the data type, based on comprehensive theoretical studies applied on practical tests performed on a single node cluster. The results in the study showcase the various performance aspects of processing graph data, using different open source paradigm frameworks and amount of shards used on input. A conclusion to be drawn from this study is that there are no real performance advantages to using distributed data mining paradigms specifically developed for graph data on single machines. 

Ort, förlag, år, upplaga, sidor
2015.
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:kth:diva-166449OAI: oai:DiVA.org:kth-166449DiVA: diva2:811098
Handledare
Examinatorer
Tillgänglig från: 2015-05-12 Skapad: 2015-05-10 Senast uppdaterad: 2015-05-12Bibliografiskt granskad

Open Access i DiVA

fulltext(5887 kB)1545 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 5887 kBChecksumma SHA-512
83007ef3cca55d30e8b22ce7df32fd7f706a635645e3d1fc7021ddbb0e0340e60795de8850cbdc1c972f9a4b385f6e362c5af429e32fe7c491ec2ac06ce06606
Typ fulltextMimetyp application/pdf

Av organisationen
Skolan för datavetenskap och kommunikation (CSC)
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 1545 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

Totalt: 970 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf