Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Multi-version Storage: Code Design and Repair in Distributed Storage Systems
KTH, School of Electrical Engineering (EES), Information Science and Engineering.
2017 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

With the rapid growth of data volume, data storage has attracted more and more researchinterests in recent years. Distributed storage systems play important roles ofmeeting the demand for data storage in large amounts. That is, data are stored bymultiple storage nodes which are connected together with various network topologies.The main merits of such distributed storage are faster response, higher reliability andbetter scalability. However, due to network failure, link outage or bu↵er overflow, theupdated data might not be received by all storage nodes, resulting in the coexistenceof multiple versions of the file in the system. Thus, the major challenge is consistency,which means that the latest version of the file is accessible to any read request. We aimto study multi-version storage and code design in distributed storage systems, where thelatest version of the file or a version close to the latest version is recoverable. Moreover,compared to previous studies, higher availability can be achieved in our system model,namely, at least one version of the file can be obtained.On the other hand, both storage nodes and links are vulnerable to fail in storage systems.For the sake of reliability demand, the lost data is supposed to be reconstructed.In this thesis, additional storage nodes dedicated to repair (DR storage nodes) are introducedin the repair process. The results show that optimal repair bandwidth withminimal additional storage space can be achieved by introducing a certain number ofDR storage nodes. Subsequently, linear combinations are provided to reduce the communicationcost of repair where the link cost is high. Last but not the least, we showthat the cooperation among surviving nodes and DR storage nodes suffices to completethe repair process successfully even with link failure.

Abstract [sv]

Med tanke på den snabbt växande volymen av data, har intresset för forskning på datalagring vuxit under de senaste åren. Distribuerade lagringssystem spelar en viktig rolli att möta behovet av stora volymer av lagring. Distribuerade lagringssystem är alltsånär data är sparad på flera noder som är sammankopplade på olika sätt i ett nätverk.Jämfört med traditionella lokala lagringar, har distribuerad lagring fördelen att den harkortare svarstider, högre tillförlitlighet och bättre skalbarhet. Men om nätverket gårner, det blir ett länkavbrott eller maxkapaciteten i en buffert nås, kan det hända attall uppdatering inte når ut till alla noder, vilket resulterar i att flera olika versioner aven fil finns sparande samtidigt i systemet. Därför är en av utmaningarna är att varakonsekvent, att det alltid är den senaste versionen av en fil finns tillgänglig för allavid varje given tidpunkt. Målet med detta arbete är att studera flerversionslagrade fileroch hur programmeringsdesignen för distribuerade lagringssystem ser ut. Med andraord, finns det flera versioner av en fil, ska alla kunna återskapas. Jämfört med tidigarestudier, har vi med vårt system uppnått högre tillgänglighet, nämligen att en klient harfått tag i alla fall en version av en fil.Ett vanligt förkommande problem i det distribuerade lagringssystemen är fel i nodernaoch då ska en ny nod skapas för att öka behovet av tillit. I detta projekt, extralagringsnoder för reparation (DR lagringsnoder) är introducerade i reparationsprocessen.Resultatet visar att den optimala reparationsbandbredden med minimalt extra lagringsutrymmekan uppnås genom att introducera en specifikt antal DR lagringsnoder.Efter det, linjärkombinationer är framtagna för att reducera kostnaden att reparera därlänkkostnaden är hög. Sist men inte minst har vi kunnat påvisa att samarbete medandra fortfarande uppkopplade noder och med DR lagringsnoderna räcker för att utföraen lyckad reparationsprocess, även med länkavbrott.

Place, publisher, year, edition, pages
2017. , p. 35
Series
TRITA-EEA ; 2017:052
National Category
Electrical Engineering, Electronic Engineering, Information Engineering
Identifiers
URN: urn:nbn:se:kth:diva-209546OAI: oai:DiVA.org:kth-209546DiVA, id: diva2:1112609
Educational program
Master of Science - Wireless Systems
Supervisors
Examiners
Available from: 2017-06-20 Created: 2017-06-20 Last updated: 2017-06-20Bibliographically approved

Open Access in DiVA

fulltext(1141 kB)65 downloads
File information
File name FULLTEXT01.pdfFile size 1141 kBChecksum SHA-512
46047971a484d747cd51140ac40b0c84170e5047608faf4fa43fdf34157d938091d90bf207183f56c39a8c74860b35f56fc791bca950cffacccd3c1ebf3ee22e
Type fulltextMimetype application/pdf

By organisation
Information Science and Engineering
Electrical Engineering, Electronic Engineering, Information Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 65 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 804 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf