Change search
ReferencesLink to record
Permanent link

Direct link
Implementing Cauchy Reed-Solomon Utilizing OpenCL
Blekinge Institute of Technology, School of Computing.
2013 (English)Student thesisAlternative title
Cauchy Reed-Solomon implementerat med OpenCL (Swedish)
Abstract [en]

In this paper the performance of executing Cauchy Reed-Solomon (CRS) coding on the GPU is evaluated and compared with execution on the CPU. Three different prototypes are developed. One is sequential and developed in C++, the other two are developed utilizing C++ and OpenCL. The measurements are done by comparing the execution time of different data block sizes ranging from 16KB up to 256MB with two different encoding ratios, 9/12 and 10/16. The measurements are done on an Intel CPU with 4 cores with an integrated graphics card and an AMD graphics card. The OpenCL prototypes are executed with three different targets, the CPU, the integrated graphics card and the AMD graphics card. The sequential prototype is executed on the same CPU, but on a single core. The results from the measurements show that the GPU is faster than the CPU on larger data sizes. The highest measured throughput is achieved with the multithreaded CPU prototypes (OpenCL executed on the CPU) for sizes around 1MB.

Abstract [sv]

I den här rapporten genomförs prestandatester för exekvering av Cauchy Reed-Solomon (CRS) coding på grafikkortet och jämförs med exekvering på en CPU. Tre olika prototyper har utvecklats. En är sekventiell och utvecklad i C++, de två andra är utvecklade i OpenCL och C++. Testerna genomförs genom tidtagning på olika stora datablock, från 16KB upp till 256MB med olika enkodnings ratios, 9/12 och 10/16. CPU:n som används i testerna är en Intel CPU med 4 kärnor, och grafikkorten som används är det integrerade grafikkortet på CPU:n samt ett grafikkort från AMD. OpenCL prototyperna exekveras med tre olika inställningar, CPU för multitrådat, det integrerade Intel grafikkortet och det dedikerade AMD grafikkortet. Den sekventiella prototypen exekveras på samma CPU, men med en kärna. Resultaten från experimenten visar att grafikkorten är snabbare än CPU:n för större datablock. Den prototyp som fick högst genomströmning av data var den multitrådade CPU prototypen för datablock i storleksordningen 1MB.

Place, publisher, year, edition, pages
2013. , 40 p.
Keyword [en]
OpenCL, Cauchy Reed-Solomon, GPGPU, Graphicscard
National Category
Mathematics Computer Science
URN: urn:nbn:se:bth-4823Local ID: diva2:832171
Educational program
PAACI Master of Science in Game and Software Engineering
Physics, Chemistry, Mathematics
Available from: 2015-04-22 Created: 2014-01-12 Last updated: 2016-02-22Bibliographically approved

Open Access in DiVA

fulltext(666 kB)33 downloads
File information
File name FULLTEXT01.pdfFile size 666 kBChecksum SHA-512
Type fulltextMimetype application/pdf

By organisation
School of Computing
MathematicsComputer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 33 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 181 hits
ReferencesLink to record
Permanent link

Direct link