Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Unsupervised Feature Extraction from CT Images for Clustering of Geological Drill Core Samples
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Oövervakad extrahering av egenskaper från CT-bilder för att hitta kluster i geologiska borrkärneprover (Swedish)
Abstract [en]

Computed tomography (CT) scanned drill cores provide a high resolution view of the internal structure and composition of the rock, which is interesting for many analysis purposes. Although, this data is very high dimensional and difficult to analyze in an automatic way. In this work, a study of how to reduce the dimensionality of these samples is done, with the objective of being able to find low dimensional representations, which then can be clustered into distinct geologically meaningful groups.

Due to the complex nature of the data, a high degree of preprocessing is required - involving thresholding, normalization, cropping, etc.

First, in order to obtain a baseline for the clusters, a clustering of the chemical compositions of the samples is done, which results in overly simplistic clusters - separating ore from the rest, due to the continuous nature of the data.

For the CT data, two approaches are tested - IPCA and convolutional autoencoders, which are able to successfully reduce the dimensions of the scanned samples. For the latter, different bottleneck dimensions are tested in order to evaluate its effect in the resulting reconstruction errors.

Nevertheless, when attempting to cluster the low dimensional embeddings, the algorithms only manage to separate the ore from the rest of the samples, as in the chemical clustering, which is too simplistic. An alternative approach is tested in order to obtain an insight of the holes - using UMAP 3D projections as RGB color coordinates, which provide colored maps of the holes that make more geological sense and provide more information than the previous approach.

To finalize, an experiment is performed by creating eight distinct classes of synthetic volumetric data with different textures and grain sizes, which resemble rock material, in order to validate the approach of clustering the convolutional autoencoder latent representations. For a sufficient number of channels, all synthetic classes are able to be clearly separated. Interestingly, latent representations of classes with bad reconstructions are still able to be clustered satisfactorily.

Abstract [sv]

Datortomografi (DT) av borrkärnor ger en högupplöst bild av den interna strukturen och sammansättningen av berget, vilket är intressant ur flera analyssynpunkter. Den här typen av data är dock av mycket hög dimensionalitet, och är därför svår att analysera automatiskt. I detta arbete görs en studie av hur dimensionaliteten kan reduceras, med syfte att hitta representationer av låg dimensionalitet, vilka sedan kan samlas i geologiskt meningsfulla, distinkta grupper.

På grund av datats komplexa natur behövs en hög grad av förbearbetning så som tröskelvärden, normalisering, klippning, etc.

I utgångspunkten, för att erhålla en baslinje för klustern, gjordes en gruppering av den kemiska kompositionen av proverna, vilket resulterade i alltför simplistiska klusters med endast en separation av malmen från resten av bergartsprovet, på grund av den kontinuerliga karakteristiken av datat.

För DT datat prövades olika angreppssätt - IPCA och faltningsankodare, vilka successivt kan reducera dimensionen hos datat. För det senare fallet provas olika flaskhalsdimensioner för att utvärdera deras effekt på de resulterande rekonstruktionsfelen.

Vid försök att gruppera den lågdimensionella representationen däremot, så visar sig bergets egen kontinuerliga natur vara ett hinder, eftersom algoritmen bara lyckas skilja malm från resten, vilket är alltför förenklat. Ett alternativt angreppssätt provas för att få en insikt om borrhålen - genom UMAP 3D-projektioner som RGB-färgkoordinater, vilket resulterade i en geologiskt relevant färgkartläggning av borrhålet och gav en bättre information än den tidigare metoden.

Avslutninsvis utfördes ett experiment genom att skapa åtta distinkta klasser av syntetiska volumetriska data med olika texturer och kornstorlek, liknande berggrundsmaterial, för att utvärdera riktigheten hos grupperingen från den faltande autoankodarens latenta representation. Med tillräckligt antal kanaler är alla syntetiska klasser tydligt separerbara. Intressant nog: latent representation av klasser med dålig rekonstruktion är fortfarande möjliga att gruppera tillfredsställande.

Place, publisher, year, edition, pages
2019. , p. 63
Series
TRITA-EECS-EX ; 2019:680
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-265543OAI: oai:DiVA.org:kth-265543DiVA, id: diva2:1377965
External cooperation
Orexplore AB
Supervisors
Examiners
Available from: 2020-01-29 Created: 2019-12-13 Last updated: 2020-01-29Bibliographically approved

Open Access in DiVA

fulltext(13540 kB)21 downloads
File information
File name FULLTEXT01.pdfFile size 13540 kBChecksum SHA-512
653a15faee8f507cd000fe705654a1fefbb7f29fdb0c8b61532d94eaba9159324e1defcb15d2fcf4e7f1a548669c8957991ec362ad4b70e7307d07b699b1bc6f
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 21 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 41 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf