Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Classify Swedish bank transactions withearly and late fusion techniques
KTH, School of Computer Science and Communication (CSC).
2014 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Categorising bank transactions to predened categories are essential for getting a good overview of ones personal nance. Tink provides a mobile app for automatic categorisation of bank transactions. Tink's categorisation approach is a clustering technique with longest prex match based on merchant.This thesis will examine if a machine learning model can learn to classify transactions based on its purchase, what was bought, instead of merchant.This thesis classies bank transactions in a supervised learning setting by exploring early and late fusion schemes on three types of modalities (text, amount,date) found in Swedish bank transactions. Experiments are carried out with Naive Bayes, Support Vector Machines and Decision Trees. The dierent fusionschemes are compared with no fusion, learned on only one modality, and stacked classication, learning models in a pipe-lined fashion.The early fusion concatenation schemes shows all worse performance than no fusion on the text modality. The late fusion experiments on the other hand shows no impact of modality fusion.Suggestions are made to change the feedback loop from user, to get more data labeled by users, which would potentially boost the other modalities importance

Abstract [sv]

Att sköta sin privatekonomi med hjälp av kategorisering gör nog många människor omedvetet, en försöker helt enkelt få en känsla pa vad en lägger sina pengar på. För att kunna ge full översikt på hur ens privatekonomi ser ut, har Tink skapat en mobilapplikation for att automatiskt kategorisera banktransaktioner. Detta görs just nu med klustering och längsta prex matchning på forsäljningsställe. Kategoriseringen av banktransaktioner ger användaren en direkt återkoppling på hur pengaflödet ser ut samt till vad och när dessa köp görs. Den har uppsatsen kommer att undersoka om en maskininlärningsmodell kan lära sig att klassicera banktransaktioner baserat pa köp istället för försäljningsställe. Genom att undersöka två olika fusioneringsscheman på tre typer av modaliteter funna i banktransaktioner (text, pris och datum), ska vi forsoka uttröna dessa modaliteters påverkan på klassicering. De olika scheman är jamförda med ingen fusionering, dvs inlärning på endast en modalitet, och travad klassicering,dvs inlärning med era efterföljande modeller.Experimenten ar gjorda med supervised-learning och inlärningsmodellerna är Naive Bayes, Support Vector Machines samt Beslutstrad. Experimenten visar på att klassicering på text, alltså försäljningsställe ger bäst resultat i jämförelse med alla de andra experimenten. I de tidiga fusionsexperimenten visar alla modalitet-sammanslagningar sämre resultat än ingen fusion på bara text. De sena fusion experimenten visar å andra sidan ingen skillnad alls efter fusionering med modaliteternas pris och datum. Förslag på förbättrad klassicering på köp antas öka, alltså modaliteternas pris och datum bör vara mer betydande, om mer var datamärkt av användare.

Place, publisher, year, edition, pages
2014.
National Category
Computer and Information Science
Identifiers
URN: urn:nbn:se:kth:diva-156312OAI: oai:DiVA.org:kth-156312DiVA: diva2:766162
Examiners
Available from: 2014-11-27 Created: 2014-11-26 Last updated: 2014-11-27Bibliographically approved

Open Access in DiVA

fulltext(1199 kB)644 downloads
File information
File name FULLTEXT01.pdfFile size 1199 kBChecksum SHA-512
a8b88248b8ff959fbd48a1beec78c00aff5c49ef8e0a2db4f4b9836b59a3855e8ccbb0a948422727756d62143d739f8559d6125c0a868b2df72127f7e843e182
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer and Information Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 644 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 213 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf