Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Predicting Airbnb user's desired travel destinations
KTH, School of Computer Science and Communication (CSC).
2017 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Förutsäga nya Airbnb användares första resemål (Swedish)
Abstract [en]

The purpose of this report is to go through how to predict user’s intentions with machine learning and describe our thought process when working on the different stages of solving this type of problem. This will be done by solving Airbnb’s Kaggle problem where they wanted Kaggle users to predict where their users were most likely going to travel to based on data from their website. We go through the different choices we made while cleaning and prepairing the provided datasets and the reasoning behind these. The prediction is made using XGBoost and its boosted decision tree algorithm with several different approaches to how we go about preparing the data for training. Finally we upload the results for validation on the Kaggle challenge page and we discuss the strengths and weaknesses behind every approach and discuss what more could have been done to further improve the result.

Abstract [sv]

Syftet med denna rapport är att gå igenom hur man kan förutsäga användares avsikter med maskininlärning och beskriva vår tankeprocess när man arbetar på de olika stadier som krävs för att lösa denna typ av problem. Detta kommer att göras genom att lösa Airbnbs Kaggleproblem där de ville att Kaggle-användare skulle förutsäga var deras nya användare troligtvis skulle resa till baserat på data från deras hemsida. Vi går igenom de olika val som vi gjorde när vi rengjorde och förberedde de tillhandahållna dataseten och resonemanget bakom dessa. Förutsägelsen görs med hjälp av XGBoost och dess boosted decision tree algorithm med flera olika tillvägagångssätt för hur vi arbetade med att förbereda data för träning. Slutligen laddar vi upp resultaten för validering på Kaggles utmaningssida och vi diskuterar styrkor och svagheter bakom varje tillvägagångssätt samt diskuterar vad mer kunde ha gjorts för att ytterligare förbättra resultatet.

Place, publisher, year, edition, pages
2017. , 27 p.
National Category
Computer Science
Identifiers
URN: urn:nbn:se:kth:diva-208869OAI: oai:DiVA.org:kth-208869DiVA: diva2:1108334
Supervisors
Examiners
Available from: 2017-06-18 Created: 2017-06-12 Last updated: 2017-06-18Bibliographically approved

Open Access in DiVA

fulltext(933 kB)83 downloads
File information
File name FULLTEXT01.pdfFile size 933 kBChecksum SHA-512
7c74517302b2a95f23efc905a8c5fb9c1cebe94d39706c8718694f927f711084e953d0e90e750b8871ee4db6e43b906be9db1b0b88398cb34656a59a5d857cb6
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Science

Search outside of DiVA

GoogleGoogle Scholar
Total: 83 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 126 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf