Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Predicting movie success using machine learning techniques
KTH, School of Computer Science and Communication (CSC).
KTH, School of Computer Science and Communication (CSC).
2017 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Förutsägelse av filmers framgång med maskininlärning (Swedish)
Abstract [en]

The area of creating predictive models using machine learning has increased in size in recent years. The market for movies is still big with hundreds of new movies created every year. The purpose of this report is to investigate whether it is possible to classify movie rating and box office revenue with metadata available before release. This was done by building a classification model with metadata obtained from the internet such as, budget and what actors are involved, etc. This study managed to correctly predict what rating a movie would have about 82% of the time using the technique with the highest success rate. The times as a model failed to predict the correct rating, it was usually by one rating group, corresponding to a deviation of approximately 17%. When a prediction of gross sales was made, it gave a positive result of 15% of the time. The results of this report are to a certain extent consistent with previous studies with similar focus in the prediction of the grade. The precision of the predictions can further be increased with a larger data set with more features. 

Abstract [sv]

Området med att skapa prediktiva modeller med maskininlärning har ökat i storlek de senaste åren. Marknaden för filmer är stor med hundratals nya filmer skapade varje år. Syftet med denna rapport är att undersöka om det är möjligt att klassificera filmbetyg och brutto biljettförsäljing med metadata som är tillgängliga före utgåvan. Detta gjordes genom att bygga en klassificeringsmodell med metadata som erhållits från internet, såsom budget och vilka aktörer som är involverade etc. Denna studie lyckades korrekt förutsäga vilket betyg en film erhåller omkring 82% av fallen med den mest framgångsrika modell. I de utfallen där modellen misslyckades med att förutsäga rätt betyg, det var vanligtvis av en betygsklass, vilket motsvarade en avvikelse på ungefär 17%. När en förutsägelse för bruttoförsäljningen gjordes gav det ett positivt resultat av 15% av fallen. Resultaten av denna rapport är i viss utsträckning förenlig med tidigare studier med liknande metodik. Precisionen på förutsägelserna kan ökas med ett utökat data set med fler attribut

Place, publisher, year, edition, pages
2017.
National Category
Computer Sciences
Identifiers
URN: urn:nbn:se:kth:diva-208506OAI: oai:DiVA.org:kth-208506DiVA, id: diva2:1106715
Supervisors
Examiners
Available from: 2017-06-19 Created: 2017-06-08 Last updated: 2018-01-13Bibliographically approved

Open Access in DiVA

fulltext(1216 kB)680 downloads
File information
File name FULLTEXT01.pdfFile size 1216 kBChecksum SHA-512
dd7bdbf9fc32ee1ebab6cf8b9cd9c6c3c297aede950ece57b67f4956acbff2412ab572be504ea3fb27da4696f183df7686e8895e9fc9f037e7ac174be48d2e15
Type fulltextMimetype application/pdf

By organisation
School of Computer Science and Communication (CSC)
Computer Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 680 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 1238 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf