Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Labeling Moods of Movies by Processing Subtitles
KTH, School of Electrical Engineering and Computer Science (EECS).
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesis
Abstract [en]

Labeling movies by moods is a feature that is useful for recommendation engines in modern movie streaming applications. Movie recommendation based on moods is a feature that could improve user experience for movie streaming platforms by recommending more relevant movies to users. This thesis describes the development of a mood labeling feature that labels movies by processing movie subtitles through Natural Language Processing. Movies are processed by analysing subtitles to predict the mood of a movie through computational methods. The prototype utilizes movies pre-labeled with moods to construct a lexicon that contains information of the defining attributes for moods in movie subtitles. Using the constructed lexicon, the similarities between a movie subtitle and a lexicon can be compared to calculate the probability that a movie belongs to a specific mood. Four moods were chosen for analysis in the prototype: fear, sadness, joy, and surprise.The Naive Bayes method was chosen as the classifier for the prototype. A Naive Bayes classifier observes each occurring word in a movie without consideration to the context of the word in a text or sentence. The results showed that the classifier had trouble distinguishing between the moods. However, for all configurations of the prototype, the classifier showed higher precision for the mood fear compared to the other moods. Overall the classifier performed poorly and did not produce a reliable result.

Abstract [sv]

Klassificering av filmer via stämning är en funktion som är användbar för rekommendationsmotorer i moderna filmströmmingsprogram. Filmrekommendation baserad på stämning är en funktion som kan förbättra användarupplevelsen på filmströmmande plattformar genom att rekommendera mer relevanta filmer till användarna. Denna uppsats beskriver utvecklingen av en prototyp för att klassificera filmer efter deras stämning genom att bearbeta filmens undertexter med hjälp av metoder inom språkteknologi. Filmer bearbetas genom att analysera undertexter för att avgöra stämningen hos en film. Prototypen använder filmer som är fördefinierade med stämning för att konstruera ett lexikon som innehåller information om de definierande egenskaperna för en stämning i filmtexter. Med hjälp av ett konstruerat lexikon kan likheterna mellan en filmtextning och ett lexikon jämföras för att beräkna sannolikheten för att en film tillhör en viss stämning. Fyra stämningar valdes för analys i prototypen: rädsla, sorg, glädje och överraskning.Navie Bayes-metoden valdes som klassificeringsmedel för prototypen. En Naive Bayes-klassificerare observerar varje förekommande ord utan hänsyn till ordets sammanhang i en mening eller text. Resultaten visade att klassificeringen hade problem att skilja mellan stämningarna. För samtliga konfigurationer av prototypen visade klassificeringsenheten dock högre precision för rädsla jämfört med de andra stämningarna. Sammantaget presterade klassificeraren dåligt och gav inte ett tillförlitligt resultat.

Place, publisher, year, edition, pages
2019. , p. 75
Series
TRITA-EECS-EX ; 2019:207
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-254547OAI: oai:DiVA.org:kth-254547DiVA, id: diva2:1333527
Supervisors
Examiners
Available from: 2019-07-01 Created: 2019-07-01 Last updated: 2019-07-01Bibliographically approved

Open Access in DiVA

fulltext(1115 kB)36 downloads
File information
File name FULLTEXT01.pdfFile size 1115 kBChecksum SHA-512
0dc5a4ad77c243249aaf77c3536e083e7aa9e0cf8cc186b27bf2b59b51a3b5e2fceb562c9bcdd35300ba1941ac29b0cead84234e3a1ebf03e87b431e636aa2bb
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 36 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 122 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf