A machine learning approach to EEG based prediction of user's music preferences
2019 (English)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Student thesisAlternative title
Maskininlärningsmetoder för EEG-baserad klassificering av musikpreferenser (Swedish)
Abstract [en]
Music has many benefits for our mood and feelings, especially so when we get to choose our own favorite music. However, accessing one's favorite music is not as easy for everyone. For motorically disabled and locked-in people, interacting with devices used for listening to music is challenging since it requires physical interaction. Machine learning classification methods used with EEG could prove useful for detecting individual musical preferences, extracted without any physical or verbal interaction. The two most common methods within EEG-based classification are Artificial neural networks (ANN) and Support vector machines (SVM). This study compares the performance of these two methods, when used with the DEAP dataset of EEG-monitored participants watching music videos. This comparison can help with gaining insight into which machine learning method is most appropriate for music preference detection, contributing towards more accurate predictions of motorically disabled people’s musical preferences.
The participants in the DEAP dataset rated watched music videos by preference from 1 to 9, of which we trained the classification models to separate between higher (chosen as ratings 8 to 9) and lower ratings. From the results it is concluded that ANN performs better than SVM in terms of accuracy, with ANN performing at roughly 86% and SVM at 85%, while the SVMs were substantially faster to train. These accuracy scores were obtained from two ANN and SVM models using the optimal parameter and channel configurations, which were calculated through extensive testing. The accuracies are however likely achieved due to an imbalanced dataset, with too few data samples of higher ratings in proportion to lower, leading to biased classifiers that work well on our dataset but has probably close to random classification performance. Alterations to our methods could give better performing classifiers, and would also lead to more meaningful comparisons of ANN and SVM for EEG-based musical preference prediction.
Abstract [sv]
Musik har många fördelar för vårt humör och våra känslor, synnerligen när vi får lyssna på vår favoritmusik. Det är däremot inte lika enkelt för alla att komma åt sin egen favoritmusik. För rörelseförhindrade och personer med inlåsningssyndrom är det utmanande att interagera med de enheter som används för att lyssna på musik eftersom att de kräver fysisk interaktion. Maskininlärningsmetoder för klassificering av EEG-data skulle kunna vara användbara för att upptäcka individuella preferenser av musik utan fysisk eller verbal interaktion. De två vanligaste metoderna inom EEG-baserad klassificering är Artificiella neurala nätverk (ANN) samt Stödvektormaskiner (SVM). Studien jämför prestanda av dessa metoder på DEAP-datasetet av EEG-övervakade deltagare, för att få insikt i vilken maskininlärningsmetod som är mest användbar för klassificering av musikpreferenser. Jämförelsen kan bidra till insikter om vilken maskininlärningsmetod som passar bäst för klassificering av musikpreferenser, vilket skulle kunna bidra till precisare klassificeringar av musikpreferenser bland personer med rörelsehinder.
Deltagarna i DEAP-datasetet betygsatte musikvideorna utifrån preferens på en skala mellan 1 till 9, vilket användes för att träna klassificeringsmodellerna för att separera mellan högre (valda som betyg 8 till 9) och lägre betygsättningar. Från resultaten är det slutställt att ANN presterar bättre än SVM vad gäller noggrannhet, där ANN presterar runt 86% och SVM kring 85%, medan SVM var avsevärt snabbare att träna. Dessa noggrannheter erhölls från en ANN och SVM genom att använda de optimala parameter- och kanalkonfigurationer, vilka beräknades genom omfattande tester. Noggrannheterna är däremot troligtvis uppnådda på grund av ett obalanserat dataset, med för få datapunkter med högre betyg i proportion mot de lägre, vilket leder till partiska klassificerare som fungerar väl på vårt dataset men som troligtvis har en klassificeringsprestanda närmre slumpen. Ändringar i våra metoder skulle kunna ge bättre presterande klassificerare, och skulle också kunna leda till mer meningsfulla jämförelser av ANN och SVM för EEG-baserad klassificering av musikpreferenser.
Place, publisher, year, edition, pages
2019. , p. 35
Series
TRITA-EECS-EX ; 2019:345
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-259625OAI: oai:DiVA.org:kth-259625DiVA, id: diva2:1352566
Supervisors
Examiners
2019-09-242019-09-192022-06-26Bibliographically approved