Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Machine Learning Agents: En undersökning om Curiosity som belöningssystem för maskininlärda agenter
University of Skövde, School of Informatics.
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 20 credits / 30 HE creditsStudent thesisAlternative title
Machine Learning Agents : A study regarding Curiosity as a reward incentive for machine learning agents (English)
Abstract [sv]

Denna rapport har använt sig av Unity-verktyget ML-Agents till att bygga upp en spelmiljö där agenter tränats med hjälp av neurala nätverk och reinforcement learning. Miljön har utmanat agenterna med labyrintliknande banor där vissa även har enkla pusselmekaniker. Agenterna har sedan använts för att göra en undersökning om hur belöningssystemet Curiosity påverkar agentens förmåga att efter träning klara av för dem nya banor. Denna undersökning gjordes genom att träna 5 olika agenter under samma förhållanden där enbart styrkan på Curiosity-incitamentet skiljde dem åt. De olika Curiosity-styrkor som undersöktes var styrkorna: 0, 0.002, 0.033, 0.067 och 0.1. Dessa agenter utvärderades genom att spela igenom 8 utvärderingsbanor med varierande svårighetsgrad för att se vilken av agenterna som klarade av flest banor. Varje bana spelades igenom 50 gånger och antalet avklarade försök och tiden det tog för agenten att klara av varje bana antecknades.

Resultatet visade att samtliga agenter som tränats med Curiosity presterade betydligt bättre än agenten som tränats utan Curiosity. Antalet avklarade försök på utvärderingsbanorna ökade med 121%-231% då agenter tränades med Curiosity. Agenterna som tränats med Curiosity visade viss variation i hur bra de klarade av spelets banor. Den agent som presterade bäst var den med Curiosity-styrkan 0.002. Agenter som tränats med Curiosity visade sig mer benägna att undersöka banorna, vilket gjorde att de inte körde fast lika ofta som agenten som tränats utan Curiosity. Agenterna med Curiosity-styrkorna 0.033, 0.067 och 0.1 anses dock ha ett för högt värde på sin Curiosity-styrka då de uppvisat ett sämre resultat, samt ett rörelsemönster som anses icke-optimalt då de jämförs med agenten med Curiosity-styrkan 0.002. Överlag visade samtliga agenter en hög standardavvikelse, vilket innebär att det förekom hög varians försöken emellan.

Place, publisher, year, edition, pages
2019. , p. 92
Keywords [sv]
maskininlärning, ai, curiosity, unity
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:his:diva-17142OAI: oai:DiVA.org:his-17142DiVA, id: diva2:1325889
Subject / course
Informationsteknologi
Educational program
Computer Game Development - Programming
Supervisors
Examiners
Available from: 2019-06-18 Created: 2019-06-17 Last updated: 2019-06-18Bibliographically approved

Open Access in DiVA

fulltext(1513 kB)4 downloads
File information
File name FULLTEXT01.pdfFile size 1513 kBChecksum SHA-512
b7da834e9f130c72c839d0acb19e2ee72d518b886006f87b954c44333644cda26132325241f52f57798f4996c835b4e52646a3c2cb60ff7897752fc4e91f4406
Type fulltextMimetype application/pdf

Search in DiVA

By author/editor
Pettersson, Oscar
By organisation
School of Informatics
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 4 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 8 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf