Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Simulering av system med flera agenter genom användande av djup förstärkande inlärning
KTH, School of Engineering Sciences (SCI).
KTH, School of Engineering Sciences (SCI).
2019 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Simulating Multi-Agent Systems Using Deep Reinforcement Learning (English)
Abstract [sv]

Förstärkande inlärning har fått mycket uppmärksamhet under de senaste åren, främst genom att det används för att lära datorer för att spela video- och brädspel. I denna rapport undersöks hur väl algoritmer från detta område kan användas för att lösa ett problem med flera agenter. Problemet med flera agenter som ska lösas är att lära robotar hur man kan transportera föremål genom ett lager utan att kollidera. En Q-learning-baserad algoritm föreslås för att lösa problemet. På grund av problem med skalbarhet föreslås också en DQN-baserad algoritm. Problem med skalbarhet uppstår i system med högre komplexitet, i system som kännetecknas av flera agenter eller en stor miljö. Det visas att Q-learning misslyckas med att lära sig en bra strategi på rimlig tid. Simuleringar görs för att illustrera beteendet hos de föreslagna algoritmerna. Resultaten av simuleringarna tyder på att DQN klarar sig betydligt bättre jämfört med Q-learning när problemets dimensioner är större.

 

Abstract [en]

Reinforcement Learning has been getting a lot of attention in recent years, mostly through its use in teaching computers to play video and board games. In this report it is investigated how well algorithms from this area can be used to solve a multi-agent problem. The multi-agent problem to be solved is teaching robots how to transport items through a warehouse without colliding. A Q-learning based algorithm is proposed to solve the problem. Because of the scalability issues a DQN based algorithm is also proposed. The scalability issues arise in systems of higher complexity, in systems characterized by multiple agents or a large environment. It is shown that Qlearning fails to learn a good strategy in a reasonable time. Simulations are made to illustrate the behaviour of the proposed algorithms. The results of the simulations suggest that DQN performs considerably better compared to Q-learning when the dimensions of the problem are larger.

Place, publisher, year, edition, pages
2019.
Series
TRITA-SCI-GRU ; 2019:243
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:kth:diva-256225OAI: oai:DiVA.org:kth-256225DiVA, id: diva2:1344043
Supervisors
Examiners
Available from: 2019-08-20 Created: 2019-08-20 Last updated: 2019-08-20Bibliographically approved

Open Access in DiVA

fulltext(649 kB)14 downloads
File information
File name FULLTEXT01.pdfFile size 649 kBChecksum SHA-512
c721fedb67fef5a5c93e8fcf25c71cd0c55a6867efe41593fcb29c4c54cb3ad38e64353fb1361b6c577084f78f8d79198dc05940f1fac3734d6580383f3c9d33
Type fulltextMimetype application/pdf

By organisation
School of Engineering Sciences (SCI)
Engineering and Technology

Search outside of DiVA

GoogleGoogle Scholar
Total: 14 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 62 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf