Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Machine Learning can Reduce False Alarms when Detecting Humans in Surveillance Systems
KTH, School of Electrical Engineering and Computer Science (EECS).
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Maskininlärning kan minska antalet falsklarm vid detektion av människor i övervakningssystem (Swedish)
Abstract [en]

Video surveillance is becoming increasingly common, but with the increased number of cameras comes an increased demand for human operators to watch and issue alarms when needed. If these video feeds are left unsupervised they will be of little use in a moment of need and would only be used to find out what has happened long after it already happened. For a surveillance company simply hiring more operators to watch video feeds to meet the growing demands is not a sustainable approach.

Instead, in this thesis machine learning approaches to perform human detection in a surveillance feed are investigated and two different implementations are developed, one based on convolutional neural networks and one based on the less complicated support vector machines. Since this human detection need to take place in real-time, speed is an important concern and so is the accuracy of the detections. If the models cannot be relied upon to provide accurate alarms it can have serious consequences if they were ever put into use.

It was found that the implementation based on convolutional neural networks had a better accuracy in terms of classifying people as people and also not falsely classifying other objects as people. The convolutional neural network in this thesis had an accuracy of 88.4% on positive video examples while the support vector machine only had an accuracy of 63.2% on the same test samples.

The support vector machine was significantly faster than the convolution neural network and thus more suited for real time applications that need to run on weak hardware. The convolutional neural network was 83.14% faster and more accurate than YOLOv3, a widely used algorithm for real time object detection.

Abstract [sv]

Videoövervakning har blivit allt vanligare, och med den ökande mängden kameror finns det också ett ökande krav på mänskliga operatörer som kan se över kamerorna och slå alarm när det behövs. Ifall övervakningskamerorna skulle lämnas oövervakade skulle de inte vara användbara i nödsituationer utan bara kunna användas för att ta reda på vad som har hänt långt efter att det redan har hänt. Att försöka möta de ökande kraven genom att anställa fler och fler operatörer är inte hållbart för säkerhetsföretagen.

Därför har i det här examensarbetet maskininlärningsmetoder för att genomföra människodetektion undersökts och två olika modeller har utvecklats. En implementation är baserad på support vector machines och den andra på convolutional neural networks. Då människodetektionen måste kunna ske i realtid så är hastigheten en viktig faktor såväl som träffsäkerheten. Ifall modellerna inte kan ge träffsäkra alarm kan det leda till allvarliga konsekvenser när systemet ska användas.

Resultatet blev att implementationen baserad på convolutional neural networks hade en bättre träffsäkerhet både på att klassifiera människor som människor och att inte klassifiera icke-människor som människor. Den hade en träffsäkerhet på 88,4% på positiva exempel medan support vector machine hade en träffsäkerhet på 63,2% på samma testvideoklipp.

Implementationen baserad på support vector machines var dock betydligt mycket snabbare än den första implementationen och då bättre lämpad att köras på svag hårdvara. Även fast första lösningen var långsammare så var den fortfarande 83,14% snabbare än YOLOv3, en vanligen använd algorithm för objektigenkänning.

Place, publisher, year, edition, pages
2019. , p. 49
Series
TRITA-EECS-EX ; 2019:596
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-264462OAI: oai:DiVA.org:kth-264462DiVA, id: diva2:1373602
External cooperation
Stanley Security
Educational program
Master of Science in Engineering - Electrical Engineering
Supervisors
Examiners
Available from: 2019-11-28 Created: 2019-11-27 Last updated: 2019-11-28Bibliographically approved

Open Access in DiVA

fulltext(1218 kB)6 downloads
File information
File name FULLTEXT01.pdfFile size 1218 kBChecksum SHA-512
2b57213e1c7d5dcb978f33848f470d2f36346f5fda233b16389d02a171a9ad5084cb217903c10167e32eadb0e125d661866cbf78fe8c51b8fdd79d1158e7317a
Type fulltextMimetype application/pdf

By organisation
School of Electrical Engineering and Computer Science (EECS)
Computer and Information Sciences

Search outside of DiVA

GoogleGoogle Scholar
Total: 6 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 8 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf