Machine Learning can Reduce False Alarms when Detecting Humans in Surveillance Systems
2019 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE credits
Student thesisAlternative title
Maskininlärning kan minska antalet falsklarm vid detektion av människor i övervakningssystem (Swedish)
Abstract [en]
Video surveillance is becoming increasingly common, but with the increased number of cameras comes an increased demand for human operators to watch and issue alarms when needed. If these video feeds are left unsupervised they will be of little use in a moment of need and would only be used to find out what has happened long after it already happened. For a surveillance company simply hiring more operators to watch video feeds to meet the growing demands is not a sustainable approach.
Instead, in this thesis machine learning approaches to perform human detection in a surveillance feed are investigated and two different implementations are developed, one based on convolutional neural networks and one based on the less complicated support vector machines. Since this human detection need to take place in real-time, speed is an important concern and so is the accuracy of the detections. If the models cannot be relied upon to provide accurate alarms it can have serious consequences if they were ever put into use.
It was found that the implementation based on convolutional neural networks had a better accuracy in terms of classifying people as people and also not falsely classifying other objects as people. The convolutional neural network in this thesis had an accuracy of 88.4% on positive video examples while the support vector machine only had an accuracy of 63.2% on the same test samples.
The support vector machine was significantly faster than the convolution neural network and thus more suited for real time applications that need to run on weak hardware. The convolutional neural network was 83.14% faster and more accurate than YOLOv3, a widely used algorithm for real time object detection.
Abstract [sv]
Videoövervakning har blivit allt vanligare, och med den ökande mängden kameror finns det också ett ökande krav på mänskliga operatörer som kan se över kamerorna och slå alarm när det behövs. Ifall övervakningskamerorna skulle lämnas oövervakade skulle de inte vara användbara i nödsituationer utan bara kunna användas för att ta reda på vad som har hänt långt efter att det redan har hänt. Att försöka möta de ökande kraven genom att anställa fler och fler operatörer är inte hållbart för säkerhetsföretagen.
Därför har i det här examensarbetet maskininlärningsmetoder för att genomföra människodetektion undersökts och två olika modeller har utvecklats. En implementation är baserad på support vector machines och den andra på convolutional neural networks. Då människodetektionen måste kunna ske i realtid så är hastigheten en viktig faktor såväl som träffsäkerheten. Ifall modellerna inte kan ge träffsäkra alarm kan det leda till allvarliga konsekvenser när systemet ska användas.
Resultatet blev att implementationen baserad på convolutional neural networks hade en bättre träffsäkerhet både på att klassifiera människor som människor och att inte klassifiera icke-människor som människor. Den hade en träffsäkerhet på 88,4% på positiva exempel medan support vector machine hade en träffsäkerhet på 63,2% på samma testvideoklipp.
Implementationen baserad på support vector machines var dock betydligt mycket snabbare än den första implementationen och då bättre lämpad att köras på svag hårdvara. Även fast första lösningen var långsammare så var den fortfarande 83,14% snabbare än YOLOv3, en vanligen använd algorithm för objektigenkänning.
Place, publisher, year, edition, pages
2019. , p. 49
Series
TRITA-EECS-EX ; 2019:596
National Category
Computer and Information Sciences
Identifiers
URN: urn:nbn:se:kth:diva-264462OAI: oai:DiVA.org:kth-264462DiVA, id: diva2:1373602
External cooperation
Stanley Security
Educational program
Master of Science in Engineering - Electrical Engineering
Supervisors
Examiners
2019-11-282019-11-272019-11-28Bibliographically approved