Deep learning methode voor Human Pose Estimation: DeepCut

DeepCut is net als het vorige keer besproken OpenPose een deep learning methode voor Human Pose Estimation. Deze methode voert gelede Human Pose Estimation uit voor meerdere mensen in echte beelden. Het is een benadering die gezamenlijk de uitdagingen van detectie en Pose Estimation oplost. DeepCut leidt het aantal personen in een beeld af, identificeert afgesloten lichaamsdelen, en verwijdert dubbelzinnigheden wat betreft lichaamsdelen van mensen die dichtbij elkaar zijn zodat duidelijk wordt welk lichaamsdeel van wie is. Deze gezamenlijke formulering is in contrast met voorgaande methoden, die de taak uitvoeren door eerst mensen te detecteren en daaropvolgend hun pose te schatten.

Hoe werkt Human Pose Estimation?

Nu we een beetje weten wat Human Pose Estimation is, waarvoor het gebruikt kan worden, en welke verschillende vormen er zijn, kunnen we eens wat dieper ingaan op hoe het eigenlijk werkt.

Convolutional Neural Networks effectief voor video herkenning

Deep learning architecturen hebben verschillende varianten. Convolutional Neural Networks (CNN's of ConvNets) worden al decennia lang bestudeerd en zijn al effectief gebleken voor beeldanalyse en classificatie. CNN’s bieden state-of-the-art resultaten voor beeldherkenning, detectie en segmentatie. Maar ook voor video classificatie problemen laten zij veelbelovende resultaten zien.