Supervised versus unsupervised machine learning

Machine learning maakt de analyse van grote hoeveelheden data mogelijk. Het is een proces dat helpt patronen in big data te ontdekken die leiden tot bruikbare inzichten. Data scientists gebruiken vele soorten machine learning algoritmen om snel zaken als risicofactoren en winstgevende kansen in beeld te brengen. Deze verschillende algoritmen kunnen op een hoog niveau in twee groepen worden geclassificeerd gebaseerd op de manier waarop zij leren over data om voorspellingen te doen, namelijk supervised machine learning (SML) en unsupervised machine learning (UML).

Supervised machine learning algoritmen

SML is de meest gebruikte en expliciete vorm van de twee. Supervised machine learning algoritmen zijn gebaseerd op menselijke feedback. Bij SML gedraagt de data scientist zich als een leraar die aan het algoritme leert met welke conclusies deze behoort te komen.

Vereisten voor supervised learning is dat de mogelijke uitkomsten van het algoritme al bekend zijn en dat de data die gebruikt wordt om het algoritme te trainen al gelabeld is met correcte antwoorden. Een classificatie algoritme leert bijvoorbeeld auto’s identificeren nadat deze is getraind met behulp van een dataset van afbeeldingen die naar behoren zijn gelabeld met merknamen en een aantal identificerende karakteristieken.

Unsupervised machine learning algoritmen

In tegenstelling tot supervised learning worden bij unsupervised learning de algoritmen niet getraind met behulp van gelabelde data. UML algoritmen proberen conclusies te trekken uit data zonder dat hier een trainer bij betrokken is, waardoor verborgen structuren en onbekende patronen ontdekt kunnen worden. Omdat bij UML de computer complexe processen en patronen leert identificeren zonder menselijke interventie, is deze vorm nauwer verbonden met wat de meesten echte kunstmatige intelligentie noemen.

Hoewel een supervised classificatie algoritme leert hoe deze ingevoerde labels moet toekennen aan bijvoorbeeld afbeeldingen van auto’s, zal een unsupervised classificatie algoritme kijken naar inherente gelijkenissen tussen afbeeldingen en deze aan de hand daarvan indelen in groepen, waarbij elke groep een nieuw, eigen label krijgt. Dit kan een handige tool zijn voor het segmenteren van bijvoorbeeld klanten, voorbijgangers of reizigers, omdat het groepen samenstelt op basis van parameters die een mens mogelijk niet in overweging neemt als gevolg van reeds bestaande vooroordelen.

Terwijl UML te complex kan zijn voor de eenvoudige gevallen, opent het deuren voor het oplossen van problemen die de mens normaal gesproken nooit zouden oplossen.

Om het verschil tussen supervised en unsupervised learning wat meer tot de verbeelding te laten spreken kan je denken aan een kindje dat kennis maakt met een hond. Als aan het kind wordt verteld wat we verstaan onder een hond en welke karakteristieke kenmerken daarbij horen, dan is het leerproces van het kind vergelijkbaar met supervised machine learning. Het kind krijgt te horen dat het label hond kan worden toegeschreven aan objecten die voldoen aan die kenmerken, en wordt op die manier getraind om te bepalen wanneer iets in die categorie valt. Maar het proces kan ook anders verlopen. Stel het kind komt in aanraking met de hond en identificeert deze zelf, zonder tussenkomst van iemand anders. Als het kind dan vervolgens een andere hond tegenkomt, dezelfde kenmerken ontdekt als bij de voorgaande hond (zoals twee oren, twee ogen en vier poten) en tot de conclusie komt dat dit dier tot dezelfde categorie behoort als de voorgaande hond, dan is dit leerproces vergelijkbaar met unsupervised machine learning.

Of er beter gekozen kan worden voor SML of UML algoritmen is in principe afhankelijk van de structuur en het volume van de betreffende data en het type uitdaging dat er aangepakt moet worden. In bepaalde gevallen zal een combinatie van beide typen nodig zijn om complete voorspellende gegevens modellen te bouwen om te helpen beslissingen te nemen voor diverse zakelijke uitdagingen.

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google photo

Je reageert onder je Google account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s