Unsupervised machine learning voor objectiviteit, privacy en minder data
Machine learning helpt patronen in big data te ontdekken die leiden tot bruikbare inzichten. Zoals eerder besproken zijn machine learning algoritmen in grote lijnen te verdelen in twee groepen gebaseerd op de manier waarop zij leren over data om voorspellingen te doen, namelijk supervised machine learning (SML) en unsupervised machine learning (UML).
Terwijl supervised machine learning algoritmen gebaseerd zijn op menselijke feedback waarbij de data scientist met behulp van gelabelde data het algoritme traint met welke conclusies deze behoort te komen, proberen unsupervised machine learning algoritmen conclusies te trekken uit data zonder menselijke interventie, waardoor verborgen structuren en onbekende patronen ontdekt kunnen worden.
Enkele toepassingen van unsupervised machine learning technieken zijn:
- Clustering: Clustering split de dataset automatisch in groepen gebaseerd op overeenkomsten
- Onregelmatigheidsdetectie: Deze vorm van detectie kan ongebruikelijke datapunten in je dataset ontdekken. Dit is nuttig voor het vinden van frauduleuze transacties of andere abnormaliteiten.
- Associatie mining: Deze vorm van mining identificeert sets van items die regelmatig samen voorkomen in je dataset.
Met het veranderen van de realiteit rondom data acquisitie en management, wordt de waarde van unsupervised machine learning snel duidelijker, met name in vergelijking met supervised machine learning. Terwijl SML in zekere mate logisch klinkt in de context van een eindeloos data-rijke omgeving – hoe meer we willen weten, hoe meer data we onze algoritmen voeden – zijn er significante problemen die gemoeid gaan met dit ongecontroleerde tempo van data acquisitie.
Minder data, meer privacy
Met UML kunnen we het paradigma veranderen, omdat we de informatie die we moeten verwerven van individuen kunnen verminderen. Zonder UML ligt de focus op het gebruiken van de kennis die we hebben over een individu om het toekomstige gedrag van die persoon te voorspellen. Daarbij moet er keer op keer door dit proces gegaan worden, individu voor individu. Dit is een extreem data-intensieve benadering. Met UML kunnen mensen op groepsniveau worden beoordeeld en kan er waardevolle kennis van geobserveerde correlaties en patronen tussen mensen en acties worden afgeleid. Uiteindelijk is er slechts een aantal datapunten over een individu nodig om hen te matchen aan een subgroep, om vervolgens het toekomstige gedrag van de subgroep te voorspellen. Dit heeft rechtstreeks gevolgen voor privacy.
Objectiviteit
Er zijn ook duidelijke voordelen als het gaat om zaken als vooroordelen. Bij SML wordt er gebruikt gemaakt van gelabelde data, wat vooroordelen kan toevoegen aan de algoritmen. UML, daarentegen, is objectief. Het voert groeperingen uit puur gebaseerd op de patronen die het ontdekt in ongestructureerde data. Het stelt ons in staat nieuwe patronen te identificeren die een traditionele methode als SML zou missen.
We zien al dat de bank- en betalingssector proactief omgaat met deze nieuwe mogelijkheden. Financiële dienstverleners, bijvoorbeeld, begrijpen direct de waarde die UML te bieden heeft. Inbreuk op de privacy en verhoogde beveiligings- en verificatiemaatregelen zijn altijd geassocieerd geweest met een groei in frictie voor klanten. Met UML zijn deze organisaties in staat om de voorbeeldige ervaringen te leveren die de klant van hen verwacht, zonder dat zijn onnodige wrijving veroorzaken.
De juiste balans vinden tussen klantervaring, risicomanagement en ethische data acquisitie is kritiek, niet alleen voor financiële organisaties maar voor vele andere bedrijven de digitale economie van vandaag de dag. UML helpt ons daarbij.
Comments are closed.