Machine Learning

Wat is Machine Learning?

In de huidige samenleving is machine learning niet meer weg te denken. Termen als machine learning, deep learning, artificial intelligence, big data enzovoorts vliegen dagelijks om je oren. Veel bedrijven vragen zich dan ook af hoe hier mee om te gaan. Dit geldt ook voor bouw- en installatiebedrijven. We gaan in dit artikel wat dieper op het onderwerp machine learning in.

Definitie

Machine learning of geautomatiseerd leren is een domein van algoritmen die het menselijk intellect proberen na te bootsen. Dit gebeurt door te leren op basis van grote hoeveelheden data. Dit kan in de vorm van het herkennen van patronen in data, het classificeren van data door nieuwe data toe te wijzen aan bestaande klassen en het clusteren van data waarbij de classificatie nog onbekend is. Voorbeelden hiervan kunnen zijn: het voorspellen van binnentemperatuur op basis van verschillende factoren, het clusteren van storingen uit onderhoudsdata, het inschatten van risico’s van bouwprojecten enzovoorts.

Machine Learning is een relatief jong onderzoeksgebied. Ideeën in dit domein bestaan al sinds de jaren ’80 en ’90, maar de benodigde rekenkracht van computers ontbrak. Daarnaast was het verzamelen van data relatief duur door beperkte opslagcapaciteit en kostbare sensoren. Dit is in deze tijd anders waarbij bijvoorbeeld een gemiddelde rekenmachine meer rekenkracht heeft dan de eerste maanlander. Door de toename in rekenkracht wint Machine Learning sterk aan populariteit. De bouw- en installatiesector blijft op dit gebied wat achter doordat het vaak een onbekend gebied is.

Indeling

Grofweg is Machine Learning op te knippen in drie gebieden: supervised, unsupervised learning en Reinforcement learning. Bij Supervised Learning traint en test men een algoritme met behulp van een dataset waarvan de uitkomsten reeds bekend zijn. Een algoritme probeert zo goed als mogelijk de berekende uitkomsten overeen te laten komen met de reeds bekende uitkomsten, bij unsupervised learning zoekt een algoritme zelf naar antwoorden. Dit is bijvoorbeeld het geval bij clusteren van data in groepen. Marketingafdelingen maken hier vaak gebruik van door nieuwe klantgroepen te vinden.Grofweg is Machine Learning op te knippen in driegebieden: supervised, unsupervised learning en reinformcement learning. Bij Supervised Learning traint en test men een algoritme op een dataset waarvan de uitkomsten reeds bekend zijn, bij unsupervised learning zoekt een algoritme zelf naar antwoorden. Reinforcement learning is op basis van straffen en belonen.

Afbeelding 1: Indeling Machine Learning algoritmen.

Supervised Machine Learning

In een supervised machine learning model wordt een algoritme getraind middels een trainset en geëvalueerd middels een testset. Hierdoor zijn uitspraken te doen hoe goed een getraind algoritme werkt. Vooral classificatie (classificeren van data in klassen) en regressieproblemen (voorspellen van een waarde) rekent men hier toe.

Voorbeeld:

– Binnentemperatuurberekening op basis van verschillende onafhankelijke variabelen.

– Probalistisch ramen van een project op basis van projectkenmerken

Unsupervised Machine Learning

In een unsupervised machine learning model zijn de uitkomsten op voorhand niet bekend. Dit speelt vooral bij marketing data waarbij klantengroepen op voorhand niet zijn aan te wijzen. Veel gebruikte unsupervised machine learning modellen gaan over clusteringvraagstukken.

Voorbeeld:

– Clusteren van typen meer- en minderwerk op basis van kenmerken.

– Clusteren van onderhoudsklussen op basis van onderhoud in het verleden.

Reinforcement Learning

Naast supervised en unsupervised machine learning is er nog een derde tak: reinforcement learning. Reinforcement learning is het leren middels straffen en belonen op basis van trial en error. Het algoritme probeert hierbij straffen te vermijden en beloningen te maximaliseren.

Privacy

Privacy staat in deze tijd hoog in het vaandel. Dit geldt des te meer omtrent dataverwerking bij Machine Learningtechnieken. Bekend is dat persoonlijke data zoals woonplaats, religie, geslacht enzovoorts nooit gedeeld mogen worden. Echter omdat er wordt gewerkt met grote hoeveelheden data is het belangrijk om in de gaten te houden dat er niet onbewust toch persoonlijke gegevens worden verzameld. Door het combineren van verschillende databronnen kunnen ook persoonsgegevens worden verkregen. Het mag vanzelfsprekend zijn dat dit te allen tijden moet worden voorkomen.

Wat kan ik ermee?

Vooral voor bedrijven die bewust zijn van het feit dat ze grote hoeveelheden data beschikken is Machine Learning interessant. In het artikel over Big Data wordt hier verder op ingegaan.