Machine learning uitgelegd: zo leert een computer zichzelf nieuwe dingen

Machine learning is een tak van kunstmatige intelligentie waarbij computers leren van gegevens, zonder dat een programmeur elke stap hoeft te beschrijven. Het klinkt misschien als sciencefiction, maar je gebruikt het waarschijnlijk al meerdere keren per dag. Als een muziekapp een nummer aanraadt dat je mooi vindt, als je e-mailprogramma spam herkent of als een navigatieapp een snellere route vindt, dan werkt er ergens op de achtergrond een algoritme dat heeft geleerd van enorm veel voorbeelden. Dat is precies waar het bij geautomatiseerd leren om gaat: patronen ontdekken in data en die patronen gebruiken om beslissingen te nemen.

Hoe een computer leert van voorbeelden

Een traditioneel computerprogramma volgt vaste regels die een mens heeft geschreven. Bij zelflerende systemen werkt dat anders. Het systeem krijgt grote hoeveelheden data aangeboden en ontdekt zelf welke verbanden erin zitten. Stel dat je een algoritme wilt leren wat een kat is op een foto. Je laat het duizenden foto’s zien, waarvan een deel is gelabeld als “kat” en een deel als “geen kat”. Het systeem past zijn interne instellingen steeds een beetje aan totdat het de meeste foto’s goed herkent. Dit proces heet trainen. Hoe meer goede voorbeelden het systeem krijgt, hoe beter het wordt in het herkennen van nieuwe, onbekende plaatjes. Dit principe geldt niet alleen voor afbeeldingen, maar ook voor tekst, geluid en getallen.

De drie manieren waarop algoritmen leren

Binnen het vakgebied bestaan grofweg drie leermethoden. De eerste heet gesuperviseerd leren. Daarbij krijgt het algoritme voorbeelden mee waarbij het juiste antwoord al bekend is, zoals de e-mails die als spam zijn aangemerkt. De tweede methode is ongesuperviseerd leren. Hierbij zijn er geen labels en zoekt het systeem zelf naar groepen of structuren in de data. Winkels gebruiken dit om klanten in te delen op basis van koopgedrag, zonder dat iemand die groepen vooraf heeft bedacht. De derde methode heet versterkend leren. Het algoritme probeert iets uit, krijgt feedback in de vorm van een beloning of straf, en past zijn aanpak aan. Zo leerde een computerprogramma van Google het bordspel Go beter spelen dan de beste menselijke spelers ter wereld. Elke leermethode past bij een ander soort probleem, en onderzoekers kiezen de methode op basis van wat de data en het doel vereisen.

Toepassingen die je al kent

Zelflerende algoritmen zitten verwerkt in veel diensten die mensen dagelijks gebruiken. Streamingdiensten zoals Netflix analyseren wat je kijkt en raden op basis daarvan nieuwe series aan. Zoekmachines begrijpen steeds beter wat je bedoelt, ook als je een vraag typt met een typefout. In de gezondheidszorg helpen getrainde modellen bij het herkennen van afwijkingen op röntgenfoto’s, soms zelfs sneller dan een arts dat doet. Banken gebruiken soortgelijke technieken om verdachte transacties op te sporen. Ook de chatbots die steeds vaker op websites staan, zijn gebouwd op modellen die zijn getraind op miljoenen teksten. Deze voorbeelden laten zien hoe breed het vakgebied al wordt toegepast, van entertainment tot medische zorg.

Leren werken met deze technologie

Steeds meer mensen willen begrijpen hoe zelflerende systemen werken, of zelfs zelf modellen bouwen. Gelukkig zijn er veel toegankelijke manieren om te beginnen. Google biedt een gratis cursus aan die de basisconcepten uitlegt, inclusief regressie en classificatie. Op platforms zoals Reddit delen beginners en gevorderde gebruikers hun ervaringen en leermaterialen. Voor wie verder wil, zijn programmeertalen als Python en bibliotheken zoals TensorFlow en scikit-learn de meest gebruikte tools. Je hoeft geen wiskundeknobbel te zijn om te starten. Begrip van basisbegrippen als data, modellen en foutmarge is een goed vertrekpunt. Wie stap voor stap leert en veel oefent, bouwt al snel een solide basis op in dit groeiende vakgebied.

Veelgestelde vragen

Wat is het verschil tussen machine learning en gewone programmering?
Bij gewone programmering schrijft een mens alle regels die de computer moet volgen. Bij machine learning leert het systeem zelf regels af uit voorbeelden. De computer zoekt patronen in data en gebruikt die om nieuwe situaties te beoordelen, zonder dat iemand elke stap heeft vastgelegd.

Heb je wiskunde nodig om machine learning te leren?
Een beetje wiskundekennis helpt, maar het is niet nodig om te beginnen. Statistiek en lineaire algebra komen later van pas als je dieper in de stof duikt. Voor de eerste stappen zijn basisconcepten en praktische oefeningen genoeg om goed op weg te komen.

Kan een zelflerend systeem ook fouten maken?
Ja, zelflerende systemen maken fouten, zeker als de trainingsdata onvolledig of eenzijdig is. Een model dat is getraind op data van één groep mensen kan minder goed werken voor een andere groep. Daarom is het controleren en aanvullen van trainingsdata een belangrijk onderdeel van het ontwikkelproces.

Wat is deep learning en hoe verschilt het van machine learning?
Deep learning is een onderdeel van machine learning dat gebruikmaakt van neurale netwerken met veel lagen. Die netwerken zijn losjes gebaseerd op hoe de hersenen werken. Deep learning is bijzonder goed in het verwerken van afbeeldingen, geluid en taal, maar heeft wel veel meer data en rekenkracht nodig dan eenvoudigere methoden.