Dit artikel is onderdeel van de AI Woordenlijst op De Wereld van AI. Daar vind je een overzicht van alle belangrijke AI-begrippen.
Reinforcement learning is een vorm van machine learning waarbij een model leert door te experimenteren en feedback te ontvangen. In plaats van leren uit vaste voorbeelden ontdekt het systeem zelf welke acties het beste resultaat opleveren.
Het model neemt beslissingen, krijgt een beloning of straf, en past zijn gedrag daarop aan. Door dit proces steeds te herhalen leert het stap voor stap betere keuzes maken.
Hoe werkt reinforcement learning
Bij reinforcement learning zijn vier onderdelen essentieel:
- Agent, het lerende systeem dat acties uitvoert
- Omgeving, de wereld waarin de agent zich bevindt
- Acties, de keuzes die de agent kan maken
- Beloning, feedback die aangeeft of een actie goed of slecht was
De agent probeert zijn totale beloning te maximaliseren door steeds slimmere acties te kiezen.
Eenvoudig voorbeeld
Denk aan een spel:
- De agent is de speler
- De omgeving is het spel zelf
- Elke zet is een actie
- Punten zijn de beloning
Goede zetten leveren punten op, slechte zetten kosten punten. Door veel te spelen leert de agent welke strategie het beste werkt.
Waar wordt reinforcement learning gebruikt
Reinforcement learning wordt toegepast in situaties waarin beslissingen invloed hebben op de toekomst, zoals:
- Spelcomputers en game-AI
- Robots die leren bewegen
- Verkeerslichten die zich aanpassen aan drukte
- Handelsalgoritmes
- Autonome voertuigen
Verschil met andere leervormen
In tegenstelling tot supervised learning zijn er geen juiste antwoorden vooraf. Het model leert puur op basis van ervaring en feedback, niet uit gelabelde voorbeelden.
Verder lezen
Wil je beter begrijpen hoe verschillende vormen van leren binnen AI samenhangen en wanneer welke aanpak wordt gebruikt, dan is de gratis AI basiscursus een logisch vervolg.