Dit artikel is onderdeel van de AI Woordenlijst op De Wereld van AI. Daar vind je een overzicht van alle belangrijke AI-begrippen.
Wat is versterkend leren (reinforcement learning)?
Versterkend leren, ook wel reinforcement learning genoemd, is een manier waarop AI leert door te proberen, fouten te maken en daarvan te leren. Het systeem krijgt feedback in de vorm van beloningen of straffen en past zijn gedrag daarop aan.
Uitleg van het begrip in begrijpelijke taal
Bij versterkend leren leert een AI door zelf acties uit te voeren in een omgeving. Na elke actie krijgt het systeem te horen of die actie goed of slecht was. Goede acties leveren een beloning op, slechte acties niet. Door dit proces steeds te herhalen leert de AI welk gedrag het beste resultaat oplevert.
Hoe het werkt of hoe het wordt toegepast
Een reinforcement learning-systeem bestaat uit drie onderdelen. De agent, dit is de AI die beslissingen neemt. De omgeving, dit is de situatie waarin de agent zich bevindt. En de beloning, dit is de feedback na een actie. De agent probeert een strategie te vinden die op de lange termijn de meeste beloning oplevert. Dit gebeurt zonder vaste voorbeelden, maar puur door interactie en ervaring.
Praktisch voorbeeld of toepassingen
Een bekend voorbeeld is een AI die leert een spel te spelen. In het begin maakt de AI willekeurige zetten. Goede zetten leveren punten op, slechte zetten kosten punten. Na verloop van tijd leert de AI steeds betere strategieën. Versterkend leren wordt ook gebruikt bij robotica, verkeersregeling en het optimaliseren van processen.
Verder leren
Wie wil begrijpen hoe AI zelfstandig strategieën leert ontwikkelen en waarom versterkend leren zo belangrijk is voor autonome systemen, kan verder leren via mijn gratis AI basiscursus.