You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
“Reinforcement Learning” leert continu op basis wat er in het verleden is om het in de toekomst beter te doen. Zo worden ze elke keer een beetje slimmer!
Robotstofzuigers gebruiken bijvoorbeeld reinforcement learning. Ze proberen dingen uit, kijken wat goed of slecht gaat, en leren daarvan om het de volgende keer beter te doen. Stel je voor dat je een nieuwe robotstofzuiger in je huis hebt. In het begin kent de stofzuiger je huis niet. Hij weet niet waar de meubels staan, waar de deuren zijn of waar hij vaak moet schoonmaken. Elke keer als de robotstofzuiger aan het werk gaat, probeert hij verschillende routes in je huis. Soms botst hij tegen een stoel of raakt hij vast onder de bank. Maar elke keer als dit gebeurt, onthoudt hij het en denkt: "Oké, dat was niet goed. Laten we dat de volgende keer anders doen."
Aan de andere kant, als hij een plek heel goed schoonmaakt en snel klaar is, denkt hij: "Dat ging goed! Ik moet dat vaker zo doen."
Dit is hoe reinforcement learning werkt. De robotstofzuiger “probeert” dingen uit, kijkt wat “goed” of “slecht” gaat, en “leert” daarvan.
Leg uit waarom dit een goede toevoeging is aan het Algoritmekader
Belangrijk om uit te leggen wat RI anders maakt. Dat is met name het continu autonoom leren en zo, ook autonoom, het AI-model aanpassen.
The text was updated successfully, but these errors were encountered:
Beschrijf je suggestie
Op https://minbzk.github.io/Algoritmekader/overhetalgoritmekader/soorten-algoritmes/#zelflerende-algoritmes staat een uitleg van reinforcement leaning die enigszins beperkt is. Misschien dat dit een beter beeld geeft?
“Reinforcement Learning” leert continu op basis wat er in het verleden is om het in de toekomst beter te doen. Zo worden ze elke keer een beetje slimmer!
Robotstofzuigers gebruiken bijvoorbeeld reinforcement learning. Ze proberen dingen uit, kijken wat goed of slecht gaat, en leren daarvan om het de volgende keer beter te doen. Stel je voor dat je een nieuwe robotstofzuiger in je huis hebt. In het begin kent de stofzuiger je huis niet. Hij weet niet waar de meubels staan, waar de deuren zijn of waar hij vaak moet schoonmaken. Elke keer als de robotstofzuiger aan het werk gaat, probeert hij verschillende routes in je huis. Soms botst hij tegen een stoel of raakt hij vast onder de bank. Maar elke keer als dit gebeurt, onthoudt hij het en denkt: "Oké, dat was niet goed. Laten we dat de volgende keer anders doen."
Aan de andere kant, als hij een plek heel goed schoonmaakt en snel klaar is, denkt hij: "Dat ging goed! Ik moet dat vaker zo doen."
Dit is hoe reinforcement learning werkt. De robotstofzuiger “probeert” dingen uit, kijkt wat “goed” of “slecht” gaat, en “leert” daarvan.
Leg uit waarom dit een goede toevoeging is aan het Algoritmekader
Belangrijk om uit te leggen wat RI anders maakt. Dat is met name het continu autonoom leren en zo, ook autonoom, het AI-model aanpassen.
The text was updated successfully, but these errors were encountered: