Beim überwachten Lernen lernen Algorithmen von markierten Daten und können Vorhersagen oder Klassifikationen für neue, unbekannte Daten treffen, wobei Algorithmen wie lineare Regression, logistische Regression, Entscheidungsbäume, Random Forest, Support Vector Machines und neuronale Netze verwendet werden.
Beim unüberwachten Lernen hingegen werden Algorithmen aus unmarkierten Daten gelernt, wodurch sie in der Lage sind, verborgene Muster oder Strukturen in den Daten zu entdecken.
Beim verstärkenden Lernen liegt der Schwerpunkt auf Algorithmen, die aus Aktionen und Rückmeldungen statt aus Daten lernen und darauf abzielen, eine optimale Strategie in dynamischen und unsicheren Umgebungen zu finden. Reinforcement Learning nutzt Kenntnisse des menschlichen Denkprozesses, um Roboter zu trainieren. Roboter lernen, Entscheidungen zu treffen, um maximale Belohnungen zu erzielen, sprich: maximalen Erfolg zu haben. Roboter streben danach, ihre Leistung zu optimieren und kontinuierlich zu verbessern. In einem interaktiven Trainingsprozess erlangt der Roboter Kenntnisse darüber, welche Handlungen dazu führen, eine Aufgabe zu lösen und welche nicht. Direktes Feedback belohnt oder bestraft den Roboter für jede Handlung. Im Verlauf dieses interaktiven Prozesses entwickelt der Roboter ein trainiertes neuronales Netzwerk, ähnlich wie der Mensch durch Erfahrung lernt und Synapsen bildet. Der gesamte Workflow des Reinforcement Learning ist also ein iterativer Lernprozess.
Stangl, W. (2024, 6. Februar). Reinforcement learning. Online Lexikon für Psychologie & Pädagogik.
https://lexikon.stangl.eu/16761/reinforcement-learning.
Nachricht ::: Soziale Robotik ::: Impressum
Datenschutzerklärung ::: © Benjamin Stangl :::