Pergunta de entrevista da empresa Stellantis

Expliquez le Reinforcement Learning from Human Feedbac ?