Reinforcement Learning: ChatGPT and RLHF

Name: Reinforcement Learning: ChatGPT and RLHF
Uploaded: 2023-08-14T14:39:59Z
Duration: 6 min 31 s
Channel: Graphics in 5 Minutes
Description: Reinforcement Learning from human feedback, and how it's used to help train large language models like ChatGPT. Part 3 of RL ...

Graphics in 5 Minutes · Beginner ·🧠 Large Language Models ·6:31 ·2y ago

Reinforcement Learning from human feedback, and how it's used to help train large language models like ChatGPT. Part 3 of RL ...

Watch on YouTube ↗ (saves to browser)

Next Up

5 Levels of AI Agents - From Simple LLM Calls to Multi-Agent Systems

Dave Ebbelaar (LLM Eng)