Foundations

Reinforcement Learning

RL algorithms, reward modelling, RLHF, policy gradients, Q-learning and multi-agent RL

36

lessons

Skills in this topic

3 skills — Sign in to track your progress

View full skill map →

Formalise a problem as an MDP

Policy Gradient Methods

Implement REINFORCE from scratch

RLHF & Alignment

Describe the RLHF pipeline end-to-end

Videos 19 Reads 17

Level: All Beginner Intermediate Advanced

Any Length Short (<5m) Medium (5-20m) Long (>20m)

Newest Popular Oldest

Special Rewards In #100 (Link in Comments)

Reinforcement Learning

Special Rewards In #100 (Link in Comments)

GeeksforGeeks Intermediate 3y ago

Write an ARTICLE and win assured REWARDS | Technical Scripter Event 2022

Reinforcement Learning

Write an ARTICLE and win assured REWARDS | Technical Scripter Event 2022

GeeksforGeeks Intermediate 3y ago

Geek-O-Lympics 2022 LIVE Now | GeeksforGeeks

Reinforcement Learning

Geek-O-Lympics 2022 LIVE Now | GeeksforGeeks

GeeksforGeeks Intermediate 3y ago

Geeks Summer Carnival 2022 | 5th April- 11th April | GeeksforGeeks

Reinforcement Learning

Geeks Summer Carnival 2022 | 5th April- 11th April | GeeksforGeeks

GeeksforGeeks Intermediate 4y ago

📚 Continue on Coursera External links · Free to audit

View all →

📚 External: Coursera ↗

Total Rewards and Employee Development

Opens on Coursera ↗