RL LLMs - Search Videos

Reinforcement Learning for LLM Reasoning. RL / RLHF / RLAIF.

Reinforcement Learning for LLM Reasoning. RL / RLHF / RLAIF.

185 views6 months ago

YouTubeByte Goose AI.

RL & LLMs: The Breakthrough That Changed Everything!

RL & LLMs: The Breakthrough That Changed Everything!

1.4K views7 months ago

YouTubeLatent Space Clips

Reinforcement Learning with Human Feedback (RLHF) - How to train and fine-tune Transformer Models

Reinforcement Learning with Human Feedback (RLHF) - How to train an…

34.8K viewsFeb 12, 2024

YouTubeLuis Serrano Academy

Reinforcement Learning: ChatGPT and RLHF

Reinforcement Learning: ChatGPT and RLHF

24.8K viewsAug 14, 2023

YouTubeGraphics in 5 Minutes

Proximal Policy Optimization (PPO) - How to train Large Language Models

Proximal Policy Optimization (PPO) - How to train Large Language Mod…

83.3K viewsJan 24, 2024

YouTubeLuis Serrano Academy

Reinforcement Learning (RL) for LLMs

Reinforcement Learning (RL) for LLMs

13.9K viewsMar 12, 2025

YouTubeNatasha Jaques

[UCLA RL-LLM] Chapter 3.2: Reinforcement learning with verifiable rewards (RLVR)

[UCLA RL-LLM] Chapter 3.2: Reinforcement learning with verifi…

3.8K views10 months ago

YouTubeErnest Ryu

RLAIF Reinforcement Learning with AI Feedback or Aligning Large La…

1.5K viewsSep 6, 2023

YouTubeAI WITH Rithesh

Stabilizing RL with LLMs: Theory & Practice

2 views5 months ago

YouTubeZac AI Capsule

[UCLA RL-LLM] Chapter 0: Course outline and prologue

13K views10 months ago

YouTubeErnest Ryu

How to do Distributed RL Training for LLM? feat. Eric Yang from Gra…

1.7K views1 month ago

YouTubeDeep Learning with Yacine

Optimizing Large Language Models with Reinforcement Learning-Bas…

1.7K viewsMay 21, 2023

YouTubeLLMs Explained - Aggregate Intellect - AI.SCIE…

What you need to know about LLMs (Part 1 of 10)

Microsoftv-trmyl

Reinforcement Learning in the Era of LLMs

1.8K viewsMar 13, 2024

YouTubeArize AI

Meet verl: An RL Framework for LLM Reasoning & Tool Use | Ray Sum…

1.4K views6 months ago

YouTubeAnyscale

LAPP: Large Language Model Feedback for Preference-Driven R…

465 viewsApr 24, 2025

YouTubeGeneral Robotics Lab

Survey: Agentic RL for LLMs Explained

105 views8 months ago

YouTubeAI Research Roundup

Why Reinforcement Learning Unlocks Reasoning in LLMs (Aha …

2.5K views4 months ago

YouTubeAI Papers Academy

LoongRL: RL trains LLMs for long-context reasoning

57 views6 months ago

YouTubeAI Research Roundup

Sutton on RL, LLMs, and the Future of AI

23 views5 months ago

YouTubeLearn by Doing with Steven

Huggingface TRL vs Unsloth RL: Reinforcement Learning Framewo…

240 views1 month ago

YouTubeByte Goose AI.

Efficient LLM RL Training with Experience Replay

20 views1 month ago

YouTubeAI Research Roundup

A Step-by-Step Guide to Securing Large Language Models (LLMs)

1.4K viewsJun 10, 2024

YouTubeRSAC Cybersecurity

LLMs (Large Language Models) - Explained in 8 minutes.

37 views5 months ago

YouTubeCoding Picasso

Lecture 19 - Applying RL in LLMs | Reinforcement Learning Phase | R…

2K views10 months ago

From Deep Reinforcement Learning to LLM-based Agents: Perspective…

1.8K viewsJul 1, 2024

YouTubeRL and Agents Reading Group

Next-Gen AI - Multi-Agent LLMs and Policy Gradient RL Explained

2.8K views10 months ago

YouTubeAI Super Storm

What are large language models (LLMs) and how do they work?

27.3K viewsFeb 24, 2023

YouTubeBoost AI

How to Run LLMs Locally in 3 Easy Steps | AIM

2.8K viewsAug 7, 2024

YouTubeAIM Network

RLDP: Revolutionizing Private LLM Fine-Tuning with Reinforcement L…

143 views9 months ago

YouTubeHossam Magdy Balaha

See more videos