Reinforcement Learning - Tag - Naifan Li's Blog

Tags Categories Archives About

Tags Categories Archives About

Reinforcement Learning

2025

DeepSeek R1 06-10

2022

InstructGPT: Training language models to follow instructions with human feedback 03-04

2018 - 2026 Naifan Li