Takashi's Notes

❯

❯

machine learning

❯

Reward Model and Linear Dynamical System

Reward Model and Linear Dynamical System

Nov 20, 20251 min read

Reward Model and Linear Dynamical System

Prev: 19-mdps-valuepolicy-iteration

Prev: 19-mdps-valuepolicy-iteration

Graph View

Backlinks

MDPs & Value/Policy Iteration

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community