Revision as of 04:00, 25 January 2025 edit Cosmia Nebula (talk \| contribs) Extended confirmed users 11,304 edits →References Tag: 2017 wikitext editor ← Previous edit		Revision as of 04:01, 25 January 2025 edit undo Cosmia Nebula (talk \| contribs) Extended confirmed users 11,304 edits →Policy gradient: anchor REINFORCE Tag: Visual edit Next edit →
Line 27: == REINFORCE == {{Anchor\|REINFORCE}} === Policy gradient === Line 196 ⟶ 197: * [[Reinforcement learning]] * [[Deep reinforcement learning]] * [[REINFORCE algorithm]] * [[Actor-critic method]]

Policy gradient method: Difference between revisions