Revision as of 00:50, 27 January 2025 edit Cosmia Nebula (talk \| contribs) Extended confirmed users 11,304 edits →Formulation Tag: Visual edit ← Previous edit		Revision as of 05:05, 27 January 2025 edit undo Cosmia Nebula (talk \| contribs) Extended confirmed users 11,304 edits infobox Tag: Visual edit Next edit →
Line 340: * {{Cite web \|last=Weng \|first=Lilian \|date=2018-04-08 \|title=Policy Gradient Algorithms \|url=https://lilianweng.github.io/posts/2018-04-08-policy-gradient/ \|access-date=2025-01-25 \|website=lilianweng.github.io \|language=en}} * {{Cite web \|title=Vanilla Policy Gradient — Spinning Up documentation \|url=https://spinningup.openai.com/en/latest/algorithms/vpg.html \|access-date=2025-01-25 \|website=spinningup.openai.com}} {{Artificial intelligence navbox}} [[Category:Reinforcement learning]] [[Category:Machine learning algorithms]]

Policy gradient method: Difference between revisions