Revision as of 16:28, 27 January 2025 edit Citation bot (talk \| contribs) Bots 5,863,784 edits Altered url. URLs might have been anonymized. Add: authors 1-1. Removed URL that duplicated identifier. Removed parameters. Some additions/deletions were parameter name changes. \| Use this bot. Report bugs. \| Suggested by Abductive \| Category:Reinforcement learning \| #UCB_Category 14/14 ← Previous edit		Revision as of 20:22, 25 May 2025 edit undo OAbot (talk \| contribs) Bots 643,717 edits m Open access bot: url-access updated in citation with #oabot. Next edit →
Line 76: == References == {{Reflist\|30em}} * {{Cite journal \|last1=Konda \|first1=Vijay R. \|last2=Tsitsiklis \|first2=John N. \|date=January 2003 \|title=On Actor-Critic Algorithms \|url=http://epubs.siam.org/doi/10.1137/S0363012901385691 \|journal=SIAM Journal on Control and Optimization \|language=en \|volume=42 \|issue=4 \|pages=1143–1166 \|doi=10.1137/S0363012901385691 \|issn=0363-0129\|url-access=subscription }} * {{Cite book \|last1=Sutton \|first1=Richard S. \|title=Reinforcement learning: an introduction \|last2=Barto \|first2=Andrew G. \|date=2018 \|publisher=The MIT Press \|isbn=978-0-262-03924-6 \|edition=2 \|series=Adaptive computation and machine learning series \|___location=Cambridge, Massachusetts}} * {{Cite book \|last=Bertsekas \|first=Dimitri P. \|title=Reinforcement learning and optimal control \|date=2019 \|publisher=Athena Scientific \|isbn=978-1-886529-39-7 \|edition=2 \|___location=Belmont, Massachusetts}}

Actor-critic algorithm: Difference between revisions