Revision as of 20:51, 25 July 2025 edit Citation bot (talk \| contribs) Bots 5,863,572 edits Added bibcode. Removed URL that duplicated identifier. \| Use this bot. Report bugs. \| Suggested by Headbomb \| #UCB_toolbar ← Previous edit		Latest revision as of 15:26, 20 August 2025 edit undo Citation bot (talk \| contribs) Bots 5,863,572 edits Added url. \| Use this bot. Report bugs. \| Suggested by 16dvnk \| Category:Artificial intelligence \| #UCB_Category 69/198
Line 80: * {{Cite book \|last=Bertsekas \|first=Dimitri P. \|title=Reinforcement learning and optimal control \|date=2019 \|publisher=Athena Scientific \|isbn=978-1-886529-39-7 \|edition=2 \|___location=Belmont, Massachusetts}} * {{Cite book \|last=Grossi \|first=Csaba \|title=Algorithms for Reinforcement Learning \|date=2010 \|publisher=Springer International Publishing \|isbn=978-3-031-00423-0 \|edition=1 \|series=Synthesis Lectures on Artificial Intelligence and Machine Learning \|___location=Cham}} * {{Cite journal \|last1=Grondman \|first1=Ivo \|last2=Busoniu \|first2=Lucian \|last3=Lopes \|first3=Gabriel A. D. \|last4=Babuska \|first4=Robert \|date=November 2012 \|title=A Survey of Actor-Critic Reinforcement Learning: Standard and Natural Policy Gradients \|journal=IEEE Transactions on Systems, Man, and Cybernetics - Part C: Applications and Reviews \|volume=42 \|issue=6 \|pages=1291–1307 \|doi=10.1109/TSMCC.2012.2218595 \|bibcode=2012ITHMS..42.1291G \|issn=1094-6977 \|url=https://hal.science/hal-00756747 }} {{Artificial intelligence navbox}} [[Category:Reinforcement learning]]

Actor-critic algorithm: Difference between revisions