Revision as of 13:20, 4 July 2025 edit 213.147.161.159 (talk) Corrected use of comma next to an equation. ← Previous edit		Revision as of 04:57, 7 July 2025 edit undo Cosmia Nebula (talk \| contribs) Extended confirmed users 11,296 edits →References: navbox Tag: Visual edit Next edit →
Line 81: * {{Cite book \|last=Grossi \|first=Csaba \|title=Algorithms for Reinforcement Learning \|date=2010 \|publisher=Springer International Publishing \|isbn=978-3-031-00423-0 \|edition=1 \|series=Synthesis Lectures on Artificial Intelligence and Machine Learning \|___location=Cham}} * {{Cite journal \|last1=Grondman \|first1=Ivo \|last2=Busoniu \|first2=Lucian \|last3=Lopes \|first3=Gabriel A. D. \|last4=Babuska \|first4=Robert \|date=November 2012 \|title=A Survey of Actor-Critic Reinforcement Learning: Standard and Natural Policy Gradients \|url=https://ieeexplore.ieee.org/document/6392457 \|journal=IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews) \|volume=42 \|issue=6 \|pages=1291–1307 \|doi=10.1109/TSMCC.2012.2218595 \|issn=1094-6977}} {{Artificial intelligence navbox}} [[Category:Reinforcement learning]] [[Category:Machine learning algorithms]]

Actor-critic algorithm: Difference between revisions