Nathaniel Blackwood. (2026). Advancing Strategic Decision Excellence through Self Play Reinforcement Learning Frameworks Leveraging Large Language Models for Recursive Policy Improvement. Computational Intelligence Systems, 4(1). https://doi.org/10.66280/cis.v1i1.147