Nathaniel Blackwood (2026) “Advancing Strategic Decision Excellence through Self Play Reinforcement Learning Frameworks Leveraging Large Language Models for Recursive Policy Improvement”, Computational Intelligence Systems, 4(1). doi: 10.66280/cis.v1i1.147.