Maxwell Ashford. “Facilitating Cross-Domain Reasoning Generalization through Conservative Offline Reinforcement Learning Leveraging Pre-Trained Large Language Model Representations”. Computational Intelligence Systems, vol. 4, no. 1, May 2026, doi:10.66280/cis.v1i1.196.