run_qwen_gsm8k_function_rm_both_kl.sh 1.94 KB