fix script

ee225d88 · nanziyuan · 944b6831 · ee225d88 · ee225d88
Commit ee225d88 authored Jan 08, 2025 by nanziyuan
Hide whitespace changes
Inline Side-by-side

Showing with 13 additions and 12 deletions

scripts/algolr.sh
+12 -12

scripts/train_orm.sh
+1 -0

No files found.
--- a/scripts/algolr.sh
+++ b/scripts/algolr.sh
@@ -12,19 +12,19 @@ train_selected_pairs="${project}/data/train/${modelname}-apps-train-selected_pai
 apps="/lustre/S/nanziyuan/datasets/apps/"
 sft="${project}/data/train/${modelname}-sft.jsonl"
-ftmodel="${project}/model/algolr"
+ftmodel="${project}/model/qwen25_coder_inst_7b-algolr"
-export CUDA_VISIBLE_DEVICES=0,1,2,3
+### export CUDA_VISIBLE_DEVICES=0,1,2,3
-# python -m codecritic.cli.algolr \
+python -m codecritic.cli.algolr \
-#        --model ${model} \
+       --model ${model} \
-#        --dataset ${trainset} \
+       --dataset ${trainset} \
-#        --pairinfo ${train_selected_pairs} \
+       --pairinfo ${train_selected_pairs} \
-#        --apps ${apps} \
+       --apps ${apps} \
-#        --output ${sft} \
+       --output ${sft} \
-#        --level beginner \
+       --level beginner \
-#        --tp 1
+       --tp 1
 deepspeed --module \
@@ -34,7 +34,7 @@ openrlhf.cli.train_sft \
   --input_key question \
   --output_key response \
   --apply_chat_template \
-   --train_batch_size 32 \
+   --train_batch_size 256 \
   --micro_train_batch_size 2 \
   --max_samples 500000 \
   --pretrain ${model} \
@@ -49,4 +49,4 @@ openrlhf.cli.train_sft \
   --learning_rate 5e-6 \
   --load_checkpoint \
   --gradient_checkpointing \
-   --use_tensorboard ${ftmodel}/runs
+   --use_tensorboard "${ftmodel}_log"
--- a/scripts/train_orm.sh
+++ b/scripts/train_orm.sh
@@ -2,6 +2,7 @@ set -xe
 dataset="/lustre/S/nanziyuan/projects/ccc/data/train/qwen25_coder_inst-apps-train-reward_dataset.jsonl"
+project="/lustre/S/nanziyuan/projects/ccc"
 model="/lustre/S/huangdi/open_for_out/models/Qwen2.5-Coder-7B-Instruct/"
 ftmodel="${project}/model/qwen25_coder_inst_7b-orm"