specify repetition penalty

2026-05-20 16:35:47 +08:00 · 2023-10-13 11:44:48 +08:00
parent 024146bc82
commit f076e2fa42
4 changed files with 4 additions and 0 deletions
--- a/eval/evaluate_chat_ceval.py
+++ b/eval/evaluate_chat_ceval.py
@@ -31,6 +31,7 @@ def load_models_tokenizer(args):
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty
    return model, tokenizer

 def process_before_extraction(gen, question, choice_dict):
--- a/eval/evaluate_chat_gsm8k.py
+++ b/eval/evaluate_chat_gsm8k.py
@@ -129,6 +129,7 @@ if __name__ == "__main__":
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty

    test = dataset["test"]

--- a/eval/evaluate_chat_humaneval.py
+++ b/eval/evaluate_chat_humaneval.py
@@ -93,6 +93,7 @@ if __name__ == "__main__":
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty

    f_output = jsonlines.Writer(open(args.sample_output_file, "w", encoding="utf-8"))

--- a/eval/evaluate_chat_mmlu.py
+++ b/eval/evaluate_chat_mmlu.py
@@ -35,6 +35,7 @@ def load_models_tokenizer(args):
        args.checkpoint_path, trust_remote_code=True
    )
    model.generation_config.do_sample = False  # use greedy decoding
+    model.generation_config.repetition_penalty = 1.0  # disable repetition penalty
    return model, tokenizer