手动调用mode()方法和直接调用model.generate()方法，输出的结果十分不同 #1328

rooikeee · 2024-10-17T16:07:33Z

System Info / 系統信息

CUDA: 12.6
Transformer: 4.41.0
python: 3.12.3
model: ChatGLM3-6b-8k

Who can help? / 谁可以帮助到您？

No response

Information / 问题信息

The official example scripts / 官方的示例脚本
My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

我使用了两种generate方法，第一种方法如下：

output = model.generate(
        **input, 
        max_num_tokens=1,
        num_beams =1,
        do_sample=False,
        temperature=1.0
)[0]

得到的输出如下：

第二种方法如下：

            with torch.no_grad():
                # prefill
                output = model(
                    input_ids=input.input_ids,
                    past_key_values=None,
                    use_cache=True,
                )
                past_key_values = output.past_key_values
                pred_token_idx = output.logits[:, -1, :].argmax(dim=-1).unsqueeze(1)
                generated_content = [pred_token_idx.item()]
                
                # decode
                for _ in range(max_gen - 1):
                    outputs = model(
                        input_ids=pred_token_idx,
                        past_key_values=past_key_values,
                        use_cache=True,
                    )

                    past_key_values = outputs.past_key_values
                    pred_token_idx = (
                        outputs.logits[:, -1, :].argmax(dim=-1).unsqueeze(1)
                    )
                    generated_content += [pred_token_idx.item()]
                    if pred_token_idx.item() == tokenizer.eos_token_id:
                        break

得到的输出为：

Expected behavior / 期待表现

两种方法的输入都是相同的，按理说得到的输出相差应该不会太大。请问大佬我忽略了那些因素？正确的调用方法应该是什么？谢谢大佬解答。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

手动调用mode()方法和直接调用model.generate()方法，输出的结果十分不同 #1328

手动调用mode()方法和直接调用model.generate()方法，输出的结果十分不同 #1328

rooikeee commented Oct 17, 2024

手动调用mode()方法和直接调用model.generate()方法，输出的结果十分不同 #1328

手动调用mode()方法和直接调用model.generate()方法，输出的结果十分不同 #1328

Comments

rooikeee commented Oct 17, 2024

System Info / 系統信息

Who can help? / 谁可以帮助到您？

Information / 问题信息

Reproduction / 复现过程

Expected behavior / 期待表现