为什么使用llama脚本转换qwen1.5权重文件，转出来的文件是model.pth和opmx_params.json两个文件 #90

Flynn-Zh · 2024-07-15T03:54:27Z

No description provided.

yinfan98 · 2024-07-16T14:46:19Z

是两个文件，具体是什么问题呢？

yinfan98 · 2024-07-16T16:03:08Z

转换的目的是为了适配pmx自己的RoPE逻辑，然后后续会为了适配量化做这一步转换。

Flynn-Zh · 2024-07-17T01:47:22Z

是两个文件，具体是什么问题呢？

怎么进一步转换成 onnx 或者 pmx 格式？用 ppl.llm.serving 启动，提升 pmx 或者 onnx 文件不存在

yinfan98 · 2024-07-17T08:28:27Z

怎么进一步转换成 onnx 或者 pmx 格式？用 ppl.llm.serving 启动，提升 pmx 或者 onnx 文件不存在

继续Export.py导出模型，就能获得onnx格式的文件

Flynn-Zh · 2024-07-22T02:20:52Z

怎么进一步转换成 onnx 或者 pmx 格式？用 ppl.llm.serving 启动，提升 pmx 或者 onnx 文件不存在

继续Export.py导出模型，就能获得onnx格式的文件
试过了，继续 Export 导出模型，有大量的警告， Warning: The shape interface of opmx::XX（如 ParallelEmbedding、ColumnParallelLinear、Reshape等） type is missing，用转出来的 onnx 格式的文件启动 ppl_llm_server，提示 unsupported op: domain[opmx], type[ParallelEmbedding]

yinfan98 · 2024-07-22T14:04:25Z

@Flynn-Zh 更具体的可能需要问下 @Alcanderian or @Jzz24

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

为什么使用llama脚本转换qwen1.5权重文件，转出来的文件是model.pth和opmx_params.json两个文件 #90

为什么使用llama脚本转换qwen1.5权重文件，转出来的文件是model.pth和opmx_params.json两个文件 #90

Flynn-Zh commented Jul 15, 2024

yinfan98 commented Jul 16, 2024

yinfan98 commented Jul 16, 2024

Flynn-Zh commented Jul 17, 2024

yinfan98 commented Jul 17, 2024

Flynn-Zh commented Jul 22, 2024

yinfan98 commented Jul 22, 2024

为什么使用llama脚本转换qwen1.5权重文件，转出来的文件是model.pth和opmx_params.json两个文件 #90

为什么使用llama脚本转换qwen1.5权重文件，转出来的文件是model.pth和opmx_params.json两个文件 #90

Comments

Flynn-Zh commented Jul 15, 2024

yinfan98 commented Jul 16, 2024

yinfan98 commented Jul 16, 2024

Flynn-Zh commented Jul 17, 2024

yinfan98 commented Jul 17, 2024

Flynn-Zh commented Jul 22, 2024

yinfan98 commented Jul 22, 2024