From d5b60b9ea26eec9997b77e19d8f00bcb142ef5ff Mon Sep 17 00:00:00 2001 From: zou <57121762+Tao-begd@users.noreply.github.com> Date: Mon, 5 Aug 2024 16:39:50 +0800 Subject: [PATCH] Update README.md MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 图片地址缺失修改 --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index d841839e8a..22492167d2 100644 --- a/README.md +++ b/README.md @@ -5,7 +5,7 @@
这里稍微讲解了一些MLC的基本概念,以帮助我们使用和了解 MLC LLM。
MLC-LLM 由三个不同的子模块组成:模型定义、模型编译和模型运行。
-+
➀ Python 中的模型定义。MLC 提供各种预定义架构,例如 Llama(例如 Llama2、Vicuna、OpenLlama、Wizard)、GPT-NeoX(例如 RedPajama、Dolly)、RNN(例如 RWKV)和 GPT-J(例如MOSS)。开发人员可以仅使用纯 Python 定义模型,而无需接触编码。
➁ Python 中的模型编译。模型由TVM Unity编译器编译,其中编译配置为纯 Python。MLC LLM 将基于 Python 的模型量化导出到模型库并量化模型权重。可以用纯 Python 开发量化和优化算法,以针对特定用例压缩和加速 LLM。