如果您手上有1684X芯片的SoC板卡或者PCIE板卡,例如Airbox(SoC),那么可以参考以下步骤跑通大语言模型,这里以Llama2-7B为例。
另外SoC的执行步骤和PCIE的有些区别,PCIE必须要安装docker后才能运行,这里将其分开说明。
git clone https://github.com/sophgo/LLM-TPU.git
./run.sh --model llama2-7b
docker pull sophgo/tpuc_dev:latest
docker run --privileged --name mlir -v /dev:/dev -v $PWD:/workspace -it sophgo/tpuc_dev:latest bash
docker exec -it mlir bash
git clone https://github.com/sophgo/LLM-TPU.git
./run.sh --model llama2-7b
在开始之前,首先要检查sophon-driver的版本是否符合条件
uname -v
之后,会显示类似这样的一个时间#2 SMP Sat Nov 18 10:07:36 HKT 2023
,如果你的日期>=20240110,也就是比较新,那么跳过这一步,如果日期<20240110,也就是版本比较老,那么参考这个链接重新安装sdk,刷机包则用以下命令获取
pip3 install dfss
python3 -m dfss [email protected]:/ext_model_information/LLM/LLM-TPU/sdcard.tgz
cat /proc/bmsophon/driver_version
之后,会显示类似这样的一个release daterelease version:0.5.0 release date: 20240304-175610
,如果你的日期>=20240110,也就是比较新,那么跳过这一步,如果日期<20240110,也就是版本比较老,那么按照如下步骤重新安装driver
pip3 install dfss
python3 -m dfss [email protected]:/ext_model_information/LLM/LLM-TPU/sophon-driver_0.5.0_amd64.deb
python3 -m dfss [email protected]:/ext_model_information/LLM/LLM-TPU/sophon-libsophon-dev_0.5.0_amd64.deb
python3 -m dfss [email protected]:/ext_model_information/LLM/LLM-TPU/sophon-libsophon_0.5.0_amd64.deb
sudo apt remove sophon-driver sophon-libsophon
sudo dpkg -i sophon-*.deb