Skip to content

Latest commit

 

History

History
131 lines (97 loc) · 4.59 KB

README_ja.md

File metadata and controls

131 lines (97 loc) · 4.59 KB

PaddlePaddle カスタム CPU のためのカスタムデバイス実装

English | 简体中文 | 日本語

カスタム CPU 用カスタムデバイス実装のコンパイル、インストール、検証については、以下の手順を参照してください。

環境とソースコードの準備

# 1. PaddlePaddle CPU の開発用 Docker イメージをプル
# イメージの dockerfile は tools/dockerfile ディレクトリにあります
docker pull registry.baidubce.com/device/paddle-cpu:ubuntu20-x86_64-gcc84-py310
docker pull registry.baidubce.com/device/paddle-cpu:ubuntu20-aarch64-gcc84-py310

# 2. docker コンテナを起動するには、以下のコマンドを参照
docker run -it --name paddle-dev-cpu -v `pwd`:/workspace \
  --network=host --shm-size=128G --workdir=/workspace \
  --cap-add=SYS_PTRACE --security-opt seccomp=unconfined \
  registry.baidubce.com/device/paddle-cpu:ubuntu20-$(uname -m)-gcc84-py310 /bin/bash

# 3. Paddle のソースコードと一緒にソースコードを再帰的にクローン
git clone --recursive https://github.com/PaddlePaddle/PaddleCustomDevice
cd PaddleCustomDevice

# 4. 以下のコマンドを実行してサブモジュールを更新
git submodule sync
git submodule update --remote --init --recursive

コンパイルとインストール

# カスタム CPU の実装へナビゲート
cd backends/custom_cpu

# コンパイルする前に、Paddle がインストールされていることを確認してください
pip install paddlepaddle==0.0.0 -f https://www.paddlepaddle.org.cn/whl/linux/cpu-mkl/develop.html

# ビルドディレクトリを作成し
mkdir build && cd build

cmake ..
make -j8

# pip を使って出力をインストールする
pip install dist/paddle_custom_cpu*.whl

検証

# 利用可能なハードウェアバックエンドをリストアップ
python -c "import paddle; print(paddle.device.get_all_custom_device_type())"

# 期待出力
['custom_cpu']

# 簡単なモデルを実行する
python ../tests/test_MNIST_model.py

# 期待される同様の出力
... ...
Epoch 0 step 0, Loss = [2.2956038], Accuracy = 0.15625
Epoch 0 step 100, Loss = [2.1552896], Accuracy = 0.3125
Epoch 0 step 200, Loss = [2.1177733], Accuracy = 0.4375
Epoch 0 step 300, Loss = [2.0089214], Accuracy = 0.53125
Epoch 0 step 400, Loss = [2.0845466], Accuracy = 0.421875
Epoch 0 step 500, Loss = [2.0473], Accuracy = 0.453125
Epoch 0 step 600, Loss = [1.8561764], Accuracy = 0.71875
Epoch 0 step 700, Loss = [1.9915285], Accuracy = 0.53125
Epoch 0 step 800, Loss = [1.8925955], Accuracy = 0.640625
Epoch 0 step 900, Loss = [1.8199624], Accuracy = 0.734375

PaddleInference の使用

プラグインの再コンパイル

# PaddleInference をコンパイルする
git clone https://github.com/PaddlePaddle/Paddle.git
git clone https://github.com/ronny1996/Paddle-Inference-Demo.git

mkdir -p Paddle/build
pushd Paddle/build

cmake .. -DPY_VERSION=3.7 -DWITH_GPU=OFF -DWITH_TESTING=ON -DCMAKE_BUILD_TYPE=Release -DON_INFER=ON -DWITH_MKL=ON -DWITH_CUSTOM_DEVICE=ON

make -j8

popd
cp -R Paddle/build/paddle_inference_install_dir Paddle-Inference-Demo/c++/lib/paddle_inference
export PADDLE_INFERENCE_LIB_DIR=$(realpath Paddle-Inference-Demo/c++/lib/paddle_inference/paddle/lib)

# プラグインのコンパイル
mkdir -p PaddleCustomDevice/backends/custom_cpu/build
pushd PaddleCustomDevice/backends/custom_cpu/build

cmake .. -DON_INFER=ON -DPADDLE_INFERENCE_LIB_DIR=${PADDLE_INFERENCE_LIB_DIR}
make -j8

# プラグインディレクトリの指定
export CUSTOM_DEVICE_ROOT=$PWD
popd

PaddleInference の使用

pushd Paddle-Inference-Demo/c++/resnet50

# resnet50_test.cc を修正し、config.EnableUseGpu(100, 0) の代わりに config.EnableCustomDevice("custom_cpu", 0) を使用

bash run.sh

期待される同様の出力

I0713 09:02:38.808723 24792 resnet50_test.cc:74] run avg time is 297.75 ms
I0713 09:02:38.808859 24792 resnet50_test.cc:89] 0 : 8.76192e-29
I0713 09:02:38.808894 24792 resnet50_test.cc:89] 100 : 8.76192e-29
I0713 09:02:38.808904 24792 resnet50_test.cc:89] 200 : 8.76192e-29
I0713 09:02:38.808912 24792 resnet50_test.cc:89] 300 : 8.76192e-29
I0713 09:02:38.808920 24792 resnet50_test.cc:89] 400 : 8.76192e-29
I0713 09:02:38.808928 24792 resnet50_test.cc:89] 500 : 8.76192e-29
I0713 09:02:38.808936 24792 resnet50_test.cc:89] 600 : 1.05766e-19
I0713 09:02:38.808945 24792 resnet50_test.cc:89] 700 : 2.04093e-23
I0713 09:02:38.808954 24792 resnet50_test.cc:89] 800 : 3.85255e-25
I0713 09:02:38.808961 24792 resnet50_test.cc:89] 900 : 8.76192e-29