Skip to content

Latest commit

 

History

History
35 lines (25 loc) · 1.1 KB

README.md

File metadata and controls

35 lines (25 loc) · 1.1 KB

Software Design 2021年3月号 ディープラーニングではじめるソフトウェア高速化入門 第5回 サンプルコード

Software Design 2021年3月号掲載の「ディープラーニングではじめるソフトウェア高速化入門 第5回」のサンプルコードです。

動作確認環境

  • Ubuntu 18.04 LTS
  • CUDA Toolkit 10.0

ビルド方法

relu および matmul ディレクトリ中で make コマンドを実行することで対応するプログラムがビルドされます。

プログラムの説明と実行方法

ReLU (relu)

  • ReLU関数をCPUとGPUで実行し、処理時間の計測と結果の比較を行います。
  • 要素数はコマンドライン引数として指定します。
./relu 1048576

行列積 (matmul)

  • 行列積をCPUとGPUで実行し、処理時間の計測と結果の比較を行います。
  • 行列サイズはコマンドライン引数として指定します。
./matmul 2048

作者

  • 平櫛 貴章 (株式会社フィックスターズ)

ライセンス

  • Apache License 2.0