「ディープラーニングでGPUを極限まで使い、並列で映像解析させるのに苦労した」

投稿者: Takayuki Iida 投稿日:

弊社の技術紹介の一環として、2019/11/2にQiitaへ技術解説記事「ディープラーニングでGPUを極限まで使い、並列で映像解析させるのに苦労した」を投稿しました。
これはNVIDIA社のGeForceシリーズのGTX 1080 (VRAM 8GB)と呼ばれるコンシューマ用(ゲーム用)のGPUボードを使い、効率の良いメモリ配分と映像解析の並列処理を実験したものです。

記事では
GPUに並列処理させるにはKerasのメモリ割当方法の指定が必須
比較用基準値の設定
最小限のメモリだけ確保する
  1)2映像を並行処理
  2)3映像を並行処理
合計GPUメモリの割合指定で確保する
  1)2映像を並行処理
  2)3映像を並行処理
結果と感想
などを紹介しております。

結果として、記事執筆時の実験環境で一番効率化がいいのは「25%のメモリ割合指定で3並列化した場合」と判明しました。

1本ずつ順番に3本実行すると440秒かかるものを並列化で307秒で処理できます。記事本文はこちらからどうぞ。

カテゴリー: 技術解説

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です