技術

GT 640(GK208)における自作BVHトラバース&交差判定カーネルの速度

オーソドックスなCornellBoxのシーン(ポリゴン数32)において約100万レイのレイキャストをGPUで処理するコードを以前書きいくつかのGPUで速度を測っていたが、今回GT 640(GK208)でも測ってみた。

これまでの記録をまとめてみると以下のとおり。
(パケットトラバーサル化前)

  • 9400M (CPU: C2D 2GHz, OS: Mac 10.8.3) 約0.5秒
  • GT 520 (CPU: Celeron G530, OS: Windows 7) 約0.22秒
  • GT 640(GK208) (CPU: Celeron G530, OS: Windows 7) 約0.06秒
  • GTX 460 (CPU: Xeon L3406, OS: Ubuntu 13.04) 約0.027秒
  • GTX 560Ti (CPU: Core i3 530@3.8GHz, OS: Windows 7) 約0.023秒

520と640に関してはGPU以外の構成は同じだが、それ以外はそうではないので単純に比較することは出来ない。

全体的にTDPと速度が素直に比例してるだけ、と言えそうな感じではあるが、GK208とGT 520とではそれ以上に差がついてるようす。
アーキテクチャとメモリ帯域の差だろうか。
CC1.1の機能しかつかってないカーネルなので、もっと高いバージョンに合わせて最適化したらさらに差が生まれるかもしれない。
が、その予定は未定。

コメントを残す

メールアドレスが公開されることはありません。



※画像をクリックして別の画像を表示

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください