タグ

CUDA

GT 640(GK208)における自作BVHトラバース&交差判定カーネルの速度

オーソドックスなCornellBoxのシーン(ポリゴン数32)において約100万レイのレイキャストをGPUで処理するコードを以前書きいくつかのGPUで速度を測っていたが、今回GT 640(GK208)でも測ってみた。

続きを読む

GT 640(GK208)の32ビット整数シフト命令のスループット

同じCompute CapabilityでもTeslaとGeForceじゃ倍精度浮動小数点演算命令のスループットが全然違うって話はよく知られてると思うけど、以下のブログ記事にてそれ以外の命令でも違いがあるよと書いてあったのでGT 640(GK208)で確かめてみた。
GTX TITANの32ビット整数シフト – 正統納豆天国ブログ – Yahoo!ブログ

続きを読む

GeForce GT 520 と GT 640(GK208) でCUDAのサンプルを幾つか実行してみた

グレードが違うので比較しても仕方ない気がするが、昨日書いた通りGT 520をGT 640(GK208)に換装した環境でいくつかCUDAのサンプルを実行してみた。

続きを読む

Compute Capability 3.5 な演算ユニットを手に入れた

といってもGeForce GTX TITANでもGTX 780でもなく、もちろんバカ高いTesla K20でもない。

続きを読む

バイトニックソート リベンジ

リベンジといっても最適化したんじゃなくてただ実行するマシンを変えてみただけ。

続きを読む

std::sortと独自バイトニックソートとthrust::sortの速度

約100万要素(1024 * 1024)の32bit整数のソート速度を以下のプログラムで測ってみた。
全て C++で書き、64bit、O3でコンパイルした。
実行したマシンはCore 2 Duo 2GHz, Geforce 9400M。

続きを読む

cu.hppが一応Windowsでも使えた

この前公開したcu.hppをWindowsでも試してみたら使えた。
といっても確認したコンパイラはVC++ではなくてclang++。

続きを読む

nvccでアーキテクチャの設定は出来るだけ下げた方が速い?

自分とこのGTX 460(Ubuntu)でしか確認してないので全然確信は持てないんだけど、カーネルのコンパイルを

続きを読む