カテゴリー

技術 – ページ 13

GT 640(GK208)における自作BVHトラバース&交差判定カーネルの速度

オーソドックスなCornellBoxのシーン(ポリゴン数32)において約100万レイのレイキャストをGPUで処理するコードを以前書きいくつかのGPUで速度を測っていたが、今回GT 640(GK208)でも測ってみた。

続きを読む

GT 640(GK208)の32ビット整数シフト命令のスループット

同じCompute CapabilityでもTeslaとGeForceじゃ倍精度浮動小数点演算命令のスループットが全然違うって話はよく知られてると思うけど、以下のブログ記事にてそれ以外の命令でも違いがあるよと書いてあったのでGT 640(GK208)で確かめてみた。
GTX TITANの32ビット整数シフト – 正統納豆天国ブログ – Yahoo!ブログ

続きを読む

GeForce GT 520 と GT 640(GK208) でCUDAのサンプルを幾つか実行してみた

グレードが違うので比較しても仕方ない気がするが、昨日書いた通りGT 520をGT 640(GK208)に換装した環境でいくつかCUDAのサンプルを実行してみた。

続きを読む

バイトニックソート リベンジ

リベンジといっても最適化したんじゃなくてただ実行するマシンを変えてみただけ。

続きを読む

std::sortと独自バイトニックソートとthrust::sortの速度

約100万要素(1024 * 1024)の32bit整数のソート速度を以下のプログラムで測ってみた。
全て C++で書き、64bit、O3でコンパイルした。
実行したマシンはCore 2 Duo 2GHz, Geforce 9400M。

続きを読む

バイトニックソート

GPUでソートを行う必要があり、GPUソートにおける代表格であるバイトニックソートについて調べた。

続きを読む

cu.hppが一応Windowsでも使えた

この前公開したcu.hppをWindowsでも試してみたら使えた。
といっても確認したコンパイラはVC++ではなくてclang++。

続きを読む