タグ

GPGPU

最適化って難しい

SSEを明示的に使うようにしたらどのくらい高速化するかを、何種類かテストコードを書いて計測するというのを最近やってたんだけど、
結果的には、Intrinsic関数(接頭辞_mmなアレ)を使い始めたばかりの素人である私が部分的にSSEを使うように書くより、何も考えずに書いてコンパイラの自動最適化に任せた方がたいていの場合微妙に速いという結論に達した。

続きを読む
Shadow caster mapによる高速・高品質な影計算

ソフトシャドウの計算の処理速度がかなり改善された。
GPU_softshadow_SM512_DV0.1_C163_6sec
これは光源数163の場合でトータルの処理時間は6秒。
以前実装したものは、これとほぼ同じ条件で30秒以上掛かっていた。
最新のハイエンドGPUなら、この手法でも少し条件に制限を設けることで面光源によるソフトシャドウのリアルタイム処理も可能かもしれない。

続きを読む
いまXcodeでOpenGLを使ったGPUコンピューティングをはじめる方法

OpenGLに慣れてれば簡単だと思うけど、慣れてないと難しいと思う。
この辺はやはりCUDAとかのGPGPU用のAPIに比べると、必要な手続きが多過ぎる感がある。
1から作る場合はCUDAの方が明らかに楽だけど、ターゲット環境の問題とかでCUDAを選択出来ないときや、すでにOpenGLを使ってるアプリに組み込むときOpenGLでGPGPUをやるのもいいと思う。

続きを読む
GeForce GTX 460 と GTX 260 の CUDA 性能比較

もうすぐ誕生日ということで(泣、GTX 460を買っていただきましたので(喜、今まで使ってたGTX 260との性能比較をします。
単に3D描画のベンチとっても他で散々やられてるしつまらないので(本当はちゃんとベンチをとる堪え性がないだけw)、NVIDIAのサイトからCUDA Toolkitとサンプルコードをダウンロードして実行結果をてきとうに見ていきます。

続きを読む