GT 640(GK208)における自作BVHトラバース&交差判定カーネルの速度

オーソドックスなCornellBoxのシーン(ポリゴン数32)において約100万レイのレイキャストをGPUで処理するコードを以前書きいくつかのGPUで速度を測っていたが、今回GT 640(GK208)でも測ってみた。

続きを読む

GT 640(GK208)の32ビット整数シフト命令のスループット

同じCompute CapabilityでもTeslaとGeForceじゃ倍精度浮動小数点演算命令のスループットが全然違うって話はよく知られてると思うけど、以下のブログ記事にてそれ以外の命令でも違いがあるよと書いてあったのでGT 640(GK208)で確かめてみた。
GTX TITANの32ビット整数シフト – 正統納豆天国ブログ – Yahoo!ブログ

続きを読む

GeForce GT 520 と GT 640(GK208) でCUDAのサンプルを幾つか実行してみた

グレードが違うので比較しても仕方ない気がするが、昨日書いた通りGT 520をGT 640(GK208)に換装した環境でいくつかCUDAのサンプルを実行してみた。

続きを読む

Compute Capability 3.5 な演算ユニットを手に入れた

といってもGeForce GTX TITANでもGTX 780でもなく、もちろんバカ高いTesla K20でもない。

続きを読む

実家のPCのメンテ

実家のPCは自作機で私が組んだんだけど、最近激重だということで診てみた。
(普段電話なんて一切しない父親から珍しく電話が入ってて、しかも超苦手であろう留守録が残ってたw よほど困ってたんだろうなぁ)
実家は遠いのでTeamViewerを使って遠隔で診た。

続きを読む

iOS 7やOS X 10.9やXcode 5関連の記事を削除した

記事は基本的に消さないという方針でこのブログをやってるけど、iOS 7やOS X 10.9やXcode 5関連の幾つかの記事がNDAに反する可能性があったので非公開にした。
ちなみに誰かからツッコまれたりしたからではない。

続きを読む

バイトニックソート リベンジ

リベンジといっても最適化したんじゃなくてただ実行するマシンを変えてみただけ。

続きを読む

最適化って難しい

SSEを明示的に使うようにしたらどのくらい高速化するかを、何種類かテストコードを書いて計測するというのを最近やってたんだけど、
結果的には、Intrinsic関数(接頭辞_mmなアレ)を使い始めたばかりの素人である私が部分的にSSEを使うように書くより、何も考えずに書いてコンパイラの自動最適化に任せた方がたいていの場合微妙に速いという結論に達した。

続きを読む