メニーコアプロセッサによる科学技術計算 2

利点
  1. 市場が大きいため、価格性能比が良い。GPUは全てのゲーム機やパソコンに搭載されるため、大量生産される。半導体価格は出荷個数の対数に反比例し、沢山作ると安くなる。高性能だが少数しか作られない専用計算機と大きく違う点である。
  2. 単純な並列処理に特化するため、汎用CPUより回路が単純で、同じダイ面積で高い理論演算性能を持つ。他方複雑な逐次処理では性能は低い
欠点
  1. 単精度計算は高速だが、倍精度計算は遅い。つまりかなりの計算を単精度で行える場合は高速化できる。倍精度演算器は単精度の5倍の規模が必要な事、科学技術計算の市場の狭さを考えると、倍精度で価格性能比が悪くなるのはやむを得まい。
  2. 汎用CPUとは異なり、メモリーアクセスは遅く、threadに割り当てられるリソースも僅かである。Pipeline stallを隠すため、細粒度で多数の並列処理が必要である。ハードウェアが汎用CPUとかなり異なり、別のアルゴリズムやプログラムが必要である。またGPUの計算速度(数百GLOPS)に比べて、CPU-GPU間の通信速度はとても遅い。
  3. ホストで行う逐次処理は遅いので、アムダールの法則から、全計算の殆どをGPUで行わないと速くならない。つまり計算の核心部分は、GPU用に再度書き直す必要がある。