以下の表(HD3000とHD4000の比較)で確認できますが、検証環境として利用するIntel HD 4000では、AVX機能が採用されています。OpenCLではSIMD-32を使った場合は、16 x 8 x 32 = 4,096スレッド(ワーク・アイテム)の並列処理が理論的には可能ということになります。ただし筆者がコードするOpenCLプログラマでコンパイラはSIMD-8かSIMD-16のいずれかを選択するため、現実的には2,048スレッドが想定最大スレッド数となります。
表2.9 表:HD3000とHD4000の比較
Intel HD 3000 | Intel HD 4000 |
第2世代CPUに内蔵 | 第3世代CPUに内蔵 |
12 EU | 16 EU |
5スレッド/EU | 8スレッド/EU |
1 texture sampler | 2 texture samplers |
32nm | 22nm |
Copyright 2018-2019, by Masaki Komatsu