最近、GPUが正弦と余弦をどのように計算するのか疑問に思っています。Googleは正確な答えを見つけるのに役立ちませんでした。
最初は、計算をできるだけ速くするために、GPUがなんらかのルックアップテーブルを使用すると考えていました。しかし、私は、[0、2 * pi]の間のdoubleの範囲のテーブルにすべての罪の値を格納することは、膨大なものになるため、有効なオプションではないことに気付きました。
テーブルの解像度が低下する可能性があり、ルックアップの欠損値を許容できるようになります。ただし、これは、計算を複数回実行するときに、より大きくて許容できないエラーに波及する可能性のあるエラーをもたらします。
私の最後の考えは、それらがテイラー近似を使用している可能性があるということですが、これにはかなりの算術が含まれ、GPUには遅すぎる可能性があります。では、問題は、GPUが正弦を計算するために何を使用するかということです。それはルックアップテーブル、近似、または両方のハイブリッドですか?そして、可能であれば、sqrt()のような他の計算にも同じメソッドを使用しますか?