回答:
はい、それは技術的な理由で重要です。基本的に最適化のため。LeCunらによるEfficient Backpropを読む価値があります。
その選択には2つの理由があります(データを正規化した場合、これは非常に重要です)。
tanh関数の範囲は[-1,1]、シグモイド関数の範囲は[0,1]です
@jpmucに感謝します!あなたの答えに触発されて、tanh関数と標準シグモイド関数の導関数を別々に計算してプロットしました。皆さんと共有したいと思います。ここに私が得たものがあります。これは、tanh関数の導関数です。[-1,1]の間の入力に対して、[0.42、1]の間の導関数があります。
これは、標準シグモイド関数f(x)= 1 /(1 + exp(-x))の導関数です。[0,1]の間の入力の場合、[0.20、0.25]の間の導関数があります。
明らかに、tanh関数はより強い勾配を提供します。