私は統計を勉強していて、log
それを含む式に出くわすことがよくあり、それを標準の意味log
、つまり10進数として解釈する必要がある場合、または統計で記号log
が一般に自然対数であると想定される場合、常に混乱しますln
。
特に、私はグッドチューリング周波数推定を例として研究していますが、私の質問はより一般的なものです。
私は統計を勉強していて、log
それを含む式に出くわすことがよくあり、それを標準の意味log
、つまり10進数として解釈する必要がある場合、または統計で記号log
が一般に自然対数であると想定される場合、常に混乱しますln
。
特に、私はグッドチューリング周波数推定を例として研究していますが、私の質問はより一般的なものです。
回答:
統計ではベース10ログはあまり使用されないため、統計で明示的なベースがないと仮定しても安全です。ただし、他のポスターは、情報理論などの統計が適用される他の分野では、または他のベースが一般的である可能性があることを指摘しています。そのため、他の分野の論文を読むと、混乱することがあります。log 10
ウィキペディアのエントロピーページは、混乱した使用法の良い例です。同じページでは、ベース2、および任意のベースを意味します。コンテキストによって意味がわかりますが、テキストを読む必要があります。これは、資料を提示するのに適した方法ではありません。これを対数ページと比較してください。対数ページでは、すべての式でベースが明確に表示されるか、が使用されます。私は個人的にこれが進むべき方法だと考えています。記号が使用されている場合は常にベースを表示し。これは、ISO準拠であり、@ Henryが指摘しているように、シンボルで未指定のベースの使用法を定義していないためです。e ln log log
最後に、ISO 31-11標準では、2を底とする10の対数に対しておよび記号が規定されてい。両方が最近使用されることはめったにありません。私たちは高校でを使用したことを覚えていますが、それは別の世界の別の世紀にありました。統計的な文脈で使用されて以来、私はそれを見たことがありません。LaTeXにはタグすらありません。lg lg lb
場合によります。
値をデシベルに変換するなど、いくつかのコンテキスト以外では、10を底とする対数は方程式では非常にまれです。ただし、対数スケールのプロットは多くの場合10を基数としますが、これは軸のラベルから簡単に確認できるはずです。
数学的な文脈では、装飾されていないは自然なログ(つまり、または)である可能性があります。一方、コンピューターサイエンスでは2を底とする対数()を使用することが多く、そのように明確にマークされているとは限りません。良いニュースは、ベース間を簡単に変換できることです。「間違った」ベースを使用すると、一定の要因だけで答えが出なくなります。log e ln log 2
Galeの1995年の「涙のないグッドチューリング」論文では、テキストの対数は実際には (5ページでそう言っています)ですが、付録のR / S +コードは実際にまたは。@Henryが以下で指摘しているように、これは実際的な違いはありません。 log e lnlog
私が推測することを余儀なくされた場合、いくつかの発見的方法があります:
2、、または10の累乗も存在する場合、ログには対応するベースがある可能性があります。
積分から生じる(または、より一般的には微積分を伴う)場合、自然対数になる可能性があります。
(バイナリ検索のように)何かを繰り返し半分に分割することから生じる場合は、可能性があります。より一般的には、何かは約回分割できます。 n log n
情報理論計算では、特に現代の作業では、通常使用します。:しかし、あなたは確かに単位を確認することができます、、および。ビット → ログnats → ln bans → ログ10
関数が下降または上昇する点を見つけることは、初期値の(それぞれ37%および63%)を示唆していますログ。
あなたの質問に答えるために:いいえ、対数の一般的な固定表記を想定することはできません。
同様の質問が最近SE.Mathで議論されました:3種類の対数の違いは何ですか?数学的な観点から。一般に、習慣(は医学研究で使用されるようです)または言語(たとえば、ドイツ語、ロシア語、フランス語)に依存するさまざまな表記法があります。残念ながら、同じ表記法が異なる定義を表すことがあります。上記のSE.Mathリンクから引用:
表記(ほぼ)は、自然対数(ラテン:logarithmus naturalis)、または底対数を明確に示し ます。表記自然対数を採用表記であるべきで、それは数学でそうです。ただし、フィールドに応じて「最も自然な」ものを表すことがよくあります。学校では、ベース対数()として学んだため、エンジニアリングで(たとえば定義で)よく使用されます。デシベルの)log e x e log x ∗ 10 log 10
かなり頻繁に、物理単位(デシベル@Matt Krauseなど)の意味に関心がない場合、または特定の変化率に関心がない場合(生物統計学では 、倍変化の -ratioはしばしば底とする対数)、自然対数()が使用される可能性があります。 2 ログ2 ログe
たとえば、べき乗またはBox-Cox変換(分散安定化のため)では、指数がなる傾向がある場合に自然対数が制限として表示され。
最初の動機であるGood-Turing Frequency Evaluationに戻ると、The Population Frequencies of Species and the Evaluation of Population Parameters、IJ Good、Biometrika、1953年を読むのは興味深いです。ここでは、さまざまなコンテキストで対数を使用しました:分散安定化(バートレットとアンスコムの言及)、調和級数の合計、エントロピー。彼は通常、自然対数としてを使用していることがわかりまた、論文で、コンテキストで必要な場合にまたは指定していることが ます。分散の安定化、または基本的なエントロピー推定では、結果が線形に変化するため、対数の係数は結果をあまり変化させません。ログのE ログ10
赤池情報量基準ベースであり、および最大尤度のパラメータの数に付加的に比較される:
のL K A I C = 2 (K - LN (L ))。
したがって、AICの対数に他の基数を使用すると、間違った結論を導き出し、間違ったモデルを選択することになります。
ln
それが考慮されます。しかし、2つが関連している:log(x) = ln(x) / ln(10) = ln(x) / 2.303
、及びLN -likelihood関数は、同じ時点で極値に到達log10の -likelihood機能。