見えないデータの対数平均された逆確率を指す用語「perplexity」に出会いました。困惑に関するウィキペディアの記事は、そのための直感的な意味を与えません。
誰もが困惑度の必要性と直感的な意味を説明できますか?
見えないデータの対数平均された逆確率を指す用語「perplexity」に出会いました。困惑に関するウィキペディアの記事は、そのための直感的な意味を与えません。
誰もが困惑度の必要性と直感的な意味を説明できますか?
回答:
あなたは困惑に関するウィキペディアの記事を見ました。離散分布の複雑さを次のように与えます
次のように書くこともできます
すなわち、確率の逆数の加重幾何平均として。連続分布の場合、合計は積分になります。
また、この記事では、個のテストデータを使用してモデルの困惑度を推定する方法も示しています。
書くこともできます
または他のさまざまな方法で、これにより「対数平均逆確率」がどこから来るかをさらに明確にする必要があります。
私はこれがかなり直感的だとわかりました:
あなたが評価しているデータの、あなたが評価しているものの難しさは、ある種の「このことはx面のダイがそうであるのと同じくらい頻繁に正しい」ことを告げます。
http://planspace.org/2013/09/23/perplexity-what-it-is-and-what-yours-is/
私もこれを疑問に思いました。最初の説明は悪くはありませんが、価値のあるものについての2つのnatがあります。
まず第一に、困惑は、あなたがどれだけ正しいことを推測するかを特徴付けることとは何の関係もありません。確率的シーケンスの複雑さを特徴付けることと関係があります。
量、
最初にログとべき乗をキャンセルしましょう。
エントロピーを定義するために使用するベースでは、複雑さが不変であることを指摘する価値があると思います。そのため、この意味で、測定値としてのエントロピーよりも、パープレキシティは無限にユニーク/ arbitrary意的ではありません。
これを少し試してみましょう。コインを見ているだけだとしましょう。コインが公正な場合、エントロピーは最大になり、困惑は最大
面のサイコロを見るとどうなりますか?困惑は
したがって、パープレキシティは、フェアダイスの側面の数を表し、ロールされると、指定された確率分布と同じエントロピーを持つシーケンスを生成します。
したがって、サイコロの片側を転がす可能性がますます低くなると、混乱が最終的にはその側が存在しないように見えます。