ベイジアン:「こんにちは、機械学習者!」
フリークエンティスト:「こんにちは、機械学習者!」
機械学習:「皆さんは物事が得意だと聞きました。ここにいくつかのデータがあります。」
F:「はい、モデルを書き留めてからMLEを計算しましょう。」
B:!。「ねえ、F、それはあなたが昨日私に言ったことはありません、私はいくつかの単変量のデータを持っていたと私は分散を推定したかった、と私はMLEを計算し、あなたが私に急襲とする私に言ったことで割るの代わりに、によってnn − 1n。」
F:「ああ、そうです、思い出させてくれてありがとう。私はよくすべてにMLEを使うことになっていると思いますが、偏りのない推定器などに興味があります。」
ML:「ええ、この哲学は何ですか?それは私を助けますか?」
F:「OK、エスティメータはブラックボックスです。データを入力すると、いくつかの数値が出力されます。私たちは、ボックスがどのように構築されたか、どの原則が設計に使用されたかについては気にしません。ルールの導出方法がわかりません。」÷ (n − 1 )
ML:「それで、あなたは何に関心がありますか?」
F:「評価」。
ML:「その音が好きです。」
F:「ブラックボックスはブラックボックスである誰かが特定の推定量がため不偏推定量であると主張した場合。、そして私たちは、多くの値を試すそれらを押し出します、いくつかの仮定のモデルに基づいて、それぞれから多くのサンプルを生成し、順番にします推定、および平均見つける推定。私たちは、予想される推定値はすべての値のために、真の値と等しいことを証明することができるなら、我々はそれが公平だと言います。」θ θθθθ
ML:「素晴らしいですね!頻繁に使用する人は実用的な人のようですね。あなたはそれぞれのブラックボックスをその結果で判断します。評価が重要です。」
F:「確かに、皆さんも同様のアプローチを取っていることを理解しています。相互検証、または何か?しかし、それは私にとって厄介に聞こえます。」
ML:「乱雑?」
F:「実際のデータで推定量をテストするという考えは私にとって危険です。使用する経験的なデータにはさまざまな問題があり、評価のために合意したモデルに従って動作しない可能性があります。」
ML:「なに?いくつかの結果を証明したと言ったと思いますか?あなたの推定量はすべてのに対して常に偏りがないということです。」θ
F:「はい。評価で使用した1つのデータセット(トレインデータとテストデータを含むデータセット)でメソッドが機能したかもしれませんが、私の方法が常に機能することを証明できます。」
ML:「すべてのデータセットについて?」
F:「いいえ」
ML:「それで、私のメソッドは1つのデータセットで相互検証されました。実際のデータセットでテストしていませんか?」
F:「そうです。」
ML:「それで私はリードになります。私の方法はあなたよりも優れています。90%の確率で癌を予測します。あなたの「証明」は、データセット全体が想定したモデルに従って動作する場合にのみ有効です」
F:「ええ、ええ、そうですね」
ML:「そして、その間隔は95%のカバレッジを持っています。しかし、20%の時間の正しい値しか含まれていなくても驚かないでしょうか?」θ
F:「そうです。データが本当にiid Normal(または何でも)でない限り、私の証明は無意味です。」
ML:「私の評価はより信頼性が高く包括的なものですか。これまで試したデータセットでのみ機能しますが、少なくとも実際のデータセット、いぼなどです。あなたはもっと保守的だと主張しようとしました。 「徹底的」であり、モデルのチェックなどに興味がありました
B:(あいさつ)「やあ、中断してごめんなさい。他のいくつかの問題を示して、物事に介入してバランスを取りたいのですが、頻繁に同僚のぞくぞくするのを見るのが大好きです。」
F:「うわー!」
ML:「わかりました。評価がすべてでした。評価者はブラックボックスです。データが入り、データが出ます。評価中の評価方法に基づいて評価者を承認または不承認にします。使用されている「レシピ」または「設計原則」について。」
F:「はい。しかし、どの評価が重要であるかについては非常に異なる考えがあります。MLは実際のデータのトレーニングとテストを行います。一方、より一般的な評価を行います(広く適用可能な証明を含むため)また、より制限されています(評価を設計するときに使用するモデリングの仮定からデータセットが実際に引き出されているかどうかはわかりません)。」
ML:「どの評価を使用しますか、B?」
F:(あいさつ)「ねえ。笑わせないで。何も評価しない。彼は自分の主観的な信念を使って走り回る。または何か。」
B:「これは一般的な解釈です。しかし、好ましい評価によってベイジアン主義を定義することも可能です。それから、私たちはブラックボックスの内容を気にせず、異なる評価方法にのみ気を配るという考えを使用できます。」
Bの続き:「古典的な例:医学的検査。血液検査の結果は陽性または陰性のいずれかです。頻繁な専門家は、健康な人のどの割合が陰性の結果を得るかに興味があります。頻繁に使用することで、検討中の各血液検査法についてこれらを計算し、最高のスコアを獲得した検査を使用することを推奨します。」
F:「その通りです。他に何が欲しいですか?」
B:「陽性の検査結果が得られた人はどうですか?彼らは「陽性の結果が得られた人のうち、何人が病気になりますか?」そして「負の結果を得るもののうち、健康なものは何人ですか?」」
ML:「はい、それは質問するのにより良いペアのようです。」
F:「HERESY!」
B:「ここにまた行きます。彼はこれがどこに行くのが好きではありません。」
ML:「これは「先祖」についてですよね?」
F:「悪」。
B:「とにかく、あなたは正しいMLです。病気であるポジティブな結果の人々の割合を計算するには、2つのことのいずれかを行う必要があります。1つのオプションは、多くの人々でテストを実行し、例えば、これらの人々のうち何人が病気で亡くなっていますか。」
ML:「それは私がやっているように聞こえます。訓練とテストを使用してください。」
B:「しかし、あなたが人口の病気の割合について仮定することをいとわないならば、これらの数を前もって計算することができます。頻繁な専門家は事前に計算を行います。
F:「さらに根拠のない仮定」
B:「ああ、黙れ。先にあなたが発見された。MLは、あなたが誰とでも同じように根拠のない仮定を好むことを発見した。なぜ私の以前の仮定がそんなに違うのですか?あなたは私をクレイジーと呼びますが、あなたの仮定は保守的で堅実な仮定のない分析の仕事であるふりをします。」
B(続く):。。。「とにかく、ML、私が言っていたようBayesians評価の異なる種類のように私たちは、観測データのコンディショニングに興味があり、それに応じて私たちの推定の精度を計算我々は、この実行することはできません評価を使用せずしかし、興味深いのは、この評価形式を決定し、事前評価を選択すると、適切な推定量を作成するための自動「レシピ」が得られることです。複雑なモデルの偏りのない推定器であるため、適切な推定器を作成する自動化された方法はありません。」
ML:「あなたもそうですか。推定器を自動的に構築できますか?」
B:「はい。バイアスは推定量を評価するのに悪い方法だと思うので、偏りのない推定量を自動的に作成する方法はありません。事前と尤度を接続して、推定量を与えることができます。」
ML:「とにかく、要約しましょう。私たちは皆、メソッドを評価するためのさまざまな方法を持っています。どのメソッドが最適かについては決して同意しないでしょう。」
B:「まあ、それは公平ではありません。それらを混ぜて一致させることができます。ラベル付きトレーニングデータがあれば、テストする必要があります。一般的に、できるだけ多くの仮定をテストします。 「データ生成の推定モデルの下でパフォーマンスを予測し、証明も楽しいかもしれません。」
F:「ええ。評価について実際に考えましょう。実際、無限サンプルのプロパティに夢中になるのをやめます。科学者に無限のサンプルを提供するように頼んでいますが、まだやっていません。有限のサンプルに再び集中する時間です。」
ML:「それで、最後の質問が1つだけあります。メソッドを評価する方法について多くの議論をしましたが、どのようにメソッドを作成するのでしょうか。」
B:「ああ。以前に取得したように、ベイジアンはより強力な一般的な方法を持っています。複雑かもしれませんが、後部からサンプリングする何らかの種類のアルゴリズム(MCMCの単純な形式)をいつでも作成できます。 」
F(interjects):「しかし、バイアスがあるかもしれません。」
B:「あなたの方法かもしれません。MLEにはしばしば偏りがあることを思い出してください。時々、偏りのない推定量を見つけるのが非常に難しい場合があります。分散は負です。そして、あなたはそれを偏りのないものと呼びます。
ML:「OK、皆さん。再び不平を言っています。Fに質問させてください。同じ問題に取り組んだときに、メソッドのバイアスをBのメソッドのバイアスと比較したことがありますか?」
F:「はい。実際、私はそれを認めたくありませんが、Bのアプローチは時々私の推定者よりも低いバイアスとMSEを持っています!」
ML:「ここでの教訓は、評価については少し意見が異なりますが、希望する特性を持つ推定器を作成する方法を独占している人はいないということです。」
B:「はい、お互いの仕事をもう少し読む必要があります。お互いに刺激者にインスピレーションを与えることができます。他の見積もり者は、私たち自身の問題に対して、すぐに使えることがわかります。」
F:「そして、偏見に執着するのをやめるべきです。偏りのない評価者はばかげた分散を持っているかもしれません。私たちは哲学の後ろに隠れることはできません。できる限りの評価を試してみてください。そして、私はベイジアン文学をこっそり見て、推定者のための新しいアイデアを得ます!」
B:「実際、多くの人は自分の哲学が何であるかを本当に知りません。自分自身も確信が持てません。ベイジアンのレシピを使って、素敵な理論的結果を証明しても、それは私を意味しません。常習者ですか?常習者はパフォーマンスに関する上記の証明を気にしますが、レシピは気にしません。代わりに(または同様に)トレーニングとテストを行うと、それは機械学習者という意味ですか? 」
ML:「私たちは皆かなり似ているようです。」