なぜベイジアン統計が統計的プロセス制御でより一般的ではないのですか?


18

ベイジアン対頻繁な議論の私の理解は、その頻繁な統計です:

  • 客観的である(または主張する)
  • または少なくとも公平
  • 異なる仮定を使用する異なる研究者は、依然として定量的に比較可能な結果を​​得ることができます

一方、ベイジアン統計

  • 事前知識を使用できるため(他の理由の中でも)、「より良い」予測(つまり、予想損失の低減)を行うと主張する
  • 必要な「アドホック」選択が少なくなり、(少なくとも原則として)現実世界で解釈される事前/モデル選択に置き換えられます。

それを考えると、ベイジアン統計はSPCで非常に人気があると予想していました。プロセスの品質を管理しようとする工場の所有者であれば、主に予想される損失を気にします。競合他社よりも多くの/より良い事前知識を持っているので、それを減らすことができれば、さらに良いです。

しかし、SPCについて私が読んだ事実上すべてがしっかりと頻繁に行われているようです(つまり、事前分布なし、すべてのパラメーターのポイント推定、サンプルサイズ、p値などのアドホックな選択)

何故ですか?SPCがペンと紙を使用して行われた1960年代に、頻度統計がより良い選択であった理由がわかります。しかし、それ以来、なぜ誰もが異なる方法を試しなかったのでしょうか?


2
私は、ベイジアン統計を私のデジタルSLPカメラと見なし、頻繁にiPhoneカメラと見なします。いつか両方を購入しましたが、写真の5%未満のDSLRを使用し、電話を95%休ませています。それは簡単で、便利で、ポケットに入れられており、品質に応じて多くの時間が提供されるためです(私のDSLRスキル​​に基づく)。事前に干し草にチェーンを組み込むように、開口部の開口時間、長さ、その他のパラメーターの最適なバランスを見つける必要があります。人気のiPhoneの終わり。
ラムシャルマ14年

@RamSharmaを回答として投稿してください!私はシェフのナイフよりも好きです。
シャドウトーカー14年

回答:


18

警告私はこの答えをずっと前に書いたが、私が何について話していたかはほとんどわからなかった。受け入れられたため、削除できませんが、ほとんどのコンテンツの後ろに立つことはできません。


これは非常に長い回答であり、何らかの形で役立つことを願っています。SPCは私の領域ではありませんが、これらのコメントはここに当てはまるほど一般的であると思います。

私は、最もよく引用される優位性- 事前の信念を組み込む能力 -は、弱い優位性の適用/経験的分野であると主張します。それは、事前を定量化する必要があるためです。「レベルzは間違いなく信じられない」と言えても、zの下で何が起こるべきかを私に伝えることはできません。著者が生データの大量公開を開始しない限り、事前の推測としては、前の作業から取得した条件付きの瞬間であり、直面している条件と同様の条件下で適合した場合と適合しなかった場合があります。

基本的に、(少なくとも概念レベルでの)ベイジアン手法は、強力な仮定/アイデア/モデルがあり、それをデータに取り込みたい場合に優れています。ただし、多くの場合、ビジネスプロセスの特定の1つのモデルについて正しいかどうかを確認することはできません。おそらくないモデル、およびあなたのプロセスが何をしようとしているのかを見ようとしています。結論をプッシュしたくない、データが結論をプッシュしたい。十分なデータがある場合、それはとにかく起こりますが、その場合はなぜ以前に気にしますか?おそらくそれは過度に懐疑的でリスク回避的ですが、楽観的なビジネスマンが成功したことは聞いたことがありません。自分の信念についての不確実性を定量化する方法はありません。間違ったことに自信過剰になる危険を冒したくないでしょう。したがって、情報価値のない事前設定を行うと、利点がなくなります。

SPCの場合、これは興味深いことです。たとえば、デジタルマーケティングの場合とは異なり、ビジネスプロセス予測不可能な流動状態ではないためです。私の印象では、ビジネスプロセスは意図的かつ漸進的に変化する傾向があります。つまり、良い安全な事前条件を構築するのに長い時間がかかります。ただし、事前確率はすべて不確実性の伝播に関するものであることを思い出してください。主観性は別として、ベイジアン主義には、深くネストされたデータ生成プロセス全体に不確実性を客観的に伝播するという利点があります。それは、私にとって、ベイジアン統計が本当に良いことです。また、20分の1の「重要な」カットオフをはるかに超えてプロセスの信頼性を探している場合は、できるだけ多くの不確実性を考慮する必要があるようです。

では、ベイジアンモデルはどこにありますか?まず、実装難しい。率直に言って、15分で機械エンジニアにOLSを教えて、別の5でMatlabで回帰とt検定を行うようにさせることができます。そして、私の会社の誰かが知っている言語の既製のライブラリがあるかどうかを確認します。そうでない場合は、BUGSまたはStanを使用する必要があります。そして、基本的な答えを得るためにもシミュレーションを実行する必要があり、8コアのi7マシンでは約15分かかります。ラピッドプロトタイピングにはこれで終わりです。第二に、答えが得られるまでに、コーディングと待機に2時間を費やしましたが、クラスター化された標準エラーによる頻繁なランダム効果の場合と同じ結果が得られました。たぶんこれはすべて予想外で間違っているので、SPCをまったく理解していません。

私は、ベイジアン主義を非常に高品質のシェフナイフ、ストックポット、ソテーパンに例えています。頻繁には、バナナスライサーや簡単に水抜きできるように蓋に穴が開いているパスタポットなど、テレビで見たままのツールでいっぱいのキッチンのようなものです。あなたがキッチンで多くの経験を積んだ料理人であり、実際に、清潔で整頓され、すべてがどこにあるかを知っている実質的な知識のあなた自身のキッチンで、あなたがあなたの小さな選択で素晴らしいことをすることができますエレガントで高品質のツール。または、さまざまな小さなアドホック*ツールを使用して、使用するスキルがゼロで、シンプルで、本当に悪くない食事を作り、ポイントを伝えるいくつかの基本的なフレーバーがあります。データマイニングから帰ってきたばかりで、結果に飢えています。あなたはどの料理人ですか?

* Bayesはアドホックと同じですが、透過的ではありません。coq au vinにはどのくらいのワインが入りますか?あなたはプロだから見当がつかない。または、ピノ・グリージョとピノ・ノワールの違いを見分けることはできませんが、Epicuriousの最初のレシピでは、赤いカップを2杯使用すると言われています。どちらが「アドホック」ですか?


1
+1、素晴らしい答え。好奇心が強い:小さい/適応的なサンプルサイズに関する段落を追加できますか?SPCでは、3〜5のサンプルサイズが一般的なようです。また、SPCソフトウェアが2サンプル後に技術者に3サンプルが本当に必要かどうかを伝えることができれば、それはすばらしい機能です。ベイジアンモデルの場合、これはほとんど簡単です。測定、偽陽性、および陰性のコストを定義してから、別の測定と停止の予想コストを推定します。頻繁な統計では、奇妙な停止ルールの影響に対処する必要があります(15分でそれらをMEに教えることができますか?)
ニキエ14年

1
サンプルサイズについては、問題です。サンプルがそれほど小さいことがわかっていれば、これについて言及していましたが、観測値がほとんどない場合、推定値は事前の選択に非常に敏感になります。あなたは石から血を得ることができないので、それはトレードオフです:あなたは頻繁に推定者でひどく過剰適合しますが、ほとんど仮定せずにそれを行うか、十分に漠然とした前にあなた自身の知識(またはその欠如)を組み込みます基本的に、目の前にあるデータと頭にある「データ」の両方に適合します。頭の中で前に制服を着ることができます。
シャドウトーカー14年

1
基本的に、ベイズは、最初に脳を使用するために、アナリストにより多くの負担をかけます。私は個人的に、事前設定の考え方を嫌うということは、a)が遅すぎる、またはb)統計がどのように機能するのかを実際に理解していないことを示す兆候だと思います(1を知るには1が必要です)。私は答えで事前確率を定量化するのは難しいと言った。実際のところ、私はそれに同意しません。常にできることの1つは、ページにベルカーブを描いて、「自分のデータがそのように見えることを期待しますか?」と自問することです。そうでない場合は、曲線の調整を開始します。そして、モードをどこに固定するかを決定できない場合は、ハイパープライアを使用します。
シャドウトーカー14年

2
1つの質問(かっこいいつもりはない):事前の信念を(定量的に)求めることに関する文献があることを知っていますよね?公開された信念、インタビューされた専門家と非専門家の信念、および自己信念を含む。私が尋ねる理由は、私が以前にこの苦情を聞いたことがあるが、そのような苦情の著者は、彼らの異議は調査の始まりではなく、議論の終わりだと思ったからです。
アレクシス14年

1
@CliffAB興味深い...私はその文学を深く読みませんでした(ベルナルド、カース、ガースウェイト...数十年前から)...しかし、それはあなたにとって価値のある科学です。;)
アレクシス

5

私の謙虚な意見では、ベイジアン統計には、その広範な使用と競合するいくつかの欠点があります(SPCでも他の研究分野でも):

  1. 頻度の高いカウンターパートと比較して推定値を取得するのは困難です(統計のクラスの最も広い部分は頻度の高いアプローチを採用しています。ところで、これがベイジアン統計の限られた人気の原因または結果であるかどうかを調べることは興味深いでしょう)。

  2. 多くの場合、ベイジアン統計は、クリックして表示するだけでなく、同じ問題に対処するさまざまな方法(たとえば、どちらが最適か)を選択します(とにかく、このアプローチは頻度主義のフレームワークでも推奨されるべきではありません)。

  3. ベイジアン統計には、経験の少ない統計学者では管理が難しいトピックがいくつかあります(たとえば、不適切な事前分布)。

  4. それは必要と感度分析(通常frequentist枠組みの下で回避)、および、そのようなデータ分析を欠落しているなど、いくつかのトピックのために作られた例外を、。

  5. 計算に使用できるソフトウェアは1つだけ(賞賛に値する、無料でダウンロード可能)です。

  6. それはより多くの時間がかかります frequentistのツールと比べてベイズと自律的研究者であることを。


6
良い答えですが、ポイント5には同意しません:ベイジアン分析用のさまざまな(無料の)ソフトウェアを考えることができます:WinBUGS、OpenBUGS、JAGS、Stan、PyMC ...そして、もっとあると確信しています。私が言うことは、これらのソフトウェアはすべて急勾配の学習曲線を持ち、かなりの量のプログラミングと統計的知識を必要とするということです。
COOLSerdash 14年

COOLSerdashは正しいです。説明とコメントの両方を歓迎します。ベイジアン分析ソフトウェアをリストする際の包括性の欠如は、おそらくWinBugsのみに(ゆるく)慣れていることに起因しています。
カルロラザロ14年

@CarloLazzaro#5についてのCOOLSerdashの論点にも同意します。バージョン14の時点で、Statataはプライベートライセンスでありながら主流の統計パッケージであり、バニラパッケージにベイジアンモデルと推定を組み込んでいます。ベイジアン計算の可用性は成長するだけだと思います。しかし、あなたの他のポイントは重要であり、ベイジアン支持者のための議題を知らせるのに役立つはずです。
アレクシス

@Alexis:Stataユーザーであることは、ベイジアンの最近のフレーバーに満足しています。より一般的な考えとして、私は大学の統計学の授業中に頻繁なアプローチとベイジアンのアプローチの両方を学習することを保証します(おそらく、可能性が高い人たちはぶつぶつを始めます!!)。
カルロラザロ

3

理由の1つは、ベイジアン統計が1990年頃までメインストリームから凍結されたためです。興味深い問題のほとんどが手に負えないことは助けにはなりませんでした。その結果、今日統計を教えている(そして雑誌の記事をレビューし、カリキュラムを設計している)ほぼ全員が、フリークエンシーとして訓練されています。物事は1990年頃にマルコフ連鎖モンテカルロ法(MCMC)の普及により変化し始めました。この方法はSASやStataのようなパッケージに徐々に取り入れられています。個人的には、特殊なアプリケーション(SPC)ではあまり利点がないかもしれませんが、10年後にはもっと一般的になると思います。

ベイキング分析をより広く利用可能にしているグループの1つは、STANパッケージ(mc-stan.org)を開発しているグループです。


当サイトへようこそ!それは「STATA」ではなく「Stata」であることに注意してください-自分で大文字にしたとき、私はStataユーザーの間違った端にいます!(SAS、SPSSなどに似ていると思いましたが、明らかにそうではありません...)
Silverfish
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.