タグ付けされた質問 「communication」

統計データ、分析、または概念の伝達または説明に関連する

4
公平な推定者が一般の人にどのように説明するのですか?
仮定θがための不偏推定量ですθ。すると当然の、E [ θ | θ ] = θ。θ^θ^\hat{\theta}θθ\thetaE[θ^∣θ]=θE[θ^∣θ]=θ\mathbb{E}[\hat{\theta} \mid \theta] = \theta これを一般人にどのように説明しますか?過去には、私が言ったことは、あなたがの値の束平均場合であるθをサンプルサイズが大きくなるにつれて、あなたはより良い近似値取得θを。θ^θ^\hat{\theta}θθ\theta 私には、これは問題があります。私は私が実際にここに記述していますがあることのこのような現象だと思う漸近的に公平ではなく、単に公平、すなわち、というより、 θが上の可能性が依存しているN。limn→∞E[θ^∣θ]=θ,limn→∞E[θ^∣θ]=θ,\lim_{n \to \infty}\mathbb{E}[\hat{\theta} \mid \theta] = \theta\text{,}θ^θ^\hat{\theta}nnn では、公平な推定者が一般人にどのように説明するのでしょうか?

2
応用学術雑誌記事の統計セクションの良い例
私は応用分野で働いている生物統計学者であり、私が協力している論文の統計手法セクションを作成する責任があります。多くの学術論文を読んでいると、不適切に書かれた統計セクションの多くの例に出くわしました(主にそれらは退屈で、情報がなく、使用される方法論の正確さ、詳細、および理解が不足しています)。 使用される統計手法の主題と高度化に関係なく、応用研究記事のよく書かれた統計セクションの良い例は何ですか? 「よく書かれた」を定義する方法は主観的ですが、明快で、分析が行われた方法の全体像を示し、分析中に行われた仮定に対処する場合、統計セクションも記述します。統計プロセスを紙のフローに組み込んでいます。 ここに私が良い統計セクションを持っていると思う論文のいくつかの例があります: BCGワクチン接種はワクチン接種アナグマとワクチン未接種アナグマの結核感染のリスクを軽減します。 一次経皮的冠動脈インターベンションで治療された急性ST上昇心筋梗塞の死亡率を予測するためのモデル:急性心筋梗塞試験におけるペクセリズマブの評価の結果 その他?「良い」統計セクションに何を含めるべきかについての考えも大歓迎です。

2
ブラックボックス非線形モデルの予測に対するさまざまな入力の重要性をどのように視覚化できますか?
私の組織で行われる予測の助けとして、インタラクティブな予測ツール(Python)を構築しています。今日まで、予測プロセスは主に人間主導で行われており、予測者は自然なニューラルネットワークのデータを同化し、学習した腸の感覚を使用して予測を行います。長期的な予測の検証と予測モデリングの調査から、私はあなたが期待するかもしれないものを見つけました。異なる予測者は異なるバイアスを示し、一部の予測子の効果は誇張されているようであり、他の重要な予測子は無視されているようであり、概して予測パフォーマンスは比較的単純な経験的モデルと比較して平凡です。 予測は引き続き手動で行われますが、私は予測者の相対的な影響のより良い定量化を予測者に提供するための有用なツールを構築しようとしています。見過ごされがちな季節の影響などの重要な影響もあり、ユーザーに強調したいと思います。私は、いくつかの「経験豊富な」予測者(その多くは統計に関する正式な知識がほとんどない)からのモデリングプロセスについてある程度の反発と懐疑論を期待しているため、コミュニケーションは少なくとも同じくらい重要であり、予測精度の測定可能な改善を達成します。 私が開発しているモデルには強力な自動回帰コンポーネントがあり、イベントによって大幅に変更されることがあります。このイベントは、非イベント時に、ゼロに近い一部の予測子で測定値として表示されます。これは、予測者が使用するメンタルモデルと一致しています。重要な部分は、どの「イベント」測定が予測を特定の予測の自己回帰値から遠ざけるのに最も影響を与えるかを実証できることです。この方法でプロセスをイメージします。予測者はその最良の推測値を導き出し、モデルは別の値を提案し、予測者はその理由を尋ねます。モデルは、「ここを参照してください。この予測子のこの値は夏の予測値を増加させます。冬だった場合、それは別の方向に移動します。他にもこれらの測定値があることを知っています。 ここで、モデルが単純な線形回帰であると想像してください。値にモデルの係数を掛けて単純な棒グラフとして表示することにより、イベントベースの予測子の相対的な「効果」を表示することを想像できます。異なる予測子からのすべてのバーは、AR値からの合計偏差になり、これは、この例では、強い影響力を持つものを簡潔かつ明確に示しています。 問題は、予測されているプロセスが予測子に高度な非線形性を表示することです。少なくとも、ブラックボックス非線形機械学習アルゴリズム(ランダムフォレストとGBM)は、GLMの場合よりもはるかに成功しています。このデータセット。理想的には、ユーザーエクスペリエンスを変更せずに「内部」で機能するモデルをシームレスに変更できるようにしたいので、アルゴリズム固有のアプローチを使用せずにさまざまな測定の重要性を簡単な方法で示す一般的な方法が必要です。現在のアプローチでは、1つの予測子を除くすべての値をゼロに設定して効果を準線形化し、予測偏差を記録してからすべての予測子について繰り返し、上記の棒グラフに結果を表示します。強い非線形性が存在する場合、これはうまく機能しない可能性があります。

5
実験データの表現
データの視覚化について私のアドバイザーと議論があります。彼は実験結果を表すとき、値は下の画像に示されているように「マーカー」のみでプロットされるべきであると主張します。曲線は「モデル」のみを表す必要があります 一方、次の2番目の画像に示すように、読みやすくするために、多くの場合、曲線は不要であると思います。 私は間違っているのですか、それとも教授ですか?後者の場合は、彼にこれを説明するためにどうしたらいいですか。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.