DoEについてのFisherの引用の実例


13

私のチームと私は、会社の非統計学者に実験計画の有用性についてプレゼンテーションをしたいと思います。これらの非統計学者もクライアントであり、通常、データを収集する前に相談することはありません。フィッシャーの有名な引用をよく説明する実際の例を知っていますか?「実験が終わった後に統計学者を呼ぶことは、死後検査を行うよう彼に頼むことだけであるかもしれません。の。" ?できれば、産業/製薬/生物学の文脈でイラストを探しています。予備的に適切に設計されていれば成功したかもしれない決定的でない統計分析の例を考えますが、他の可能な例もあるかもしれません。



ありがとう。私のチームの前のボスはおそらくこの本を持っています。
ステファンローラン

@onestop私は本を手にしています。あなたが話している章は何ですか?私は本の第2版を持っていますが、p47には何もありません。
ステファンローラン

うーん、私は上記のGoogleブックスリンクの第4版を見ていました。第3章「データの収集」に「実験設計」というタイトルのセクションがあります。
ワンストップ

回答:


12

実験者が被験者の効果間でテストしたいデザインに遭遇しましたが、被験者の効果内でのデザインの方が適していました。

たとえば、1つの実験は8匹のラットで構成され、4匹は食事療法A、4匹は食事療法Bで、ラットの体重は4週間毎日測定されました。彼らが各食事の時間効果に興味があるなら、これは問題ありませんでしたが、目標は食事の違いを調査することでした。

彼らは、各ラットを28回測定することで多くのデータがあると考えましたが、食事効果の実験単位はラットで、各治療で4匹しかありませんでした。彼らはラットを1日に10回測定することもできたはずですが、違いはありませんでした。


5
(+1)私は、より多くのネズミを飼うことの必要性と欲求に関する人間の努力において、医学研究がほぼ単独で行われていると思う。
枢機

1
ランケナウで多くの実験室実験に参加しますが、サンプルサイズは常に小さく、マウスやラットが関係しています。
マイケルR.チャーニック

実験室の実験をするとき、動物はしばしば犠牲にされます、そして、それは彼らが動物の数をできるだけ少なく保つことを試みる1つの理由であると思います。しかし、そのような状況では、意味のある結論を導き出すのに十分なものを取りたいと思うでしょう。
マイケルR.チャーニック

7

私は、国立セリアック意識財団と呼ばれる組織で仕事をしました。組織は、セリアック病の一般の認識を促進し、グルテンを含む食品への不耐性を含む病気の症状のチェックリストを提供します。彼らは、インターネットに参加したい人にそれを公開するだけで調査を実施しました。長年にわたり、彼らは世論から何千もの回答を集めました。しかし、彼らは調査結果に基づいて一般大衆について結論を導きたいと考えていました。回答者はランダムではなく自己選択されたため、バイアスが発生する可能性があることを伝えなければなりませんでした。バイアスの程度は不明であるため、大量のデータがあるにもかかわらず推論を行うことはできません。

今、回答者は独特のグループのように見えました。多くは非常に深刻であり、彼らまたは親類がこの病気にかかっているかもしれないという懸念を表明するために答えられました。しかし、賢明なやり方で答える人もかなりいました。これは、彼らが答えを提供した偽の名前、見知らぬメールアドレス、郵便アドレスから明らかでした。

データは探索的な意味でのみ有用であり、応答の頻度は、十分に計画された将来の調査でテストできる仮説を立てるのに役立つ可能性があると感じました。しかし、これまでのところ、私のアドバイスは無視されており、インターネット上でこれらの簡単な自己選択調査の別の1つを実行しています。


(+1)良い例。クライアントは非常に特定のサンプルを収集する場合がありますが、母集団全体について結論を出したい場合があります。

この興味深い例に感謝します(ただし、統計学者以外の同僚には適切ではありません)
ステファンローラン

@StéphaneLaurentはい、そうではありませんか?それは医学研究のための貧弱なデザインに関係しています。
マイケルR.チャーニック

はい、マイケルですが、私のクライアントは調査を行いません。
ステファンローラン

@StéphaneLaurentアイデアは、ランダム化の欠如によるバイアスの原則です。これは、実験と調査にほぼ同じ方法で適用されます。
マイケルR.チャーニック

6

しばらく前に、太陽電池アレイの夜間保管位置が、アレイに土壌が蓄積する速度にどのように影響するかについての実験結果を分析するように頼まれました。(これらの大きな集光型太陽光発電アレイは、一日中太陽を追跡しますが、夜間はトラッカーの最小ストレス位置であるため、通常は真上に向けて保管されます。)安くはありません。実験は、およそ120のトラッカーのフィールドで実行されました。西半分は垂直方向に、東半分は水平方向に収納されていました(これは、2つのインバーターへのトラッカー接続と一致します。そうではありません、

残念ながら、南西から砂漠を横切る強い風のパターンがあり、フィールドの西部の南に大きな建物があり、フィールドの西部の大部分を風に吹かれた微粒子から「シェーディング」しています。さらに、トラッカーは、風からある程度「シェーディング」します。その結果、土壌が蓄積するメカニズム(例えば、風に吹かれたり落ち着いたり)は、フィールド全体で相対的な大きさが異なります。これは、配列が場所に応じて異なる速度で土壌を蓄積することを意味します。これは小さな影響ではありません。

分析の最終結果は、本質的に、保管位置が違いを生むことは信じがたいことではありませんでしたが、効果が些細である可能性を排除することも、大きな自信を持って決定することもできませんでしたデータ上)効果の兆候。その後、フォローアップ実験を設計し、両方の保管位置についてフィールド全体の汚れの「応答面」を推定できるようにアレイの位置に基づいて保管位置を割り当て、「沈降」対「風吹き」の汚染率を推定し、もちろん、これらの両方に対する保管角度の影響。この実験は非常に成功し、わずか数か月で垂直収納の利点を明確に把握することができました。


6

同僚から、特定のタイプの気象現象と、通常単純な摩耗に起因するタイプのインフラストラクチャの障害との相関関係を調べる研究で「統計を行う」ように依頼されました。同僚は、気象現象が実際に失敗の原因になっているかどうかを見たかったのです。チームはすでに膨大な量のデータを収集するために多くの時間と労力を費やしており、研究論文はほぼ完成しました。「統計を実行」して結果セクションの最後の部分を記入する人が必要でした。

問題は、問題の気象事象が発生した「興味深い」期間のみがデータセットに含まれることを、彼らが入念に保証していたことでした。つまり、イベント中の失敗率とイベント以外の時間を比較する方法がありませんでした。私は、問題を説明するために繰り返し試みたが、単に持っていたので、彼らは本当に、納得させれなかったので、多くのデータを確実に私はそれの何かを得ることができます。

幸いなことに、天候イベントにはさまざまな重大度がまだあり、重大度と故障率の間には弱い対応関係があったため、少なくともそこから何かを回収しましたが、結果は、彼らがどのように考えればもっと決定的だったかもしれませんデータ収集演習に着手する前に「統計を実行する」。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.