さまざまな対象者に高度な統計を導入するための戦略


26

私は主に医学、社会科学、教育などの分野の非統計学者と仕事をしています。

大学院生と相談したり、研究者の記事を手伝ったり、雑誌の記事をレビューしたりするときは、誰か(クライアント、著者、論文委員会、ジャーナル編集者)が比較的よく知られているテクニックを使用したいという問題がよくあります。不適切か、より良いがあまり知られていない方法が存在する場合。多くの場合、別の手法について説明しますが、「誰もが別の方法で行う」と言われます。

他の人がこの種の困難にどのように対処するかに興味があります。

追加

@MichaelChernickはいくつかのストーリーを共有できると提案したので、

現在、私は以前の論文を複製し、それが役立つかどうかを確認するために1つの独立変数を追加している1人の人物と協力しています。前の論文は、率直に言ってひどいものです。依存データを独立したものとして扱います。それはとてつもなく過剰であり、他の問題もあります。しかし、彼(私のクライアント)は、論文として以前のバージョンを提出し、学位を取得しただけでなく、研究で広く称賛されました。

多くの場合、変数を二分しないように人々を説得しようとしました。これは医学で非常に頻繁に起こります。私は辛抱強く、出生時体重を低および正常(通常2,500 g)に分割することは、2,499 gの赤ちゃんを1,400 gの赤ちゃんのように扱うことを意味することを指摘します。しかし、2,501グラムの赤ちゃんの扱いはまったく異なります。臨床医はこれがばかげていることに同意します。その後、そのように言う。

委員会がクラスター分析を主張した大学院生のクライアントがずっと前にいました。学生は方法を理解せず、方法は有用な質問に答えませんでしたが、委員会はそれを望んでいたので、彼らはそれを得ました。

統計グラフィックスの分野全体は、多くの人にとって「これはおじいちゃんがやった方法」で十分な分野です。

次に、ボタンを押すだけのように見える人がいます。アンケート全体とファクター分析を行ったプレゼンテーション(私が手伝った誰かによるものではありません!)を覚えています。彼女が含めた変数の1つはID番号でした!

おい


6
ピーター、メタはこのサイトに関する質問です。「Community Wiki」ステータスについて考えていたのではないかと思います。これは、客観的に最良の回答が得られそうにない有用な興味深い質問のためのものです(または共同で回答する必要がある可能性が高い)。したがって、私はあなたの提案をCWリクエストとして解釈し、それを実装しました。
whuber

1
二分法についての簡単なメモ:私は実際、これは「少し」の統計を知っている人々からの見当違いの直感だと思います。あなたが話す分野では、多くの分析が意思決定に関連していることを想像します(たとえば、疾患XまたはYの治療を開始すべきですか?)。これは二分法であり、しばしば有用な二分法です。少数の変数しかない場合は、適切な決定分析または仮説検定でこれをまねることができます-「x> 10がオプション1を取る場合、そうでない場合はオプション2を取る」。
確率論的

1
また、コンピューターにアクセスできない場合、二分された変数に基づく分析は非常に簡単に覚えられます。
確率論的

2
心理学では、回帰ではなく分散分析を使用するため、人々はしばしば二分法または量子化を行います。これは私を怒らせます。Vanderbiltの統計wiki biostat.mc.vanderbilt.edu/wiki/Mainのどこかに、二分法による恐ろしいダメージの見事なデモンストレーションがあります。しかし、残念ながら、私はそれを見つけることができないようです。とにかくそこにあると思います。私にチャンスがあったときにEvernotedする必要がありました
クリスビーリー

2
保険業界での限られた経験から、特定の予測モデルが開発されると、それ自体の寿命があり、モデルが作成された後も何年もの間複製され続ける可能性があることがわかりました時代遅れ。一部の人の割合が突然など、新しいモデルは、規制当局に正当化される必要があります、ジャンプアップ可能性があるため例えば、セットの健康保険政策金利という古いモデルを刷新することは大したことである
RobertF

回答:


16

これは難しい質問です!

まず、これがなぜ起こるかについてのいくつかの考え。私は統計を広範に利用している(または少なくともそうすべき)分野で働いていますが、ほとんどの実務家は統計の専門家ではありません。その結果、「Excelのt検定関数にベクトルを入れたところ、この数値が落ちました。したがって、私の論文は統計に裏付けられています」ということがよくわかります。

私がこの出来事を見る主な理由は、統計知識の不足が先頭から始まることです。査読者と論文委員会が統計的手法の最新情報を入手していない場合、「型にはまらない」ものの使用を正当化する必要があります。たとえば、論文では、ボックスプロットではなくバイオリンプロットを使用して分布の形状を表示することを選択しました。このテクニックの使用には、論文の詳細な文書と、委員会のメンバー全員がこの奇妙なプロットが何を意味するのかを知りたいとの私の防衛での長い議論が必要でした。 。ボックスプロットを使用した場合 この場合の情報であり、マルチモーダルであれば、分布の形状について視聴者を簡単に欺くことができます)誰も何も言わなかったでしょうし、私の防衛は簡単だったでしょう。

重要なのは、統計以外の分野では、実務家は難しい選択に直面するということです。正しい方法を読んでから使用することができます。または、フローに沿って進み、論文や論文にゴム印を付けて、間違っているが従来の方法を使い続けることができます。

さて、あなたの質問に答えるために:

正しいアプローチは、正しいテクニックを使用しなかった場合の結果を強調することだと思います。これには以下が含まれます。

  • その分野の誰かが貧弱な推論の結果をどのように経験したかの実世界の例を与える。これは、一部のフィールドでは他のフィールドよりも簡単です。キャリアが損なわれた例は特に良いです。

  • 誤った分析を行うと、結果が現実の世界に転送される可能性が非常に低い状況になる可能性があり、それが害を引き起こす可能性があることを説明する(たとえば、私の分野では、AIシステムのプロトタイプが競合よりも統計的に優れているが、実際には同様に、次の6か月を完全な実装の構築に費やすことは非常に悪い考えです。

  • ユーザーの時間を大幅に節約するテクニックを選択してください。十分な時間があるので、貯蓄したものを費やして技術を上層部に説明できます。


1
良い議論と良い答え+1。
マイケルR.チャーニック


1
結果を指摘するための+1。人々をより良い方法に切り替えさせるのは驚くべきことです。
レオ

9

わずかな統計的精巧さを備えた心理学者の観点から言えば、方法を紹介するときは、ツールも紹介します。私の分野のほとんどの研究者にすばらしい新しい方法についての長い話を話せば、彼らはパンチラインが「そしてあなたがしなければならないことはあなたの微分計算を磨き、それから2を取る週間トレーニングコース!」(または「2000ドルの統計パッケージを購入!」または「PythonおよびRコードの5000行を適応!」)。既に使用しているstatsパッケージ、またはわかりやすいGUIを備えたフリーソフトウェアで利用可能なメソッドの実装があり、1、2日でそれに慣れることができる場合、彼らは喜んで与えるかもしれませんそれを試してみてください。

このアプローチは意欲的で非科学的に思えるかもしれませんが、助成金や出版物を心配している人は簡単に陥り、仕事を続けるのに役立つような膨大な量の数学を学ぶことはありません。


2
@octem調査員は、統計学者がコラボレーションのその部分を行うことを信頼できませんでした。調査員がツールを必要とする理由。私は、これをテーブルを逆にする医師に例えました。私がこの手術を行う方法についての簡単なチュートリアルを私に言ったら、彼はどのように感じるでしょうか。私はショックとdsimayを考え、免許なしでmewdicineを練習することは違法です。それはおそらく良いことです。しかし、統計学者は同等の尊敬に値しません。なぜ私は彼にツールを提供し、彼のトレーニング不足でハックすることができると期待するのですか。
マイケルR.チャーニック

2
社会心理学では、統計学者がいるのは普通ではありません(統計学者にお金を払うのに十分な資金があるのは普通ではないからです)。今、私は公衆衛生/健康心理学にいます。通常、大規模な助成金には統計学者の給与が含まれますが、PIの給与さえも賄えない、けちな小さなパイロット助成金の多くの作業が行われます。それが私がやってきた視点です...あなたがほとんどのプロジェクトが訓練された統計学者を含む分野にいるなら、私は同意します、この種の抵抗は合理的ではないでしょう。
octern

1
@octem回答ありがとうございます。アナロジーをフォローアップするだけです。米国では中絶が違法であり、一部の女性は他の国に行ったり、不妊治療や大きな健康上のリスクなしに違法に奥の部屋で行われたりしていました。それは大きな類推のように見えないかもしれませんが、統計学者が劣った仕事をすることを正当化する余裕がないのですか?医学は生死にかかわるものですが、悪い科学も悪い結果をもたらすことを知っています。安全でない薬物は使用されるべきではないときに使用されるため、データの誤用は悪い薬の実践につながる可能性があります。
マイケルR.チャーニック

@MichaelChernick見て、私も社会科学の統計分析の状態に満足していない。しかし、問題は研究者に新しい統計的アプローチを採用させる方法であり、私はそれが好きかどうかにかかわらず、研究者の大部分の集団に適切な答えを与えています。
-octern

1
@octem十分に公平で、私はそれを理解したと思います。質問する前に、賛成票を渡しました。安価な方法が進むべき道であると考える調査員の態度は、私が質問していることであり、問​​題が存在することを認識しているという事実ではありません。それはそうであり、私はあなたに同意します。しかし、どういうわけか長い目で見れば、私たちの仕事は些細なものではないということをもっと尊重し、認識してもらう必要があると思います。
マイケルR.チャーニック

6

この素敵な質問、ピーターに感謝します。私は医学研究機関で働いており、医学雑誌に研究と出版を行う医師と取引しています。多くの場合、彼らは「統計を完全に正しくする」よりも論文を発表することに興味があります。したがって、私が不慣れな手法を提案するとき、彼らは同様の論文を指し示し、「彼らはこのようにして、結果を公表したように見える」と言うでしょう。

公開された論文が本当に悪く、間違いがあると思う問題があります。私は非常に高い評価を得ていますが、議論することは困難です。一部のドキュメントには大きなエゴがあり、ほとんど何でも学ぶことができると考えています。そのため、彼らは、統計を理解していない場合でも、統計を理解していると思います。イライラすることがあります。テストでウィルコクソンがより適切である場合、ウィルクシャピロテストを実行させ、正規性が拒否された場合は両方の方法を含め、ウィルコクソンが優れている理由を説明します。私は時々彼らを納得させることができ、しばしば彼らは統計について私に依存しているので、一般的なコンサルタントが持っているかもしれないよりももう少し影響力があります。

また、それらに対してカプラン・マイヤー曲線を作成し、ログランクテストを使用しましたが、ウィルコクソンの結果は異なりました。私が決めるのは困難でした。そのような状況では、両方の方法を提示し、なぜ異なるのかを説明するのが最善だと思います。同じことは、生存曲線にペトとグリーンウッドの信頼区間を使用する場合にも当てはまります。Cox比率ハザードの仮定を説明することは難しく、オッズ比と相対リスクを誤って解釈することがよくあります。

簡単な答えはありません。ここには心臓病学のトップ医学研究者であるボスがいて、彼は時々ジャーナルの審判をしました。彼は診断を扱った論文を見て、AUCを尺度として使用していました。彼はAUC曲線を見たことがなく、それが妥当であると思うかどうかを確認するために私のところに来ました。彼には疑問がありました。それは適切であることが判明し、私は彼に私ができる限り最善を尽くしたと説明しました。

私は生物統計学について医師に講義しようとし、公衆衛生学校で生物統計学を教えてきました。私は他の人よりもうまくやって、疫学者を共著者として2002年に健康科学専攻の入門コースの本を作成しました。ワイリーは私に今第2版をしたいと思っています。2011年に私はより簡潔な本を出版しましたが、忙しいMDが時間を割いて再参照して参照できるように、必需品だけを取り上げようとしました。それは私がそれに対処する方法です。たぶんあなたは私たちとあなたの物語を共有することができます。


これらは@Michaelの良い点です。いくつかのストーリーを追加します
Peter Flom-Reinstate Monica

1
@PeterFlom非常によく似た経験があるかもしれません。私はあなたが他の人の答えでいくつかの他の非常に良い反応を得ていると思います。
マイケルR.チャーニック

6

ログバツ; バツ12 


私のキャリアの中で、私は多くの学際的な研究を行っており、薬物乱用の研究者、疫学者、生物学者、犯罪学者、医師とさまざまな時期に密接に協力するようになりました。これは通常、さまざまな理由で通常の「缶詰」アプローチが失敗するデータの分析に関係していました(バイアスサンプリングとクラスター化された、縦方向および/または空間的にインデックス付けされたデータの組み合わせなど)。また、大学院で数年間コンサルティングを行い、さまざまな分野の人々と仕事をしました。だから、私はこれについてよく考えなければなりませんでした。

私の経験では、最も重要なことは、通常の定型化されたアプローチが不適切であり、「良い科学」を行いたいという人の欲求に訴える理由を説明することです。立派な研究者は、不適切な統計分析のために、結論に露骨に誤解を招くようなものを発表することを望みません。「分析が正しいかどうかは気にしない、ただこれを公開したい」という言葉に沿って何かを言う人に出会ったことはありませんが、そのような人々は存在すると確信しています-私の応答は可能な限り専門的な関係を終了します。統計学者として、自分の話していることを実際に知っている人がたまたま論文を読んだ場合、損害を受ける可能性があるのは私の評判です。

私は特定の分析が不適切であることを誰かを説得するために挑戦することができることを認めるが、私は統計学者として我々がすべきことだと思う()「缶詰」アプローチとと間違って行くことができます正確に把握するために必要な知識を持っている(b)の持っていますそれを説明する能力は、合理的に理解できる方法です。あなたが統計学または数学の教授として働いていない限り、あなたの仕事の一部は、統計学者以外の人と仕事をすることです(そして、あなたが統計学/数学の教授である場合でさえ)。

(a)に関して、統計学者がこの知識を持っていない場合、なぜ彼らは缶詰のアプローチを落胆させるのでしょうか?統計学者が「変量効果モデルを使用する」と言っているが、独立性を仮定することが問題である理由を説明できない場合、クライアントと同じようにドグマに屈することになりませんか?統計学者であろうとなかろうと、すべてのレビューアは、統計モデリングのアプローチを批判的に批判することができます。しかし、何がうまくいかないかを正確に知るには専門知識が必要です。

(b)に関して、私は、典型的には何がうまくいかないかをグラフィカルに描写することが、最も「家に帰る」ことを発見しました。例:

  • バツ

  • モデルの提案された「フォーム」(例:線形)が不適切な場合。例えば、のような回帰関数"プラトー" のためのx 0 1 が、Yy=バツバツ01y=1バツ>1pバツy

  • 別の一般的な状況(Peterも言及)は、独立を仮定することが悪い考えである理由を説明しています。たとえば、正の自己相関は通常、より「クラスター化された」データを生成し、その理由で分散が過小評価されることをプロットで示すことができます。または、独立を前提とする近似曲線を使用してデータをプロットし、クラスターが独立データに存在しない方法で適合にどのように影響するか(サンプルサイズを効果的に下げる)を視覚的に確認できます。

他にも数百の例がありますが、ここでは空間/時間の制約を扱っています:)何らかの理由で写真がうまくいかない場合(たとえば、1つのアプローチが不十分な理由を示す)、シミュレーションの例も私が採用したオプションです時々


3

これは複雑な問題であるため、いくつかのランダムな考え...

大きな問題は、さまざまな専門分野や卒業プログラムでの数学教育の欠如であると感じています。

統計の数学的理解がなければ、ケースに応じて適用される数式の束になります。

また、問題を真に理解するために、教授は、オリジナルの著者がアプローチを発表したときに直面していた元の問題について話す必要があります。そのテーマに関する数千冊の本を読むよりも、それから多くを学ぶことができます。

統計は問題を解決するためのツールボックスですが、芸術でもあり、他の芸術と同じ問題に直面しています。楽器を演奏することはミュージシャンにはなりません。

楽器で音を出す方法を学ぶことができます。しかし、できることによって

しかし、リズム、メロディー、ハーモニーという単一の概念を研究していなくても、自分自身をミュージシャンと見ている人を見つけることは珍しくありません。

同じ行で、論文を公開するために、ほとんどの人は式の背後にある概念を知ったり理解したりする必要はありません...今日、科学者は押すべきキーと押すべき時期を知る必要があります。

したがって、これはMDの「自我」とは何の関係もありません。これはサブカルチュラルな問題であり、科学コミュニティの教育、慣習、および価値に関連する問題です。

学問的な要件/ポリシーを満たすために、何千、何千、何千もの役に立たない論文や書籍が発行されている時代に、何を期待できますか?論文の質が論文の質よりも重要である時代に?

主流の科学者は、もはや良い科学を心配していません。彼らは数字の奴隷です。彼らは私たちの時代の管理上のバグの影響を受けています(つまり、感染しています)。

したがって、私の観点から、統計の良いコースには、研究されているアプローチの数学的、歴史的、哲学的な基礎が含まれ、常にいくつかのパスを強調する必要があります単一の問題を解決するために取る。

最後に、もし私が統計学/確率論の教授だったら、私の最初の講義は次のような問題に専念するでしょう。カードをシャッフルする、コインを投げる。それは聴衆を聞くための正しい位置に置くでしょう...おそらく。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.