観客が本当に統計的な背景を持っていないなら、私は説明をもっと単純化しようとするだろうと思う。まず、次のように、ボード上に線で座標平面を描画します。
あなたの講演の誰もが簡単な直線y = m x + bの方程式に精通しているでしょう。それは小学校で学ばれることだからです。だから、私は図面と一緒にそれを表示します。ただし、次のように逆方向に記述します。 y=mx+b
mx+b=y
この方程式は単純な線形回帰の例だと思います。次に、このイメージに示すようなデータポイントの散布図にこのような方程式をどのように当てはめることができるかを説明します。
ここで、私たちは研究している生物の年齢を使用してそれがどれくらい大きいかを予測し、得られた線形回帰方程式(画像に表示)を使用して生物の大きさを予測できると言います私たちはその年齢を知っている場合です。
mx+b=y responseます。
それから、これは単純な線形回帰方程式の例であり、実際にはもっと複雑な種類があることをもう一度説明します。たとえば、ロジスティック回帰と呼ばれる多様体では、yには1または0のみを使用できます。誰かが病気にかかっているかどうかなど、「はい」または「いいえ」の答えを予測しようとしている場合、このタイプのモデルを使用することができます。別の特別な種類は、と呼ばれるものです、ポアソン回帰、「カウント」または「イベント」データの分析に使用されます(本当に必要な場合を除き、これ以上掘り下げることはしません)。
次に、線形回帰、ロジスティック回帰、およびポアソン回帰はすべて、より一般的な方法(「一般化線形モデル」と呼ばれる)の特別な例であると説明します。「一般化線形モデル」の素晴らしい点は、任意の値を取ることができる「応答」データを使用できることです(線形回帰における生物の大きさなど)、1または0のみを取ることができます(誰かが持っているかどうかなどロジスティック回帰の疾患)、または離散カウント(ポアソン回帰のイベント数など)を取得します。
これらのタイプの方程式では、統計学者が「リンク関数」と呼ぶものを介して、x(予測子)がy(応答)に接続されていると言えます。これらの「リンク関数」は、xが直線的にyに関連していない場合に使用します。
とにかく、それらはこの問題に関する私の2セントです!私の提案した説明は少し控えめで馬鹿げているように聞こえるかもしれませんが、この演習の目的が「要旨」を聴衆に伝えることだけであれば、おそらくこのような説明はそれほど悪くないでしょう。コンセプトを直観的に説明し、「ランダムなコンポーネント」、「システマティックなコンポーネント」、「リンク機能」、「決定論的」、「ロジット機能」などの単語を避けることは重要だと思います。典型的な生物学者や医師のように、本当に統計的な背景を持っていない人々と話をするとき、彼らの目はそれらの言葉を聞くのをただ見つめるだけです。彼らは確率分布が何であるかを知らず、リンク関数を聞いたことがなく、「ロジット」が何であるかを知らない
統計以外のユーザーへの説明では、どのようなモデルをいつ使用するかにも焦点を当てます。方程式の左側に含めることができる予測子の数について話をするかもしれません(サンプルサイズを10で割っただけのような経験則を聞いたことがあります)。また、データ付きのスプレッドシートの例を含めて、統計ソフトウェアパッケージを使用してモデルを生成する方法を視聴者に説明することもよいでしょう。次に、そのモデルの出力を段階的に確認し、すべての異なる文字と数字の意味を説明しようとします。生物学者はこのようなことについて無知であり、実際にSPSSのGUIの背後にある数学の理解を得るよりも、どのテストをいつ使用するかを学ぶことに興味があります。
特に誰かがエラーを指摘したり、それを説明するより良い方法を考えている場合、私の提案された説明に関するコメントや提案をいただければ幸いです!