ランダムな人口サンプルが調査されました。彼らは菜食を食べるか尋ねられました。「はい」と答えた場合、菜食主義者の食事を中断することなくどのくらいの期間食べているかを指定するように求められました。このデータを使用して、菜食主義の平均遵守期間を計算します。言い換えれば、誰かが菜食主義者になったとき、私は平均して彼らが菜食主義者のままでいることを長く知りたいと思います。それを仮定しましょう:
- すべての回答者が正確かつ正確に回答した
- 世界は安定しています:菜食主義の人気は変わらず、アドヒアランスの平均期間も変わりません。
これまでの私の推論
毎年の初めに2人がベジタリアンになる世界のおもちゃモデルを分析すると役立つことがわかりました。毎回、1人は1年間ベジタリアンを続け、もう1人は3年間滞在します。明らかに、この世界のアドヒアランスの平均期間は(1 + 3)/ 2 = 2年です。以下に例を示します。各長方形は、菜食主義の期間を表します。
4年目の半ばに調査を行ったとしましょう(赤線)。次のデータを取得します。
調査を3年目以降の任意の年に受けた場合、同じデータが得られます。得られた回答の平均をとると、次のようになります。
(2 * 0.5 + 1.5 + 2.5)/ 4 = 1.25
誰もが調査直後に菜食主義者でなくなったと仮定しているため、過小評価していますが、これは明らかに間違っています。これらの参加者がベジタリアンのままでいる実際の平均時間に近い推定値を取得するために、平均して、菜食主義の期間の約半分の時間を報告し、報告された期間に2を掛けると仮定できます。 (私が分析しているような)人口から、これは現実的な仮定だと思います。少なくとも、正しい期待値が得られます。ただし、2倍にすることが唯一の場合、平均2.5になりますが、これは過大評価です。これは、菜食主義者が長くいるほど、現在の菜食主義者のサンプルに含まれる可能性が高くなるためです。
誰かが現在の菜食主義者のサンプルに含まれている確率は、菜食主義の長さに比例すると思いました。この偏りを説明するために、私は現在のベジタリアンの数を彼らの予測されたアドヒアランスの長さで割ろうとしました:
ただし、これにより不正確な平均も得られます。
(2 * 1 +⅓* 3 +⅕* 5)/(2 +⅓+⅕)= 4 / 2.533333 = 1.579年
菜食主義者の数を正しいアドヒアランスの長さで割った場合、正しい推定値が得られます。
(1 +⅓*(1 + 3 + 5))/(1 +⅓* 3)= 2年
しかし、アドヒアランスの予測された長さを使用し、それが実際に私が持っているすべてである場合、それは機能しません。他に何を試すべきかわかりません。私はサバイバル分析について少し読みましたが、この場合にどのようにそれを適用するのかわかりません。理想的には、90%の信頼区間も計算できるようにしたいと思います。どんなヒントでも大歓迎です。
編集:上記の質問に答えがない可能性があります。しかし、別の研究では、人々が菜食主義者であるかどうか、過去に菜食主義者であった回数を無作為に抽出しました。私はまた、両方の研究と他のいくつかのことで皆の年齢を知っています。たぶん、この情報を現在の菜食主義者の調査と一緒に使用して、どういうわけか平均値を得ることができます。現実には、私が話した研究はパズルのほんの一部に過ぎませんが、非常に重要なものであり、それをもっと活用したいと思います。