時間の経過に伴う変動の推定

2,500人から7,500件の血液検査を含むデータセットがあります。私は、血液検査の変動性が2つの検査間の時間とともに増加するか減少するかを調べようとしています。たとえば、ベースラインテストのために血液を採取し、すぐに2番目のサンプルを採取します。6か月後、別のサンプルを引きます。ベースラインと即時反復テストの違いは、ベースラインと6か月のテストの違いよりも小さいと予想されるかもしれません。

以下のプロットの各ポイントは、2つのテストの違いを反映しています。Xは2つのテスト間の日数です。Yは、2つのテストの差のサイズです。ご覧のとおり、テストはXに沿って均等に分散されていません。実際、この研究はこの質問に対処するように設計されていません。ポイントは平均で非常に重なっているため、28日間のウィンドウに基づいて、95％（青）と99％（赤）の分位線を含めました。これらは明らかにより極端な点に引っ張られていますが、あなたはアイデアを得ます。

代替テキストhttp://a.imageshack.us/img175/6595/diffsbydays.png

変動はかなり安定しているように見えます。どちらかといえば、テストが短期間に繰り返された場合、それは高くなります-それはひどく直観に反しています。どのようにすればこれを体系的に対処でき、各時点（およびまったくテストのない期間）でnを変化させることができますか？あなたのアイデアは大歓迎です。

参考までに、これはテストと再テストの間の日数の分布です。

代替テキストhttp://a.imageshack.us/img697/6572/testsateachtimepoint.png

repeated-measures variability

— マットパーカー
ソース

興味深い実際のケースの+1！血液検査とは何かを理解するのを手伝ってくれませんか？（それをどのように計算するか）

— ロビン・ジラール2010

LFT（肝機能検査）に関する記事があり、それが周期的に（月単位で）変化するように見える方法がありました。内科年報にあったと思います。

— Ming K

確かに-簡単に言うと、それは潜在的な結核感染の検査です。血液は患者から3つのチューブに採取されます。1つは抗原がなく、もう1つはTB抗原を選択し、もう1つはマイトジェンがあります。次に、抗原のないチューブでの免疫反応の量と結核のある免疫反応の量を比較します。TBチューブで反応が強く増強された場合は、潜在的な結核である可能性があります。（マイトジェンチューブは、その人が免疫反応を起こすことができることを確認するためのチェックとして機能します-ほとんどの人はそれに対して非常に強い反応を示します）

— Matt Parker

あなたの説明から、「ベースラインテスト」とすぐに描画された「2番目のサンプル」を区別する理由はわかりません。それらは単に2つのベースライン測定値であり、（ベースラインでの）分散はそれに基づいて計算できます。3つの「6か月」のサンプルと比較して、2つのベースライン測定の平均をプロットする方が適切です。

問題は6か月のサンプルにあります。この時点では1つのサンプルしか取得されないため、この時点での「変動」を推定する方法はなく、TBの読み取り値の縦（実際の）変化からサンプリングの変動を分離する方法はありません。

これを長期的なデータ分析の問題と考える場合、おそらくランダムな切片（ベースラインTB）とランダムな勾配（6か月のTBに適合するため）を選択します。サンプリング変動は、2つのベースライン測定値と3番目の6か月の測定値からの勾配から推定されます。変化がないと仮定するなど、6か月間の変更に関する強い分布の仮定がないと、6か月の変動を推定できません。

— チラコレオ
ソース