2,500人から7,500件の血液検査を含むデータセットがあります。私は、血液検査の変動性が2つの検査間の時間とともに増加するか減少するかを調べようとしています。たとえば、ベースラインテストのために血液を採取し、すぐに2番目のサンプルを採取します。6か月後、別のサンプルを引きます。ベースラインと即時反復テストの違いは、ベースラインと6か月のテストの違いよりも小さいと予想されるかもしれません。
以下のプロットの各ポイントは、2つのテストの違いを反映しています。Xは2つのテスト間の日数です。Yは、2つのテストの差のサイズです。ご覧のとおり、テストはXに沿って均等に分散されていません。実際、この研究はこの質問に対処するように設計されていません。ポイントは平均で非常に重なっているため、28日間のウィンドウに基づいて、95%(青)と99%(赤)の分位線を含めました。これらは明らかにより極端な点に引っ張られていますが、あなたはアイデアを得ます。
代替テキストhttp://a.imageshack.us/img175/6595/diffsbydays.png
変動はかなり安定しているように見えます。どちらかといえば、テストが短期間に繰り返された場合、それは高くなります-それはひどく直観に反しています。どのようにすればこれを体系的に対処でき、各時点(およびまったくテストのない期間)でnを変化させることができますか?あなたのアイデアは大歓迎です。
参考までに、これはテストと再テストの間の日数の分布です。
代替テキストhttp://a.imageshack.us/img697/6572/testsateachtimepoint.png