タイムライン分析


10

私は、いくつかの1年間の出生コホート(http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/など)のデータを使用して、個人の出産順序とその後の肥満のリスクとの関係について調査しています

主な課題は、出産順序が母体の年齢、若い兄弟姉妹の数、および/または出生間隔などの他の機能にリンクされていることです。これは、さまざまなメカニズムを介して結果にも影響を与える可能性があります。さらに、これらの事柄が後の肥満リスクに及ぼす影響は、「インデックスの子」(出生コホートの参加者)を含む兄弟の性別構成によって変更される可能性があります。

各インデックスの子供について、家族のすべての出産を示すタイムラインを描くことができます。時間変数は母体の年齢です。

ここに画像の説明を入力してください

これらの種類のデータを分析する方法を特定しようとしています。この場合、イベントの順序、タイミング、および性質がすべて重要になる可能性があります。メンバーが使用するアプリケーションの多様性のため、ここでこの質問をします。誰かが私を一人で特定するにははるかに長い時間がかかるいくつかの即時の提案を期待しています。正しい方向に少しでも動かしていただければ幸いです。

関連質問: 女性の出生間隔に関するデータをどのように分析すればよいですか?


1
+1。通常の質問:両親のBMIのデータはありますか?
ディアハンター

はい、インデックスの子供たちの母親のためのいくつかの長期的な身体測定データがあります。残念ながら兄弟ではなく、家族内と家族の間の分析を排除します。
DLダリー2013年

現時点では、タイムラインの問題について役立つ考えはあまりありません。別の独立変数として、最初の出産時の母親の年齢を設定することもできます。すでに探索的分析と視覚化を行っていると思います...
ディアハンター

明らかに母体の年齢を考慮することが重要です。そのため、上記のタイムラインでは母体の年齢を時間変数として使用しています。私が見つけたいと思っているのは、すべてを線形モデルに投入するだけではない、別の方法です。
DLダーリー2013年

これが重要かどうかはわかりませんが、出生時の体重、または女性の子供の平均出生時の体重は興味深い共変量であると思います。また、あなたの結果に関する詳細情報を提供できますか?対策を繰り返していますか?
ReliableResearch

回答:


2

マルチレベルモデル(混合回帰)を使用して、家族効果の間および家族効果内を推定することを検討する場合があります。1つの可能な戦略は、計画的な階層モデル構築アプローチを使用することです。たとえば、一変量モデルで各潜在的な予測子をテストします。家族間の影響が出生順効果を取り除く場合、それは出生順が重要ではないが他の影響が重要であることを強く示唆するでしょう。IQの出生順の影響に関するこの引用の例:

これがお役に立てば幸いです。


私も出会った良いアイデアの+1ですが、この特定の分析の兄弟に関する結果データはありません。
DL Dahly 2014年

0

私はこれを統計的な質問として扱い、医学的な問題について特別な知識はありません。

あなたが参照している記事を見ると、1つのコホートに970人の個人が含まれていることがわかります。おおよそそのサイズのいくつかのコホートに関するデータがある場合、データセットの全体的なサイズは、各個人のタイムラインが特定の条件を満たす、かなり大きなサブセットを選択する機会を提供します。たとえば、サブセットには、たとえば、母親の年齢が25〜29歳のすべての男性が含まれる場合があります。そのようなサブセットの場合、出産順に対する後の肥満の適切な測定値の回帰は、指標となる子供の性別の違いが後の肥満に及ぼす可能性のある影響を排除し、母体年齢の可能性のある影響をほとんど排除します。

このアプローチを兄弟の性別に拡張することは簡単ではありません。なぜなら、サブセットの1つの条件が、たとえば、インデックスの子が古い女性の兄弟である場合、インデックスの子自体が最年長の子ではないことを意味し、範囲を狭めるからです。回帰における独立変数の。ただし、これを回避する方法として、「存在する場合」を使用して条件を定義する方法があります。たとえば、サブセットは、母親の年齢が25〜29歳で、兄弟姉妹がいる場合はそれ以上のすべての女性であるすべての男性を含むように定義できます。そのようなサブセットには、出生順の個人が含まれます。

サブセットが非常に複雑な一連の条件で定義されている場合、サブセットに含まれる個体の数が非常に少ないため、結果として得られる係数の推定値が不正確になり、役に立たなくなる可能性があります。このアプローチが採用された場合、サブセットを定義する際に、可能な限り多くの影響を排除することと、有用な結果を生み出すのに十分な個人を含めることの間には、判断的なトレードオフが必要になるでしょう。


答えてくれてありがとうアダム。ただし、この場合、サンプルを層別化しても、同様に調整されたモデル以外のことは何も教えられないと思います。これを行うには、適切に指定された線形モデルが最善の方法である可能性があります...他の分野の統計学者がさまざまな方法で同様の問題を扱っているかどうかを確認したいと思っていました。
DLダリー2013年

私が同意する-これがあなたの言っていることなら-私のアプローチは、多数の指標変数を使用したデータセット全体の単一回帰と同等である。母体の年齢を例にとると、それを連続変数として扱うモデルの潜在的な問題は、関数形式の仮定が必要なことです(母体の年齢と後の肥満との関係は曲線になる可能性があります)。対照的に、母親の年齢帯の指標変数のセットを使用するモデルは、そのような仮定を必要とせず、その点でより一般的です。
アダムベイリー

0

機能的なデータ分析をお勧めしますが、家族が多く、子供が少なすぎて、妥当な見積もりを取得できない可能性があります。ただし、ニーズに対応しているため、先に進んで読んでください。たぶん、誰かがすでに同じようなデータでそれを使用しているでしょう。

そのように大規模なノンパラメトリックなことをしたくない場合は、臨床の専門知識を使用してデータの次元を減らす必要があります。たとえば、モデル内の1つの変数は子供の数、別の変数は子供の間の平均年数などです。これらの変数に影響がある場合は、関数形式をすぐに正しく指定していなくても表示されることがあります。さらに知識主導のモデルを構築すると、高度に予測可能なモデルを構築できる場合があります。検証セットを維持することを確認してください!


私はFDAを使用していますが、それがどのように適用されるのかわかりません。各インデックスの子に対してx軸= 0を設定し、他の兄弟をその軸の+/-時間でプロットすることができます。y軸は母体の年齢です。そして、各インデックスの子の単調関数データオブジェクトを推定します...しかし、これを実行するとすぐに、兄弟の実際の数とそれらがラインに沿ってどこにあるかに関するすべての情報が失われました(すべてが関数)。FDAには多数の分析モードが含まれています。具体的なことを考えていましたか?
DLダーリー2013
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.