タグ付けされた質問 「interval-censoring」

3
最小/最大値のみがわかっているデータの統計的方法
正確な値が不明なデータを扱う統計のブランチはありますが、各個人について、値の上限または下限を知っていますか? 私の問題の主な原因は、統計用語で表現するのに苦労しているという事実にあると思われますが、例を挙げて説明するとわかりやすくなります。 ある時点でAのメンバーがBに「遷移」できるように、2つの連結された集団AAAとBBBがあるとしますAAABBBが、その逆は不可能です。遷移のタイミングは可変ですが、ランダムではありません。たとえば、AAAは「子孫のない個人」であり、BBB「少なくとも1人の子孫を持つ個人」です。この進行が起こる年齢に興味がありますが、断面データしかありません。任意の個人について、それらがAAAまたはに属しているかどうかを確認できますBBB。これらの個人の年齢も知っています。母集団Aの各個人についてAAA、移行時の年齢が現在の年齢よりも大きくなることを知っています。同様に、メンバーのBBB場合、移行時の年齢が現在の年齢よりも低いことを知っています。しかし、私は正確な値を知りません。 移行の時代と比較したい他の要因があるとしましょう。たとえば、私は個人の亜種や体の大きさが最初の子孫の年齢に影響するかどうかを知りたいです。私は間違いなくそれらの質問に役立ついくつかの有用な情報を持っています。平均して、の個人のうちAAA、高齢の個人は後の移行を持っています。しかし、特に若い個人にとっては、情報は不完全です。また、母集団についても同様ですBBB。 この種のデータを処理する確立された方法はありますか?適切な場所から始めるために、このような分析を実行するための完全な方法、必ずしもいくつかの検索用語または有用なリソースが必要なわけではありません! 警告:AAAからへの移行BBBは瞬間的であるという単純な仮定を立てています。また、ほとんどの人は、十分な長さの生活をしていると仮定して、ある時点でBBBに進むと想定しています。そして、縦断的なデータは非常に役立つことを理解していますが、この場合は利用できないと想定しています。 私が言ったように、これが重複している場合はおologiesび申し上げますが、私の問題の一部は、何を検索すべきかわからないことです。同じ理由で、必要に応じて他のタグを追加してください。 サンプルデータセット:Sspは、2つの亜種またはYのいずれかを示します。子孫は、子孫なし(A)または少なくとも1人の子孫(B)を示しますXXXYYYAAABBB age ssp offsp 21 Y A 20 Y B 26 X B 33 X B 33 X A 24 X B 34 Y B 22 Y B 10 Y B 20 Y A 44 X B 18 Y A 11 Y B …

2
症例対照研究における生存率の傾向
生存分析を行う不適切な方法のために拒否された記事を提出しました。レフェリーは、「時間の傾向に関する生存分析には、より洗練された検閲方法が必要です。」以外の詳細や説明は残していません。 質問: 喫煙者の過剰な死亡リスクは過去数十年で減少しましたか? データ: ドイツでは25,000人の喫煙者。彼らは1995年から2014年の間にいつでもコホートに登録されました。各喫煙者は(登録時に)一般集団(喫煙しなかった)からの性別と年齢が一致したコントロールに一致しています。研究期間全体で亡くなったすべての人には、正確な死の時間があります。フォローアップ中に死亡しなかった人は検閲されます。この研究は、1995年から2014年まで喫煙者の過剰な死亡リスクを毎年調査するために利用されています。 目的は次の計算です。 喫煙者と非喫煙者の死亡率を毎年調べ、これらの傾向を調べる 毎年(または数年連続)の喫煙者の過剰死亡リスク。 データはどのように分析されるべきですか?1998年に含まれている誰かが2015年に死ぬかもしれないことを思い出してください。開始と停止のカウントプロセスフォーマットを使用する正しいアプローチは毎年更新されますか? これはレフェリーが嫌ったアプローチです: 発生率はポアソン回帰によって計算されました。モデルのオフセットとしてフォローアップ時間を含め、モデルの予測子として年齢、性別、喫煙状況、およびカレンダー期間(2つの連続した年を組み合わせたもの)を含めました。次に、Rのpredict()関数を使用して、1000人年あたりの率を計算しました。オフセット(フォローアップ時間)は、登録からの全観察時間(日)でした。 Coxモデルを使用して、研究の開始から終了までの各期間における喫煙者の相対リスクを推定しました。簡単にするために、最初の期間のハザード比を最後の期間のハザード比と比較しました。 問題:-(彼のコントロールと共に)人は1998年に含まれている可能性があり、そのためそのカレンダーグループに属しているが、2006年にはイベントに苦しんでいる。コックスのカウントプロセス?開始時間と停止時間は何ですか?-この状況でトレンドをどのように評価できますか? いくつかの説明:患者が1998年6月15日に最初に観察され、1998年12月31日のイベントを経験したとしましょう。この患者の時間変数の値は、期間が2年続くため、730日のうち182.5です。各期間の最大観測時間は730日です。 ある期間に患者が観察されたが、別の期間に打ち切られた(つまり、経験とイベントのいずれかまたは脱落した)場合、観察された日数を次の期間に追加する必要がありますか? したがって、主な問題は、フォローアップ時間と暦年(2つの連続する年で構成されるカテゴリ変数として使用される)の処理です。

2
Rの区間打ち切りCox比例ハザードモデル
区間打ち切り生存時間を前提として、区間打ち切りCox PHモデルをどのように実行しRますか?rseek検索はintcox、Rリポジトリに存在しないパッケージを表示します。パッケージcoxph内の関数がsurvival区間打ち切り生存データを処理できないことはほぼ間違いありません。 また、データを代入してcoxph関数を使用したくありません。この方法は、区間打ち切りの不確実性を無視しているため、係数の標準誤差を過小評価します。

1
インターバル打ち切り
R、JMP、SASで区間検閲生存曲線を実行しました。どちらも同じグラフを提供してくれましたが、表は少し異なりました。これは、JMPから提供されたテーブルです。 Start Time End Time Survival Failure SurvStdErr . 14.0000 1.0000 0.0000 0.0000 16.0000 21.0000 0.5000 0.5000 0.2485 28.0000 36.0000 0.5000 0.5000 0.2188 40.0000 59.0000 0.2000 0.8000 0.2828 59.0000 91.0000 0.2000 0.8000 0.1340 94.0000 . 0.0000 1.0000 0.0000 これは、SASから提供されたテーブルです。 Obs Lower Upper Probability Cum Probability Survival Prob Std.Error 1 14 …

1
MLE /対数正規分布区間の可能性
以下のサンプルのように、間隔として表される応答の変数セットがあります。 > head(left) [1] 860 516 430 1118 860 602 > head(right) [1] 946 602 516 1204 946 688 ここで、左は応答の下限、右は応答の上限です。対数正規分布に従ってパラメーターを推定したい。 しばらくの間、可能性を直接計算しようとしたとき、2つの境界が異なるパラメーターのセットに沿って分布しているため、以下のようないくつかの負の値が得られるという事実に苦労していました。 > Pr_high=plnorm(wta_high,meanlog_high,sdlog_high) > Pr_low=plnorm(wta_low, meanlog_low,sdlog_low) > Pr=Pr_high-Pr_low > > head(Pr) [1] -0.0079951419 0.0001207749 0.0008002343 -0.0009705125 -0.0079951419 -0.0022395514 私は実際にそれを解決する方法を理解できず、代わりに間隔の中間点を使用することに決めました。これは、間隔応答の対数尤度を抽出するmledist関数を見つけるまで、良い妥協です。これは私が得る要約です: > mledist(int, distr="lnorm") $estimate meanlog sdlog 6.9092257 0.3120138 $convergence [1] 0 …

5
二項変数の50%が遷移する時間をどのように推定できますか?
4つの被験者のバイナリ状態を4回表す次のデータがあります。各被験者がに遷移することのみ可能であり、1 → 0には遷移できないことに注意してください。0→10→10\to 11→01→01\to 0 testdata <- data.frame(id = c(1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4), day = c(1,1,1,1,8,8,8,8,16,16,16,16,24,24,24,24,32,32,32,32), obs = c(0,0,0,0,0,1,0,0,0,1,1,0,0,1,1,1,1,1,1,1)) 私はそれをロジスティック回帰でモデル化できます: testmodel <- glm(formula(obs~day, family=binomial), data=testdata) > summary(testmodel) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -0.018890 0.148077 -0.128 0.899907 day 0.032030 0.007555 4.240 0.000493 *** 最初に、モデル内の同じ個人の反復測定をどのように説明できますか? 第2に、被験者の1/2がから移行する日を不確実に見積もるにはどうすればよいですか?0→10→10\to 1

1
区間打ち切りデータのdinterval()はJAGSでどのように機能しますか?
検閲済みデータのJAGSでdinterval()がどのように機能するかを理解しようとしています。粗いデータをモデリングしていますが、各データポイントの上限と下限しかありません(真の値ではありません)。これが私がそれがうまくいくべきだと思う方法の簡単な例です: 各ポイントの上限と下限: > head(lim) L U [1,] 14.98266 15.68029 [2,] 21.21827 21.91590 [3,] 18.34953 19.04716 [4,] 19.00186 19.69949 [5,] 15.39891 16.09654 [6,] 17.81705 18.51468 モデルを作成するための関数(データが共通の平均と分散を持つ法線からのものであると想定): playmodel <- function(){ for (i in 1:50){ is.censored[i] ~ dinterval(t[i], lim[i,]) t[i] ~ dnorm(mu,tau) } mu ~ dnorm(0,.001) tau ~ dgamma(.01,.01) } filename <- "toymod.bug" …

2
ポイントではなく間隔として与えられたデータの分析
としてなく、ペアとして与えられていないデータのセットがあります各ペア、真のx_iは区間(x ^ {(start)} _ i、x ^ {(end)} _ i)にあり、しかし、それはどこにあるかはわかりません。x =バツ1、… 、バツん、バツ=バツ1、…、バツん、 \boldsymbol{x} = x_1, \dots, x_n,バツiがN 、T 、E 、R 、V L= (バツ(s t a r t )1、バツ(e n d)1)、… 、(バツ(s t a r t )ん、バツ(e n d)ん)。バツ私んterval=(バツ1(start)、バツ1(eんd))、…、(バツん(start)、バツん(eんd))。\boldsymbol{x}_{interval} = (x^{(start)}_1, x^{(end)}_1), \dots, (x^{(start)}_n, x^{(end)}_n). (バツ(s t a r t )私、バツ(e n …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.