タグ付けされた質問 「epidemiology」

疫学は、人口レベルでの病気や病気の分布と広がりの研究です。

1
無病生存分析で死に対処する方法は?
無病生存データ(特定の疾患が診断されたかどうか、そのイベントまでの時間またはフォローアップの損失として定義されているかどうか)および全体的な生存データがある場合、病気の出来事?これらは検閲されていますか、それとも無病生存(dfs)分析からそのような患者を除外すべきですか?私はいくつかの特定の種類の疾患に対して個別にdfs分析を実行する予定です。

1
Anova()とdrop1()がGLMMに異なる回答を提供したのはなぜですか?
次の形式のGLMMがあります。 lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 私が使用している場合drop1(model, test="Chi")、私は私が使用している場合とは異なる結果を得るAnova(model, type="III")車のパッケージからかsummary(model)。後者の2つは同じ答えを与えます。 大量の偽造データを使用して、これらの2つの方法は通常違いがないことがわかりました。それらは、平衡線形モデル、不平衡線形モデル(異なるグループでnが等しくない場合)、および平衡一般化線形モデルに対して同じ答えを示しますが、平衡一般化線形混合モデルに対しては同じ答えを与えません。したがって、ランダムな要素が含まれている場合にのみ、この不一致が現れます。 これらの2つの方法の間に違いがあるのはなぜですか? GLMMを使用する場合は必要がありますAnova()かdrop1()使用できますか? これらの2つの違いは、少なくとも私のデータでは、かなりわずかです。どちらを使用するかは問題ですか?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
ITTとATEの違いは何ですか?
影響評価に使用できるさまざまな推定量を理解できません。治療意図(ITT)の推定者は、コンプライアンスに関係なく、プログラムのない対象者とプログラムの対象者の違いを比較することを知っています。しかし、平均治療効果(ATE)も同じことを測定すると思いました。ただし、ATEはコンプライアンスを考慮しているようです。したがって、適格で治療を受けている人と、適格ではない人との結果を比較します。これは正しいです?

3
発生率の比較
2つのグループ(1つは疾患なし、もう1つは疾患なし)間の発生率と比較したいと思います。 発生率比(IRR)、つまり発生率グループB /発生率グループAを計算し、この率が1に等しいかどうかをテストし、最後にIRRの95%CI間隔を計算することを計画していました。 私は本(Rosner's Fundamentals of Biostatistics)で95%CIを計算する方法を見つけました。 exp[log(IRR)±1.96(1/a1)+(1/a2)−−−−−−−−−−−−√]exp⁡[log⁡(IRR)±1.96(1/a1)+(1/a2)]\exp\left[\log(\text{IRR}) \pm 1.96\sqrt{(1/a_1)+(1/a_2)}\right] ここで、とはイベントの数です。しかし、この近似は十分に大きいサンプルサイズに対してのみ有効であり、私が持っているイベントの数は小さいと思います(たぶん、全体の比較では問題ありません)。a 2a1a1a_1a2a2a_2 だから私は別の方法を使うべきだと思います。 私はRとexactciパッケージを使用していて、おそらく使用できることを発見しましたpoisson.test()。ただし、この関数には、両側のp値を定義するための3つの方法があります。中央、最小、およびブレーカーです。 だから私の質問は: ポアソン率の比較テストを使用して2つの発生率比を比較することは正しいですか? exactciパッケージのRでpoisson.test関数を使用する場合、どの方法が最適ですか? ビネットのためexactciは言います: central:は、上記の1で区切られた片側p値の最小値の2倍です。「central」という名前は、中心間隔である関連付けられた反転収束間隔によって動機付けられます。つまり、真のパラメーターがは、100(1-)%の信頼区間の下(上)テールよりも小さい(大きい)確率です。これは、Hirji(2006)によってTST(2回の小さいテール法)と呼ばれています。αα/2α/2\alpha/2αα\alpha minlike:観測された尤度以下の尤度を持つ結果の確率の合計です。これはHirji(2006)によってPB(確率ベース)メソッドと呼ばれています。 ブレーカー:観測されたテールの小さい確率と、観測されたテールの確率を超えない反対側のテールの最小確率を組み合わせます。「ブレーカー」という名前は、コンデンス間隔の関連メソッドを包括的に研究するブレーカー(2000)が動機となっています。これはHirji(2006)によってCT(combined tail)法と呼ばれています。 私のデータは: Group A: Age group 1: 3 cases in 10459 person yrs. Incidence rate: 0.29 Age group 2: 7 cases in 2279 person yrs. Incidence rate: 3.07 Age …

1
打ち切り変数の代入
変数が約200の医療データセットがあります。変数の1つは、バイオマーカー(特定の酵素の濃度)です。その分布は正しいスキューであり、問​​題は特定のレベルを超える値がそのレベルで打ち切られたり、打ち切られたりすることです。したがって、変数の平均は約10ですが、50を超える値は50として記録されます。 これらの打ち切り値に連続値を代入したいと思います。現在、R のマウスパッケージで複数の補完を使用していますが、他のシステムも利用可能であり、他のアプローチを受け入れています。私が考えていたのは、これらのすべての打ち切り値を欠落するように再コード化してから、代入を実行することでした。最初に打ち切られた帰属値のいずれかがカットオフを下回っている場合、それらはカットオフ値として割り当てられます。 これについての意見、および/またはこれに対処するためのより良い方法を知りたいのですが。

2
オッズ比から相対リスクへの変換が有効であるための前提条件
質問として、オッズ比(p1/q1)/(p2/q2)から相対リスクへの変換は(p1/(p1+q1))/(p2/(p2+q2))かなり簡単にできるので、これを行う前に注意する必要があることはあるのでしょうか。 ケースコントロール研究をしている場合、この種の研究からの相対的なリスクがわからないため、変換を行うべきではないことは明らかですが、他に考慮すべきことはありますか? ありがとう。

1
疫学者/公衆衛生の同僚に高度な予測モデリングを穏やかに導入するにはどうすればよいですか?
社会科学と疫学の背景から来た私の同僚は、最小二乗回帰、ロジスティック回帰、および生存分析について訓練を受けました。彼らは、95%の信頼区間とパラメーター係数のp値を確認することを好み、ニューラルネットワーク、CART、バギングとブースティング、ペナルティ付き回帰手法などの現在の予測ツールに不信感を抱いています。

1
ゾンビの確率パズル[終了]
休業。この質問には詳細または明確さが必要です。現在、回答を受け付けていません。 この質問を改善してみませんか?詳細を追加し、この投稿を編集して問題を明確にしてください。 9か月前に閉鎖。 ゾンビについて簡単なゲームを書くことを考えています。ゾンビになるべき人の数を計算しようとして動けなくなった。 私の状況は次のとおり です。700人の小さな田舎町があります。一晩で200体のゾンビが町にやってきます。各ゾンビには、1人の人間が感染して新しいゾンビになる50%の確率で、1日あたり30%の単一の接触確率があります。1日目、2日目、3日目に何人がゾンビになりますか? 町の人の数に応じて感染の可能性を活用することにしました。人が多ければ多いほど、接触の可能性は低くなります(物議を醸すように見えるかもしれませんが、そうなる可能性があります)。だから、(200/700)*0.3=0.086または8.6%偶然に連絡してください。それから私は、1人のゾンビが8.6%1人の人間に感染する可能性があると思い始めました。1日の間、200人あたり200回の試行しかありません。感染の確率が99.9%で、60のように見える試行回数を見つけようとしました。その後、約60 700/60=11.6人に1人の人間が感染することになります。つまり、1日あたりの人です。私は統計の背景がないので、私はおそらく間違っています、誰かが私を助けてくれるといいですね。

2
発生率の推定
医学生向けの統計コースを受講しているときに、発生率に関連する問題に遭遇しました。問題の背景は、ポアソン分布に関する章です。この問題では、2300人の喫煙者が1年間にわたってフォローされ、そのうち24人が肺癌を発症しています。次に、プロセスの発生率を計算し、次のように進めます。 発生率= 242300 - 24 / 2Incidence rate=242300−24/2\text{Incidence rate} = \frac{24}{2300-24/2} 彼らは減算なぜ最初は、私は理解していなかった24 / 224/224/2、私はそれらの24人が今年中に癌を発症することから、リスクの自分の時間を開発していないものに比べて短くなっているという事実のためにいくつか修正したと仮定しました病気。少なくとも問題ではなく、教科書自体にそれ以上の情報は与えられていません。簡単な検索で、正しい方向に沿って考えていることが確認されました。 しかし、私はまだ公式の根拠を理解していません。誰かが私を啓発できますか?また、医学生にアクセス可能ないくつかの参照が与えられる可能性がある場合。さらに技術的なリファレンスがあってもかまいません。

2
ケースコントロール研究における傾向スコアの使用
傾向スコア(PS)の理論は、PSが「治療/暴露」グループを「未治療/非暴露」グループと一致させるため、コホート研究にのみ使用する必要があることを示唆しています。ただし、症例対照は、症例対照研究の結果(暴露ではなく)です。PSがケースコントロール研究で使用される場合の落とし穴は何ですか?

1
ロジスティックモデリングのコンテキストで「ケースコントロール」と「横断的」とはどういう意味ですか?
ロジスティックモデリングを研究しているときに、次のステートメントを読みました ケースコントロールまたは横断研究のロジスティックモデリングから、オッズ比のみが推定され、個々のリスクは推定されないという事実は驚くべきことではありません。 「ケースコントロール」と「横断研究」が統計分析で何を表すのかわかりません。また、統計分析の観点から、上記の意味がよくわかりません。説明をいただければ幸いです。

1
Cox回帰予測モデルのサンプルサイズと交差検証法
コミュニティに提起したい質問があります。最近、腫瘍マーカーの予後研究のために統計分析を提供するように依頼されました。私は主にこれら2つの参照を使用して、私の分析を導きました。 McShane LM、他 腫瘍マーカー予後研究に関する推奨事項の報告(注釈)。J Natl Cancer Inst。2005年8月17日。97(16):1180-4。 サイモンRMなど 高次元データに基づく生存リスク分類子の予測精度を評価するための交差検証の使用。簡単なバイオインフォーム。2011年5月; 12(3):203-14。Epub 2011 2月15日。 以下の研究と分析をまとめました。コメント、提案、または批判をいただければ幸いです。 研究の背景: がんXの一部の患者は、治療後早期に再発します。現在医師が使用している臨床予後スコアは、これらの患者の臨床転帰を予測する上で十分な役割を果たしていません。したがって、この標準スコア以上の価値を追加する生物学的予後マーカーを特定することは有用です。この研究の目的は、そのようなバイオマーカーを発見することです。 調査方法: 候補バイオマーカーの事前選択 がんXに関連する12のバイオマーカーが以前の研究で特定された。以下に示すように、患者/腫瘍の独立したサンプルで、これらの12の候補と癌Xの関連を検証しようとしました。 事前選択された候補バイオマーカーの単変量検証 これらのバイオマーカーのレベルは、220人の患者/腫瘍のセットで測定されました。 [注:データをマスクして、*。csvファイルとして公開ダウンロードできるようにしました。ファイルには次の列があります。「ID」、各患者の一意の識別子。「PS」は各患者の予後スコアで、1は予後良好を示し、2は予後不良を示します。「m1」〜「m12」、各腫瘍マーカーのレベル。「時間」、月単位。「イベント」。0は監視が中止されたことを示し、1は治療失敗が発生したことを示す。 従属変数としての死亡までの時間を含む単変量Cox回帰モデルは、12のバイオマーカーのそれぞれについて作成されました(n = 220の観測値、イベントの数= 91)。 Risk LCI UCI pValue 1 0.93 0.86 1.02 0.1088 2 0.93 0.88 0.99 0.0215 3 0.99 0.92 1.05 0.6528 4 0.93 0.87 1.00 0.0468 5 …

2
疫学のための良い参考書
疫学の良い参考書を探しています。私はロスマンの疫学:序論とポルタの 『疫学の辞書』を持っています。Rothman'sは非常に単純化されており、基礎的な研究の後に明らかではないことを何も欠いているため、大きな失望でした。彼のModern Epidemiologyは良いと聞いていますが、紹介本にがっかりしているので、購入に少し躊躇しています。ポルタはとてもいいと思いましたが、それは辞書であり、私は教科書にもっと興味があります。 私はどんな提案にも感謝します。

2
バイアスと交絡変数のオーバーマッチング
私が理解しているように、マッチングは観察研究で因果関係を特定する1つの方法です。「類似」している観察を照合し、治療を受けたまたは受けなかった観察を比較することにより、これを一種の準実験と見なすことができます。 オーバーマッチングとは何ですか?それはどのようなバイアスをもたらしますか?私は主に経済学の観点からマッチングを見てきたが、最近、「オーバーマッチング」がバイアスにつながる可能性があることを示唆する疫学に関するいくつかの論文を見た。論文の用語を理解するのは難しいと思います。誰かが主要な概念のいくつかを説明してくれると助かります。以下はアイデアを参照する記事です: オーバーマッチングはバイアスを引き起こす可能性があります。BMJ。2002 8月10日。325(7359)
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.