データの設定方法について読んだとき、私がよく遭遇することの1つは、いくつかの連続したデータをカテゴリデータに変換することは良い考えではないということです。しきい値が十分に決定されていない場合、間違った結論を下す可能性が非常に高いからです。
しかし、私は現在いくつかのデータ(前立腺がん患者のPSA値)を持っていますが、一般的なコンセンサスは、あなたが4歳未満の場合、おそらくそれを持っていない、あなたが上にいる場合は危険にさらされ、 10と20を超えると、おそらくそれがあります。そんな感じ。その場合、連続PSA値を0〜4、4〜10、および> 10のグループに分類することは依然として間違っていますか?または、いわばしきい値が「十分に決定」されているので、実際には大丈夫ですか。
5
(通常どおり)依存します。たとえば、医師がどのように決定を下すかを研究しており、医師がこれらのカテゴリに基づいて決定を下す場合、同じカテゴリを使用する必要があります。代わりに、PSAの上昇に関連する生物学的結果を調査している場合、PSAをまったく分類したくない可能性があります。したがって、「大丈夫ですか」という広範な質問に対する明確な答えはありません。
—
whuber
データをどうしようとしていますか?そのような境界は通常、あなたが理解したいものに関連していないので、手でそれらを置くことは質問を懇願していますか?
—
-RemcoGerlich
ロジスティック回帰モデルのデータを設定しています。したがって、主な問題は、実際には連続データのみを使用するか、代わりに個別データを使用するかです。
—
デンバーダン
「連続」データが何であるかは私には明らかではありません。それは現実に存在するものではありません。無限の精度を持つ測定/統計のようなものはありません。
—
ジミージェームズ
@BillHorvathええ、私は医者ではないので、これがどのように決定されたかは完全にはわかりません。Wikiページを見ると、1つの場所が示されています。「PSAレベル4〜10 ng / mL(ナノグラム/ミリリットル)は疑わしいと見なされ、繰り返しテストで異常なPSAを確認することを検討する必要があります。 」そして別の場所:「低リスク:PSA <10、グリーソンスコア≤6、および臨床病期≤T2a中間リスク:PSA 10-20、グリーソンスコア7、または臨床病期T2b / c高リスク:PSA> 20 、グリーソンスコア≥8、または臨床病期≥T3 "
—
デンバーダン