成長チャートを作成する最良の方法


10

私は5から15歳(5、6、7のみなど、2.6歳のような小数値はありません)の負ではなく、継続的である健康変数のチャート(成長チャートと同様)を作成する必要があります50〜150の範囲(この範囲外の数個の値のみ)。90、95、99パーセンタイル曲線を作成し、これらのパーセンタイルのテーブルも作成する必要があります。サンプルサイズは約8000です。

私は次の可能な方法をチェックして見つけました:

  1. 分位点を見つけて、レス法を使用して、これらの分位点から滑らかな曲線を取得します。滑らかさの程度は「スパン」パラメータで調整できます。

  2. LMS(Lambda-Mu-Sigma)メソッドを使用します(RでgamlssまたはVGAMパッケージを使用するなど)。

  3. 分位回帰を使用します。

  4. 各年齢グループの平均とSDを使用して、その年齢のパーセンタイルを推定し、パーセンタイル曲線を作成します。

それを行う最良の方法は何ですか?「最良」とは、そのような成長曲線を作成するための標準的な方法であり、すべての人に受け入れられる理想的な方法を意味します。または、いくつかの制限があるかもしれませんが、受け入れ可能でより速い方法である、実装がより簡単で単純な方法。(たとえば、パーセンタイル値でloessを使用すると、gamlssパッケージのLMSを使用するよりもはるかに高速です)。

また、そのメソッドの基本的なRコードになります。

ご協力いただきありがとうございます。


2
あなたが決定的に議論することは通常困難と不可能の間のどこかにある「最高」を求めています。(レベルの「最良の」測定は十分に困難です。)質問は子供の健康の変化に明確に結び付けられていますが、「最良」の基準は明確ではありません。
Nick Cox

私はその試みを歓迎しますが、a)明らかに存在しません。他になぜ競合する解決策があるのか​​、あるいはあなたが読んでいる文献でこれがなぜ明白でないのですか?この問題への関心は、何世紀も前ではないにしても、確かに数十年です。より簡単な手段:理解しやすく、医療関係者や一般に統計に関心のない専門家に説明しやすく、実装しやすく、...?間違いなくうるさいようですが、なぜここで速度を気にする必要があるのでしょうか。これらの方法はどれも、計算上厳しいものではありません。
Nick Cox

@NickCox:あなたのコメントに従って質問を編集しました。本当の答えをいただければ幸いです。
rnso 14

1
申し訳ありませんが、私はこの分野で働いていません。あなたの質問に答えるのは難しすぎると思います。コメントが存在するのは、人々が答えることができないか、答えたくないのですが、それでも何か言いたいことがあるからです。注文に対する回答は書いていません。
Nick Cox

回答:


6

成長曲線に関する大規模な文献があります。私の考えでは、3つの「トップ」アプローチがあります。3つすべてで、時間は十分な数のノット(たとえば、6)を持つ制限付き3次スプラインとしてモデル化されます。これは、優れたパフォーマンスと簡単な解釈を備えたパラメトリックスムーザーです。

  1. 連続時間AR1などの実用的な相関パターンを持つ長期データの古典的な成長曲線モデル(一般化最小二乗)。残差がガウスであることを示すことができれば、推定平均と共通標準偏差を使用して、変位値のMLEを取得できます。
  2. n
  3. YY

比例オッズを使用した場合、非常に多くのレベルの結果でPOの仮定(失敗したと仮定)にどのように対応しましたか?ありがとう。
ジュリス、

2
それが失敗したとしても、全体的な仮定が少ないため、モデルは他のいくつかのモデルよりもパフォーマンスが良い場合があります。または、比例ハザードなどのその他の順序モデルの累積確率ファミリーの1つに切り替えます(ログとログの累積確率リンク)。
フランクハレル2015年

1

ガウス過程回帰。二乗指数カーネルから始めて、目でパラメーターを調整してみます。後で、物事を適切に実行したい場合は、さまざまなカーネルを試してみて、限界の可能性を使用してパラメーターを最適化します。

上記のリンク先のチュートリアルよりも詳細が必要な場合は、この本が最適です。


ご回答有難うございます。言及されている他の方法と比較して、ガウスプロセス回帰をどのように評価しますか。scikit-learn.org/0.11/auto_examples/gaussian_process/…の2番目のガウスプロットは、LOESS(ローカル回帰)のこのページの2番目の最後のプロットと非常によく似ています:princeofslides.blogspot.in/2011/05/…。LOESSは実行がはるかに簡単です。
rnso 2014

個人的に、私はあなたがそれをフィットさせるのに十分に小さいどんなデータセットに対してもGPRを強く好みます。理論的な観点から見てはるかに「優れている」だけでなく、柔軟性が高く、堅牢で、十分に調整された確率的出力を提供します。とはいえ、データが密集し、行儀が良い場合、オーディエンスは統計学者でなければLOESSとGPRの違いを見分けることができないでしょう。
アンディジョーンズ

3
yx

1
@Nick:私が意図したアドバイスは、データのモデルを作成し、そのモデルを使用して(滑らかな)パーセンタイル曲線を作成することでした。さて、あなたはそれについて言及しました、ええ、私は2番目のコンポーネント(すなわち実際の質問)を完全に逃しました。
Andy Jones、

1
1.96
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.