mathoverflowからの質問をクロスポストして、統計固有のヘルプを見つけます。
私は、負でない値を持つ2次元にうまく投影するデータを生成する物理プロセスを研究しています。各プロセスには、 - yポイントの(投影された)トラックがあります-下の画像を参照してください。
サンプルトラックは青で、面倒な種類のトラックは緑で手書きされ、関心領域は赤で描かれています。
各トラックは、独立した実験の結果です。数年間で2千万回の実験が行われましたが、そのうち2千回だけがトラックとしてプロットした特徴を示しています。ここでは、トラックを生成する実験のみを考慮しているため、データセットは(約)2000トラックです。
任意のトラックが問題の領域に入る可能性をどのように計算できますか?
関心領域に入るトラックが生成される頻度を確認するのに十分な速さで実験を行うことはできないため、利用可能なデータから推定する必要があります。
各トラックから問題の領域までの最小距離を調整しましたが、これが正当な結果を生んでいるとは思いません。
1)このタイプのデータに分布を当てはめるための既知の方法はありますか?
-または-
2)このデータを使用してトラックを生成するためのモデルを作成する明白な方法はありますか?たとえば、トラックの主成分分析を大きな空間のポイントとして使用し、それらのコンポーネントに投影されたトラックに分布(ピアソン?)を当てはめます。