私のコメントを詳しく説明するために、ここに、x軸に沿ったデータの分布が原因で、見かけのパターンがアーチファクトになる可能性がある例を示します。100,000データポイントを生成しました。それらは通常、x軸()に分布し、y軸()に指数分布します。μ=2500,σ=600λ=1
散布図の「視覚的包絡線」に続いて、明確ではありますが、図解的なパターンがあります。yは、1000 <x <4000の範囲で最大に見えます。ただし、この見かけ上のパターンは視覚的に非常に説得力があり、x値の分布によって引き起こされる単なるアーティファクトです。つまり、1000 <x <4000の範囲のデータが増えます。これは、下部のxヒストグラムで確認できます。
それを証明するために、私はxのビン(黒い線)で平均 y値を計算しました。これはすべてのxに対してほぼ一定です。データが散布図の直観に従って分布した場合、1000 <x <4000の範囲の平均は他の平均よりも高くなるはずですが、そうではありません。したがって、実際にはパターンはありません。
これがあなたのデータのすべての話だと言っているのではありません。しかし、それは部分的な説明だと思います。
実際のドナーの補遺データを選択してください。
重ね打ちマーカー付きの元の散布図:
不透明度を下げた同じ散布図:
さまざまなパターンが表示されますが、80万個のデータポイントがあるため、オーバーストライキングで失われた詳細はまだたくさんあります。
ズームし、不透明度を再度減らして、より滑らかにします。