小さな海鳥への船の往来による妨害について研究しています。焦点の合った動物を一定時間観察し、観察中に水から飛んだかどうかを記録しました。この特定の鳥は、邪魔されていないとき(時間の約10%)、高い確率で飛ぶことはありません。事後、最も近い船までの距離をすべての観測に追加しました(関心のある船にはGPSロケーターが5秒ごとにポイントを記録していました)。
すべての観測と、鳥が水から飛んだ観測の累積分布関数を、最も近い船までの距離の関数としてプロットしました。予想通り、鳥が飛んだ観測の大部分は、船が近いときに観測されました。
コルモゴロフ-スミルノフ検定を使用して、飛行観測と総観測の分布に統計的差異があるかどうかをテストできますか?私の考えでは、これらの2つの分布が異なる場合、船の距離が飛行に影響を与えていると考えられます。飛行観測は観測全体のサブセットであるため、これらの分布関数は独立していないので心配です。
考え?
このサイトでもう少し読んだ後、飛行が発生した観測の分布(F)が発生しなかった観測(NF)の分布に対して独立しているため、これらの分布をテストできると思います。これらの分布が同じF = NFの場合、(F)と(TOT =すべての観測値)の分布は、(F)の分布がそれ自体と等しく、(F)+ (T)=(TOT)。正しい?
更新:2014年2月12日
@Scortchiの提案に従って、ロジスティック回帰フレームワークで飛行の発生率と最も近い船までの距離の関係を調査しました。存在するわずかな関係(負の勾配)がありましたが、p値は有意ではなく、真の勾配がゼロである可能性があることを示唆しています。見かけ上の統計(ecdfプロットを含む)に基づいて、船が行動に影響を与えていなかったときに、多くの観察によって接近した船の影響がおおわれているのではないかと思いました。次に、セグメント化されたRパッケージを使用しました(http://cran.r-project.org/web/packages/segmented/segmented.pdf)モデルのブレークポイントを探して見つけます。プログラムは、船から2.6 kmでデータを分割し、2つの個別の係数をフィッティングすることが、単一の係数モデルよりも優れていることを発見しました。接近船進入の勾配の係数は負であり、船が約2.6 km(p値<0.001)まで飛行応答に影響を与えることを示唆しています。2番目の勾配の係数はわずかに正でしたが、p値は0.05アルファレベルで有意ではありませんでした(p値= 0.11)。したがって、要約すると、セグメント化された回帰直線は、飛行確率が増加するしきい値の差を検出できました。船が2.6 kmを超えている場合の飛行確率の推定値は0.11です。ふさわしいことに、私は調査湾に船がなかったときに79羽の鳥を観察しました(>
すべての提案をありがとう。この質問と提案と回答が他の人に役立つことを願っています。