1
Rでさらに2つの基準を使用して重複する時間間隔を特定する
重複したエントリや重複したエントリがないか、長期間にわたる鳥の観察を確認する必要があります。 異なるポイント(A、B、C)の観測者が観測を行い、紙の地図にマークを付けました。種、観測点、およびそれらが見られた時間間隔の追加データを含むラインフィーチャに取り込まれたライン。 通常、観察者は観察中に電話で連絡を取り合いますが、時には忘れてしまうため、重複した行を取得します。 私はすでにデータを円に接する線に減らしたので、空間分析を行う必要はありませんが、各種の時間間隔を比較するだけで、比較によって見つかったのは同じ個体であることを確信できます。 私は今、Rで以下のエントリを識別する方法を探しています。 重複した間隔で同じ日に行われます そしてそれが同じ種である場合 異なる観測点(AまたはBまたはCまたは...)から作成されたもの) この例では、重複する可能性のある同じ個人のエントリを手動で見つけました。観測点が異なり(A <-> B)、種は同じ(Sst)で、開始時間と終了時間の間隔が重なっています。 ここで、data.frameに「duplicate」という新しいフィールドを作成し、両方の行にエクスポートできるように共通のIDを与え、後で何をするかを決定します。 すでに利用可能な解決策を探してたくさん検索しましたが、種のプロセスをサブセット化する必要があり(できればループなし)、2 + x観測点の行を比較する必要があるという事実については何も見つかりませんでした。 試してみるデータ: testdata <- structure(list(bird_id = c("20150712_0810_1410_A_1", "20150712_0810_1410_A_2", "20150712_0810_1410_A_4", "20150712_0810_1410_A_7", "20150727_1115_1430_C_1", "20150727_1120_1430_B_1", "20150727_1120_1430_B_2", "20150727_1120_1430_B_3", "20150727_1120_1430_B_4", "20150727_1120_1430_B_5", "20150727_1130_1430_A_2", "20150727_1130_1430_A_4", "20150727_1130_1430_A_5", "20150812_0900_1225_B_3", "20150812_0900_1225_B_6", "20150812_0900_1225_B_7", "20150812_0907_1208_A_2", "20150812_0907_1208_A_3", "20150812_0907_1208_A_5", "20150812_0907_1208_A_6" ), obsPoint = c("A", "A", "A", "A", "C", "B", "B", …