難しいデータセットのモデルは何ですか?(ネスティングの多い数百の時系列)


9

分析するのに非常に複雑なデータセットがあり、それに対する適切な解決策を見つけることができません。

ここに事があります:

1.生データは本質的に昆虫の歌の録音です。各曲はいくつかのバーストで構成され、各バーストはサブユニットで構成されています。すべての個人が5分間記録されました。バーストの数と記録内でのそれらの位置、およびバーストごとのサブユニットの数は、個人間で非常に異なる場合があります。

2.各サブユニットのキャリア周波数(基本周波数)がわかっているので、それを分析します。

私の問題:

1.バースト内の周波数は明らかに独立していません(かなり安定していますが、サブユニットn-1の周波数はサブユニットnに影響します)。

2.バーストは、録音内でも独立していません。

3.時間とともに周波数が下がるので、それらの独立性はさらに低くなります(個人が歌うのに飽きて、曲の周波数がどんどん低くなります)。落ち込み直線的なようです。

4.ネスト= 2つの場所AとBに3つの複製された母集団があります。したがって、A1、A2、A3とB1、B2、B3があります。

私がしたいこと:

1. 2つの場所の頻度の違いを特徴付ける(統計的にテストする)

2. 2つの場所の間で落ちる周波数を特徴付けます(それらの1つで速く落ちるかどうかを確認してください)。

どうやってするの:

それが私が助けを必要とする理由です:私にはわかりません。私のケースは、通常一緒に見られない問題を組み合わせているようです。私は混合モデル、GAM、ARIMA、ランダム効果と固定効果について読みましたが、それを行うための最良の方法を本当に確信できません。しかし、それをグラフ化すると(頻度〜サブユニット番号n)、2つの場所の違いは非常に明確です。温度(周波数を高くする)など、他の変数も考慮する必要があります。

私は考えました:

  • レプリケート内の個人を入れ子にし、複製を場所(個人/複製/場所)内に入れ子にします。

  • ランダムな「バースト」効果を使用して、各バースト内の変動を考慮します。

  • 固定された「記録中のバースト位置」効果を使用して、周波数の低下を測定します(実際には線形であることを期待しています)。

正しいでしょうか?

このようなシナリオに使用できる特別なタイプのモデルはありますか?


このサイトへようこそ、ジョー。投稿にサインインする必要はありません。あなたの名前は常にあなたの
墓地の

わかりました、ありがとう!それはとても素敵なウェブサイトで、とてもよくできています。
Joe

ネストされていないフォームと比較すると、「複製の中にある個体を入れ子にし、場所の中に複製を入れ子にする(個人/複製/場所)」というのは良い考えのように思えます。6つの部分母集団のうち、最も少ないのはどのようなものですか?
神父

1
回答ありがとうございました。本当にありがとうございました。ええと、長い時間がかかりましたが、この(流血の)データセットを分析することができました。すべてを同時にモデル化したいと思っていたので、私は野心的すぎました。したがって、問題ごとに(平均周波数差、周波数の増加など)、ジョブをいくつかのモデルに分割しました。結論:仕事を分割する方が良い場合があります!
Joe

回答:


2

これは、役立つと思われる一般的な提案の一部であり、レシピではなくロードマップです。

  • 私の本能は、ベイジアン階層モデルを構築することです。なぜなら、それは反復的なモデル開発に向いているからです。私は、あなたが求めているすべての基本機能を備えた既存のモデルを見つけることができないと思います。しかし、これは仮説検定を難しくします。仮説検定があなたにとってどれほど必要かわかりません。
  • 昆虫がどのように行動するかについて、少し非公式なモデルが頭にあるようです。あなたは「疲れる」のようなことを言い、そしておそらく動物がより多くのエネルギーを持っているために、温度が周波数を高くすることを知っています。昆虫がどのように歌を作るかについて、少し生成モデルを頭に持っているようですね。
  • この問題は、「ワンショット」でモデル化するには複雑すぎるようです。少しずつ構築する必要があると思います。私はいくつかの「強力な単純化の仮定」から始めます。つまり、機能する単純なモデルが得られたら、データセットの複雑さのほとんどを捨て、後で追加する計画を立てます。

まず、バースト単位でサブユニット周波数を前処理して(平均周波数、周波数トレンド)ペアのようなものにします。これをOLSで行い、周波数平均とトレンドをモデル化します。サブユニット自体ではなくバースト。または、サブユニットの数が昆虫の疲労度に関連している場合は、(平均、トレンド、サブユニットの数)を実行できます。次に、ベイズ階層モデルを構築します。ここで、バーストの平均と傾向の分布は、記録の平均傾向によって決定され、これは、位置の平均傾向によって決定されます。

次に、温度を記録平均/傾向の要素として追加します。

この単純なモデルにより、温度と場所によって決定された、記録内の個々のバーストの平均と傾向を確認できます。これを試してみてください。

次に、バーストの平均周波数間の差(または、バースト間の静穏時間で除算することによる傾向)を、位置と記録によって決定される変数として追加することで、これを推定しようとします。次のステップは、記録内のバースト平均のARモデルです。

バーストの性質に関するいくつかの事前およびいくつかの非常に強力な仮定(すべての情報は平均と傾向によって与えられる)が与えられると、この基本モデルは次のことを教えてくれます。

  • バーストの平均周波数は、場所ごと、温度ごとにどのように異なりますか
  • バースト内傾向は、場所ごと、温度ごとにどのように異なりますか
  • アウトサイドバーストの傾向は、場所ごと、気温ごとにどのように異なりますか

このようなものが機能するようになったら、サブユニット自体をモデル化して、元のOLS推定を破棄するときがきたかもしれません。この時点でデータを見て、どのような時系列モデルが適合するかを把握し、(平均、傾向)ペアではなく、時系列モデルのパラメーターをモデル化します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.