統計的に有意なピークの確認


14

データセットxがあります。次の仮説をテストしたいと思いますピークがあります。つまり、が増加すると、最初に増加してから減少します。yxx yyxy

私の最初のアイデアは、とをSLR に収めることでした。つまり、前の係数が有意に正であり、前の係数が有意に負であることがわかった場合、仮説を支持します。ただし、これは1つのタイプの関係(2次)のみをチェックし、必ずしもピークの存在をキャプチャするとは限りません。x 2 x x 2xx2xx2

その後、私は発見考え、このような領域(の値ソート)、その間にあると、の二つの他の領域のような多くの点として少なくとも含むB、及びその ¯ Y B > ¯ Y Aそして¯ Y B > ¯ Y C大幅。仮説が当てはまる場合、そのような領域bの多くを期待する必要があります。したがって、bの数が十分に大きい場合、仮説を支持する必要があります。x b a c xbxbacxbyb¯>ya¯yb¯>yc¯bb

私の仮説に適したテストを見つけるために私は正しい道を進んでいると思いますか?または、私は車輪を発明しており、この問題に対して確立された方法がありますか?ご意見をお待ちしております。

更新。私の従属変数はcount(非負の整数)です。y


して滑らかに変化X?その場合、スムーザー(GAMなど)を含むモデルの近似を試みてから、近似したスムーザーの1次導関数とその信頼区間を計算できます。微分係数が増加する場合、減少する場合は答えがあります。yバツ
モニカの復活-G.シンプソン

回答:


6

スムージングのアイデアも考えていました。しかし、ノイズの多いデータのピークを検索する応答曲面法と呼ばれる領域全体があり(主にデータへの局所二次近似を使用することを含みます)、タイトルに「バンプハンティング」という有名な論文があります。応答曲面法に関する書籍へのリンクを次に示します。Ray Myerの本は特によく書かれています。バンプハンティングペーパーを見つけようとします。

応答曲面法:設計実験を使用したプロセスと製品の最適化

応答曲面法と関連トピック

応答曲面法

経験的モデル構築と応答曲面

私が探していた記事ではないが、ここでこれらのアイデアを扱っが高次元データに適用されることをジェリー・フリードマンとニック・フィッシャー非常に関連した記事。

ここにあるいくつかのオンラインのコメントと記事。

少なくとも私の反応に感謝してください。あなたのアイデアは良いものであり、正しい軌道に乗っていると思いますが、はい、あなたは車輪を再発明しているかもしれないと思います。


3
私はダウンボッターではありませんでしたが、SEサイトでの回答はコンテンツへのリンク以上のものであると予想されます。コンテンツを要約するか、要約応答を提供してから、コンテンツにリンクして詳細を確認することをお勧めします。
モニカの復活-G.シンプソン

2
(1)良いアイデアを示しているため、これを支持しています。(2)いくつかの解説があります。(3)自由に利用できる資料へのリンクなど、慎重に選択されたリンクでサポートされています。はい、リンクはよりきれいにフォーマットできるため、印刷上の見た目が悪いように見えます。しかし、投票の決定において、回答のその側面を重視しないように願っています。
whuber

1
@whuber Procastinatorの素晴らしい書式設定により、はっきりと読むことができた後に同意します。+1も。ここに十分な要約があり、いくつかのトピックは、基本的なアイデアとさらに読むための参照以外のものにはほとんど複雑すぎると思います。
エリック

5
@MichaelChernickは、私からの批判ではなく、人々が反対票を投じた理由を示していることに注意してください。特にPRIMに関しては、あなたの答えが正しかったと思うので、それが理由であるなら、私は彼らに反対します。PRIMでの発言について、Hastie et al(2009)に相談したところです。PRIMには2つのセクションがあり、PDFは無料で入手できるため、そのリンクを回答に追加することをお勧めします。
モニカの復活-G.シンプソン

1
@Nikitaあなたがテストしたい正式な統計的仮説は何ですか?最初に、これの大きな部分であるピークを見つける必要があります。ピークが単なるノイズの結果ではないことをテストしていますか?この問題を解決するためにどの文献が存在するのかはわかりませんが、私の考えでは、データに多項式回帰を当てはめることができます(おそらく局所的には2次関数)。それから、残差分散の推定値が得られます。二次項の統計的有意性は、ピークの有意性の検定になります。
マイケルR.チャーニック

1

あなたが私の質問に答えていない場合でも、私の推測が正しければ、スペクトルが平坦であることを示すために、周波数領域でのホワイトノイズのテストを探しています。したがって、このリファレンスではフィッシャーのカッパと呼ばれるフィッシャーのピリオドグラム検定を使用できます。リンクをご覧ください。

http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf

バートレットのテストもリファレンスに記載されています。ここで、帰無仮説を棄却すると、ピリオドグラムの重要なピークが見つかります。これは、時系列に周期的なコンポーネントが存在することを意味します。

テストは周波数領域にあり、ピリオドグラム縦座標を含むため、縦座標は帰無仮説の下でカイ2乗分布を持ち、独立しています。この特別な分布は、周波数領域への変換のためにのみ生じます。xが時間の場合、これは時間領域で機能しないか、または一般にysの分布は独立したカイ二乗ではありません。

m


y

yはカウントデータであり、xa連続説明変数とは何ですか?私の以前の提案はおそらくその場合はそうではありませんが、カウントモデルに関する多くの最近の文献があります。したがって、データと問題についてもう少し具体的になることができれば、解決策を示すことができます。
マイケルR.チャーニック

yx

私は確かにこれが役立つかどうかはないですが、キャメロンとTrivediのカウント回帰モデルについての本を出版し、ここでは2013年に出てくる第二版は、いくつかの情報とのリンクである:cameron.econ.ucdavis.edu/racd/count .html
マイケルR.チャーニック
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.