タグ付けされた質問 「curves」

5
曲線間の類似性測定?
私は下の点の2つの順序セット---のものとの間の類似性の尺度を計算したいユーザーの下でのものと比較先生: ポイントは3D空間の曲線ですが、図のように2次元でプロットすると問題が簡単になると考えていました。ポイントが重複する場合、類似度は100%でなければなりません。

2
統計的に有意なピークの確認
データセットとxがあります。次の仮説をテストしたいと思いますピークがあります。つまり、が増加すると、最初に増加してから減少します。yyyxxxx yyyyxxxyyy 私の最初のアイデアは、とをSLR に収めることでした。つまり、前の係数が有意に正であり、前の係数が有意に負であることがわかった場合、仮説を支持します。ただし、これは1つのタイプの関係(2次)のみをチェックし、必ずしもピークの存在をキャプチャするとは限りません。x 2 x x 2xxxx2x2x^2xxxx2x2x^2 その後、私は発見考え、このような領域(の値ソート)、その間にあると、の二つの他の領域のような多くの点として少なくとも含むB、及びその ¯ Y B > ¯ Y Aそして¯ Y B > ¯ Y C大幅。仮説が当てはまる場合、そのような領域bの多くを期待する必要があります。したがって、bの数が十分に大きい場合、仮説を支持する必要があります。x b a c xbbbxxxbbbaaacccxxxbbbyb¯>ya¯yb¯>ya¯\bar{y_b}>\bar{y_a}yb¯>yc¯yb¯>yc¯\bar{y_b}>\bar{y_c}bbbbbb 私の仮説に適したテストを見つけるために私は正しい道を進んでいると思いますか?または、私は車輪を発明しており、この問題に対して確立された方法がありますか?ご意見をお待ちしております。 更新。私の従属変数はcount(非負の整数)です。yyy

1
PRの値が1つしかない場合、精度-再現率曲線を作成するにはどうすればよいですか?
コンテンツベースの画像検索システムを作成するデータマイニングの割り当てがあります。5匹の動物の画像が20枚あります。つまり、合計100枚の画像になります。 私のシステムは、最も関連性の高い10個の画像を入力画像に返します。次に、Precision-Recall曲線を使用してシステムのパフォーマンスを評価する必要があります。しかし、私はプレシジョンリコール曲線の概念を理解していません。私のシステムがゴリラ画像に対して10個の画像を返すとしましょう。ただし、ゴリラは4つだけです。返される他の6つの画像は他の動物のものです。したがって、 精度は4/10 = 0.4(関連性が返される)/(すべて返される) 再現率は4/20 = 0.2(関連性が返される)/(すべての関連) つまり<0.2,0.4>、カーブではなくポイントしかありません。曲線(つまり、ポイントのセット)はどのように作成しますか?返される画像の数を変更する必要がありますか(これは私の場合10に固定されています)?

1
時系列データの形状検出
私は時系列の大規模なコレクションを持っています-さまざまな場所で1年間に渡って15分ごと(1日に96回)に測定されました。 私は、各時系列を1年の各日に1つずつ、365個の小さな時系列に分割しました。これらの時系列を見ると、1日には確かに多くの異なる形状があります。いくつかは正弦波に見え、いくつかは一定であり、いくつかはランダムな確率過程のように見え、いくつかは放物線状に見え、いくつかはUのように見えます。 私がやりたいのは、これらの一般的な形状を見つけることができるアルゴリズムを使用することです。クラスタリング、およびクラスターの重心を使用して一般的な形状を定義することを考えましたが、これが正しいかどうかコミュニティに確認したいと思いました。これまでは、メトリックとしてダイナミックタイムワープを見てきましたが、そのメトリックには多くの計算が必要なようです。私も見つけた SEのhttp://mox.polimi.it/it/progetti/pubblicazioni/quaderni/13-2008.pdf。 また、曲線の形状に基づいて時系列クラスタリングを実行することは可能ですか?しかし、この質問は2010年からのものであり、古くなっている可能性があります。 私が持っていた別のアイデアは、次のようにフォーマットされた行列の固有分解を取ることでした: 行列は、i日目に観測されたすべての時系列の行列です。行列M_iのすべての行は、長さ96の時系列です。次に、365の固有分解を行い、固有ベクトルを共通の形状として使用します。これは合理的に聞こえますか?MiMiM_iiiiMiMiM_i ありがとう!

1
標準化された試験で採点曲線を上るのに、EXTRA正解が徐々に少なくなりますか?
私が座る試験の前年の評価曲線は次のとおりです。 試験にそれぞれ均等に重み付けされた100(または任意の数)の質問があるとすると、平均から離れるにつれて、パーセンタイルを上に移動するために余分な正解が少なくなりますか? たとえば、60パーセンタイルから70パーセンタイルに移動するのに、45パーセンタイルから55パーセンタイルに移動するよりも、正解が少なくて済みますか?もしそうなら、なぜですか? これを信じる私の理由は、同様にマークされた試験から私が持っている別の別の曲線にあるケースである: このグラフにはパーセンタイルが表示されていませんが、平均から離れるにつれて、パーセンタイルを上(または下)に移動するために必要な追加のマークが少なくなっているように見えます。注:1つのアスタリスクは4人の学生を表します。LHSの数値は、正解の生の質問の数を示しています。* しかし、これの正式な理由を考えることはできません(私の統計知識は限られています)。 それとも、試験で1マークを追加すると、最初に座っていた曲線の位置に関係なく、パーセンタイル曲線が同じ量だけ上に移動するのですか? 参考:この試験では、100のうち何%になるかによってABまたはCは得られません。それは単に学生をランク付けするので、たとえ回答の50%しか正しく得られなかったとしても、100パーセンタイル(または99.99th:これは常に私を混乱させます)が最高の学生になります。 あなたがなぜこれを知りたいのか疑問に思っているなら。私の試験には複数のセクションがあり、各セクションのパーセンタイルグレーディングを取得します。合計スコアは、各セクションの平均になります。したがって、私の質問への回答に応じて、試験のすべてのセクションで均等に勉強するかどうか(そして、たとえば55、55、55番目を目指す)、または最も強い科目に有利なように勉強を偏らせて、そのマークを押すかどうかを決定します迅速に」(そして45度目、45度目、80度目を目指して)、パーセンタイル曲線を上げます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.