「積分の平均」よりも良い名前はありますか?


12

私は私のビジネスが販売するスロットルポジションセンサー(TPS)をテストしており、スロットルシャフトの回転に対する電圧応答のプロットを印刷しています。TPSは、 90°の範囲の回転センサーであり、出力はポテンショメーターのようなもので、全開が5V(またはセンサーの入力値)で、初期開度が0〜0.5Vの値です。0.75°ごとに電圧測定を行うPIC32コントローラー備えテストベンチを構築し、黒い線がこれらの測定を接続しています。

私の製品の1つは、ローカライズされた低振幅の変動を理想的なラインから遠ざけてしまう傾向があります。この質問は、これらのローカライズされた「ディップ」を定量化するための私のアルゴリズムに関するものです。ディップを測定するプロセスの良い名前または説明は何ですか?(完全な説明が続きます)次の図では、プロットの左3分の1でディップが発生します。これは、この部分を通過するか失敗するかについてのわずかなケースです。

疑わしい部分の印刷

そこで、消化器感覚を定量化するために、ディップディテクタ(アルゴリズムに関するstackoverflow qa)を構築しました。最初は「面積」を測定していると思っていました。このグラフは、上記のプリントアウトと、アルゴリズムをグラフィカルに説明しようとする私の試みに基づいています。17〜31の間で13のサンプルが持続するディップがあります。

「ディップ」を拡大して表示されたサンプルデータ

deltasdeltas

deltasdydx

デリバティブの分析...?

deltasdeltas

0.7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2.0+1.5+1.0+1.2

23

緑色の線は、領域をディップの長さで割って得られたこれらの「平均値未満」の平均です。

23÷13=1.77

2.63.0

|deltasavg|>avg+stddev

Calc 1からほぼ20年が経ちましたので、簡単に話してください。しかし、これ教授が計算と変位方程式を使用して、レースでの方法を説明するのに似ています。次のターンへの加速が大きい競技者:前のターンをより速く通過する場合、初期速度が高いほど、速度(変位)の範囲が大きくなります。

それを私の質問に変換すると、緑色の線は加速、元のデータの2次導関数に似ているように感じます。

私はウィキペディアを訪れて、微積分の基礎と微分および積分の定義を読み直し、数値積分としての個別の測定により曲線下の面積を加算するための適切な用語を学びました。積分の平均でさらに多くのグーグル検索を行うと、非線形性とデジタル信号処理のトピックにつながります。積分を平均化することは、データを定量化するための一般的なメトリックのようです

1.77


「平均ディップ」で十分だと思います。それは加速の次元を持っていないので、それは確かにそれとは何の関係もありません。
シュリーバツァー

そして、このトピック全体についての観察やコメントをいただければ幸いです。この「直感」の測定が数学的にうまく表現されていないことに少し不安を感じています。
クリスK

理想的なラインを構築するために使用したすべてのデータポイントを追加するか、赤いバーがどのように計算されて青いバーが「すべての平均を下回るデルタデータポイント」?道徳的に平均からの平均距離である場合は、加速スタイルの名前が必要です。もちろん、差別化は平均を取ることで置き換えられます。

1
:OP要求によってMath.SEから移行meta.stats.stackexchange.com/questions/1845/...
ウィリー・ウォン

1
ステップ1が存在することを明確にするために「ローカル」という言葉を追加することがあります。これは重要であると@Glen_b(別のグレン-こんにちは!)に同意します。したがって、「理想からの逸脱」を「欠陥」に連結した「ローカル平均欠陥」を暫定的に提案します。適切なようです。
グレンウィーラー

回答:


3

まず第一に、これはあなたのプロジェクトと問題の素晴らしい説明です。そして、私はあなたの手作りの測定フレームワークの大ファンです。それはとてもクールです...では、一体なぜあなたは「積分の平均化」と呼ぶものが重要なのでしょうか?

x[n]>αSD(x[1:n1])=>x[n] is outlier
x[n]nthSD(x[1:n1])1st(n1)thαh
x[n]>αSD(x[nh1:n1])=>x[n] is outlier

x[n]

また、デバイスを障害として分類するために考慮する必要のある他のルールもあります。

  • 偏差(デルタ)がすべてのデルタのSDの倍数より大きい場合
  • 偏差の二乗和が特定のしきい値より大きい場合
  • 正のデルタと負のデルタの合計の比率がほぼ等しくない場合(単一方向の強いバイアスよりも両方向の小さなエラーを好む場合に便利です)

もちろん、より多くのルールを見つけてブールロジックを使用してそれらを連結することもできますが、上記の3つを使用すると非常に遠くまで到達できると思います。

最後に重要なことですが、一度設定したら、分類子をテストする必要があります(分類子は、入力をクラスに、場合によっては各デバイスのデータを「良好」または「不良」)。各デバイスのパフォーマンスに手動でラベルを付けて、テストセットを作成します。次に、ROCを調べます。これは、基本的に、システムがピックアップした障害デバイスの数に関連して、システムが返されたデバイスから正しくピックアップしたデバイス数の間のオフセットを示します。


「いったいなぜそれが重要なのか」は、あなた自身のユーザー名の関数だと思います。:) なぜ?腸骨紋がある同じ理由:私たちは人生でユニークなすべてを明確に定量化するために言葉が必要です。私見、このQAは、統計内の語彙がどれだけ制限されているかの例です。私たちは、「目に見える」ものが非常に単純なために、混乱したり矛盾した記述子を組み合わせる必要があります。
クリスK

へへ、よく発見されたサー!:)創造的なブランドの土地へのベンチャーを省略したのは、無駄なラベルを作成するのではなく、あなたの努力とアイデアの機知と献身を支援することを強いられたからです。あなたは積分の平均に名前を付けることを主張しているので、あなたが「積分の平均」と考えるものはあなたのデルタの単純な平均であることに注意してください。そして、そのように、あなたの外れ値は単に「平均からの偏差」、またはおそらくローカル平均からの逸脱です。十分なサンプリングポイントがない場合を除き、積分で考えることの利点はあまりわかりません。
意味する意味14年
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.