「等間隔の」サンプルから始まるユニットディスクの回帰


9

ユニットディスク上の複雑な回帰問題を解決する必要があります。元の質問は興味深いコメントを集めましたが、残念ながら回答はありませんでした。それまでの間、この問題についてさらに多くのことを学びました。したがって、元の問題をサブ問題に分割して、今回の運が良かったかどうかを確認します。

ユニットディスク内の狭いリングに規則的に配置された40個の温度センサーがあります。 ここに画像の説明を入力してください

これらのセンサーは時間内に温度を取得します。ただし、時間の変動は空間の変動よりもはるかに小さいため、時間の変動を無視して問題を単純化し、各センサーが時間平均のみを与えると仮定します。これは、40のサンプル(各センサーに1つ)があり、繰り返しのサンプルがないことを意味します。

センサーデータから回帰曲面を作成したいと思います。回帰には2つの目標があります。T=f(ρ,θ)+ϵ

  1. 平均半径方向温度プロファイルを推定する必要があります。線形回帰では、平均温度面である面をすでに推定しているので、に関して面を統合するだけでよいのですよね?回帰に多項式を使用する場合、この手順は簡単なはずです。Tmean=g1(ρ)+ϵθ
  2. 放射状の温度プロファイルを推定する必要があります。これにより、各放射状の位置でます。T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

これら2つの目標を踏まえて、ユニットディスクの回帰にはどの手法を使用すればよいですか?もちろん、ガウスプロセスは一般的に空間回帰に使用されます。ただし、ユニットディスクの適切なカーネルの定義は簡単なものではないため、失う戦略だと思わない限り、物事を単純に保ち、多項式を使用したいと思います。ゼルニケ多項式について読みました。ゼルニケ多項式は周期的であるため、単位ディスクの回帰に適しているようです。θ

モデルを選択したら、推定手順を選択する必要があります。これは空間回帰問題であるため、さまざまな場所でのエラーは相関させる必要があります。通常の最小二乗法は相関のないエラーを想定しているため、一般化された最小二乗法がより適切だと思います。gls標準R分布に関数がある場合、GLSは比較的一般的な統計手法のようです。しかし、私はGLSを使用したことがなく、疑問があります。たとえば、共分散行列をどのように推定しますか?少数のセンサーを使用したとしても、うまくいった例は素晴らしいでしょう。

PS私はゼルニケ多項式とGLSを使用することを選択しました。これは、ここで行うのが論理的であるように思えるためです。ただし、私は専門家ではありません。私が間違った方向に進んでいると感じた場合は、完全に異なるアプローチを自由に使用してください。


この図では、エンジンは完全な放射対称性を持っているものとして示されています。しかし、軸の位置はエンジンの物理的特性に関連していますか、それとも本当に任意ですか?2番目のケースでは、変数は特定のエンジンとの関連でのみ意味を持ちます。θ
Yves

回答:


2

あなたはゼルニケ多項式のようなものについて考えるのに正しい道を進んでいると思います。jwimberlyの回答で述べたように、これらはディスク上の直交基底関数のシステムの例です。私はゼルニケ多項式に精通していませんが、直交関数(ベッセル関数を含む)の他の多くのファミリーは、古典的な数理物理学で特定の偏微分方程式の固有関数として自然に発生します(この執筆時点では、リンクの上部にあるアニメーションでもは、振動ドラムヘッドの例を示しています)。

2つの質問が思い浮かびます。最初に、すべてが放射状プロファイル(平均)である場合、空間パターンにどのくらいの制約が必要ですか?第二に、時空間データにはどのような種類の変動が発生するのでしょうか。θ

最初の質問に関して、頭に浮かぶ2つの懸念があります。極座標のため、各センサーのサポート領域には傾向があります。2番目の懸念事項は、エイリアシングの可能性です。本質的に、パターンの位相に対するセンサーの位置ずれです(フーリエ/ベッセルのアナロジーを使用するため)。エイリアシングは、ピーク温度を制限する際の主要な不確実性であることに注意してください(つまり、)。rT95

この2番目の質問に関しては、データの変動性が実際にエイリアシングの問題を解決する可能性があり、本質的にミスアライメントをさまざまな測定値で平均化することができます。(体系的なバイアスがないと仮定します...しかし、それは、例えば、より多くの情報を与えるための物理モデルがないと、どの方法にとっても問題になります)。

したがって、1つの可能性は、空間直交関数を純粋にセンサーの場所で定義することです。これらの「経験的直交関数」は、PCAを介して時空間データマトリックスで計算できます。(おそらく、センサーのサポート領域の変化を考慮に入れるために、いくつかの重み付けを使用できますが、均一な極グリッドと動径平均のターゲットが与えられた場合、これは必要ない場合があります。)

高密度の時空間計算グリッドで利用可能な、温度の「予想される」変動に利用可能な物理モデリングデータある場合、同じPCA手順をそのデータに適用して、直交関数を導出できます。(これは通常、エンジニアリングでは「適切な直交分解」と呼ばれ、モデルの削減に使用されます。たとえば、高価な計算流体力学モデルを蒸留して、さらなる設計活動で使用できます。)

最後のコメントです。センサーデータをサポートエリア(極座標セルサイズ)で重み付けした場合、これはGLSのフレームワークにおける一種の対角共分散になります。(重み付けされたPCAは密接に関連しますが、これは予測問題により当てはまります。)

これが役に立てば幸いです!

更新:センサー分布の新しい図は、私の見解ではかなり変化しています。ディスク内部の温度を推定する場合は、単純に「ユニットディスク上の直交関数のセット」よりもはるかに多くの情報が必要になります。センサーデータの情報が少なすぎます。

実際にディスク全体の空間温度変動を推定する場合、問題をデータ同化の 1つとして扱うことが、私が理解できる唯一の合理的な方法です。ここでは、いくつかの物理学ベースの考慮事項に基づいて、空間分布のパラメトリック形式を少なくとも制約する必要があります(これらはシミュレーションから、または同様のダイナミクスを持つシステムの関連データからである可能性があります)。

私はあなたの特定のアプリケーションを知りませんが、それがこのようなものであれば、適切な事前の制約を選択するために利用できる広範な工学文献があると想像します。(この種の詳細なドメインの知識については、おそらくこれは頼むのに最適なStackExchangeサイトではありません。)


印象的な答え!消化するのに時間が必要です。2つの質問をします。最初の質問を理解しているかわかりません(「空間パターンにどれだけの制約が必要ですか?」)。40個すべてのセンサーからのデータを使用する方が、円周方向に沿って平均するよりも良いと思いました。次にフィッティング...これは必ずしも本当ではないということですか?2番目(「時空間データで発生する変動の種類」)については、次の1〜2日で最初のエンジンを分析します(実際には5つありますが、これはトピックのトピックになります)将来の質問...)ctd ...
DeltaIV 2016

... ctd、私はデータを正規化し、公開サイトで公開できるものを確認します。いくつかの空間パターンといくつかの時系列...私はそれらがあなたが何を求めているかについてあなたにアイデアを与えるべきだと思います
DeltaIV 2016

1
最初の質問について:最終的な目的が基本的に「新しいエンジンのセンサー結果を予測する」ことである場合(他の質問から推測)、本当に「センサー間」からの情報が必要ですか。エイリアシングに関する私のコメントは、がセンサーで確実に測定されない場合など、そのような情報必要になる理由の例でした。T95
GeoMatt22

1
ところで、これが設計上の問題であり、関連するCFDタイプのシミュレーションがある場合、それは現在の質問で示唆されているよりもはるかに多くの情報です。(たとえば、データ同化として問題にアプローチするには、異なるアプローチを使用する場合があります。)
GeoMatt22

あなたの答えは私に考えさせます:回帰の代わりに、実行可能な離散フーリエ変換のいくつかの2d同等物はありますか?たとえば、データポイントの積分とn番目のベッセル関数(適切に変更された)を掛けてから、直交分解を取得しますか?ここでの懸念は、1)おそらく回答と同じ行に沿って、適切な離散化関数を見つけること、および2)これが少数のサンプリングポイントに敏感すぎて、分解がより複雑な高次項に頼るかどうかです。 。
jwimberley 2016

2

Zernlike多項式は、と依存性と直交性が既に組み込まれているので、悪い選択のように聞こえません。しかし、温度を研究しているので、おそらくより適切でよく知られている選択は、ベッセル関数です。これらは、円筒形のオブジェクト/座標系の熱流の研究で登場するため、物理的に適切である可能性があります。n番目のベッセル関数は、極依存の対応する三角関数に関連付けられた動径依存を与えます。詳細は、多くの物理学とPDEの教科書に記載されています。rθ


(+1)極座標の熱方程式接続が適切です。おそらく言及する価値のあるもう1つの点は、私が長方形グリッドでよく知っているガウスプロセスの場合、共分散行列が循環し、実際にはFFTが使用されることです。したがって、ベッセル関数は、極座標グリッドでの同様のアプローチの候補となりそうです。
GeoMatt22、2016

面白い提案!ただし、私はエンジンの固体部分ではなく、作動流体の温度を測定しています。したがって、伝導問題ではなく、対流問題に興味があります。ベッセル関数は確かに熱伝導(フーリエ)方程式の解ですが、対流は流体の流れ場に依存するため、熱対流方程式の解でもないと思います。とにかく、私は少なくともそれらをゼルニケと比較してテストすることができました。GLSはどうですか?質問のその部分にも何か追加できますか?
DeltaIV 2016

@DeltaIV私はGLSにあまり詳しくありませんが、1つの質問-なぜ、エラーが異なる空間点で相関していると予想するのですか?実際の変動はポイント間で相関することに同意しますが、エラー(つまり、センサーの読み取り値の不確実性)は相関しないと思います。おそらく、回帰変動はエラーとしてカウントされますか?ただし、ペナルティ条件について何か追加することを検討しています。使用する基準が何であれ、サンプリングポイントの数は有限であり、非常に高次の一致するベッセル関数が見つかる可能性があるため、最低次の項を優先する必要があります。
jwimberley

@DeltaIV再び変動に関して、空間点間に相関を導入します。オブジェクトは温度マップを取得することですよね?発生している変動を確認したくないですか?また、変動は流体力学によって引き起こされ、空間と時間は複雑になるため、統計モデルでそれらを考慮することもできますか?(これは、単純化のために中断した分析の時間依存部分に関連していますか?)
jwimberley

ギャラリーチャットが作成されました
DeltaIV 2016
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.