機械学習手法を使用した時系列センサーデータのモデリング?


7

私は大気質センサーに取り組んでいます。そのうちのいくつかは電気化学ガスセンサーです。背景として、これらのセンサーは、バイアス電圧を印加し、センサーを流れる電流を測定するポテンシオスタット回路によって刺激されます(通常、ナノアンペアのオーダー)。センサーを流れる電流の量は、センサーがさらされたターゲットガスの濃度に関係します。電流はまた、圧力、相対湿度、温度、およびクロスセンシティブなガスへの曝露にも関連しており、私の存在の悩みの種です。

従来、データモデリングアプローチを使用して、センサーから測定された電流をセンサーメーカーの推奨に基づいてターゲットガスの濃度として解釈していました。これを行うには、清浄な空気に対する応答を温度範囲で測定し、その特性を使用して、特性評価されたベースライン応答からの偏差をターゲットガスへの暴露に起因すると解釈します。

参照機器も、制御された濃度のガスにセンサーをさらす手段もないため、そのモデルの品質を実際に評価する手段はありませんが、センサーを対象のガスに順番にさらすことができますターゲットガスにかなり反応していることを確認します。

私が経験している課題は、前述の特性化によってパラメータ化されたデータモデルが長期間(つまり1週間)にわたって、温度、相対湿度、および圧力の自然変動の下で清浄な空気にさらされると、不合理に大きい解釈された濃度の変動。うるさくはありませんが、ドリフトします。そのため、データモデルが非常に不足していると思います。

そのため、アルゴリズム(機械学習)アプローチがより良い結果をもたらす可能性があると私は思いました。清浄な空気条件下での温度、相対湿度、圧力、およびセンサー電流(すべて実数値)の1分の解像度データがある場合、センサー電流を温度、相対湿度の関数としてモデリングするのに最適なツールはどれですか。と圧力?私が最も心配しているのは、入力空間の妥当な断面を表す条件を実際に作成できないことです。

次に、従来のデータモデルを使用して、予測ベースラインからの偏差を解釈し、ガス濃度を推定します。

片側の注意点は、温度と相対湿度は物理的に相関しているということですが、絶対湿度を温度、相対湿度、および圧力から数学的に取り消すことができました。

更新/説明

これが上記から明らかでない場合、目標は、変化する圧力、湿度、および温度条件下の清浄な空気環境でセンサーによって生成されるベースライン電圧を推定できるようにすることです-その偏差を使用する手段としてターゲット種ガスの濃度を計算する際の対象信号として予測ベースライン。したがって、基本的には、計装ドメインで通常ゼロキャリブレーションと呼ばれるものに対する代替アプローチを調査しています。

対象種に関する真実のデータがあれば、予測ベースラインからの偏差に関するビジネスをスキップして、電圧、温度、湿度、および圧力の時間ベクトルから直接濃度を推定できる可能性があるようです。


1
PS私はここに新しいです、賛成投票は歓迎されます:-)
vicatcu

おそらく私はそれを逃したかもしれませんが、ここでのモデリング目標は何ですか?目標が異なれば、異なるアプローチが提案される場合があります。
Richard Hardy

@RichardHardy 2つのモデリング目標があると思います。1つ目は、一定の温度、湿度、および圧力が与えられた状態で、センサーが清浄な空気にさらされているときのベースライン電圧をモデル化することです。2つ目は、温度、湿度、圧力、および電圧を指定して、ターゲットタグ種の予測濃度をモデル化することです。真実のデータのソースがなく、対象種ガスの濃度を制御/調整する手段もないので、後者の目標にどのようにアプローチできるか明確な考えがありません。フィルターを介して露出を防ぐことができるので、以前の目標は具体的です。
vicatcu

正確なモデリングには、ほぼ確実に、モデルへの入力がすべての入力変数であり、ある程度の遅延があることが必要だと思います。
vicatcu

「モデル化する」それ自体は目標ではありません。私の質問は、モデルが何に使用されるのかについて説明します:説明、予測、仮説検定、...?
Richard Hardy

回答:


2

編集およびTL; DRバージョン:これはメディエーション/モデレーター分析の問題として扱うことができますが、それでもデバイスをキャリブレーションするには独立した測定が必要になります。

これは、機械学習ではなく、調停/モデレート分析の問題のように聞こえます。

M1を、p、v、および湿度の関数としての清浄な空気条件下での電圧のモデルとします。M1自体からの逸脱は、濃度の推定値にはなりません。ガスが存在し、センサーを妨害している可能性があります。ガスが電圧に影響する方法は他のパラメーターによって異なるため、特定の逸脱(残差値)は、p、v、および湿度のすべての値でターゲットガスの同じ濃度を示しません。同様に、たとえば2mVから4mVの逸脱は、濃度が2倍になったことを必ずしも意味するわけではありません。スケールは非線形であり、スケール自体は他の変数の影響を受ける可能性があります。つまり、測定値とM1によって予測された値の差を確認することをお勧めします。

実際の状況により近い、それを見る別の方法は、濃度を独立変数、センサー電圧を従属変数、p、t、ハムをモデレーター変数として見ることです。ただし、それを機能させるには、さまざまな濃度のガスを誘導し、さまざまなt、p、およびハムの値で測定を行う必要があります。

ここにいくつかのリソースがあります:

これは、クリスマス休暇中に楽しく、ほとんど哲学的な問題を見ることになるので、質問に追加したい実際のまたはシミュレートされたデータセットがある場合は、それを見てみましょう。

エピローグ

私はこの投稿とデータを測定のスペシャリストと測定理論のスペシャリストでもあるエンジニアに見せ、どちらも「校正機器を使ってスーツケースを手に入れよう」と言いました。それを回避する方法はありません。


瞑想分析とそれをどのように適用するかについて詳しく知ることができる優れたリソースへのポインタをいくつか教えてもらえますか?
vicatcu 2018

私は自分の回答を編集し、いくつかのポイントを修正し(調停とモデレートを混同)、いくつかのリンクを追加しました。
GuillaumeL

データセットを追加できます...このサイトでこれを行う一般的な方法はありますか?
vicatcu 2018

この質問によると、大っぽいデータセットを投稿する公式の方法があるように思えません。meta.stackexchange.com/questions/15821/...
GuillaumeL

1
データありがとうございます。回答を更新しました(エピローグのセクションをご覧ください)。
GuillaumeL
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.