可変長の特徴ベクトルを扱う


8

サイズが異なる可能性がある特徴ベクトルをどのように処理しますか?

オブジェクトごとに、4つの特徴を計算するとします。特定の回帰問題を解決するために、これらのオブジェクトを1つ、2つ、またはそれ以上(10以下)持つ場合があります。したがって、特徴ベクトルの長さは4 * Nです。これは通常どのように対処されますか?

オブジェクトは、オブザーバーに関する物理的なオブジェクト(他の人など)を表します。タイムスライスの場合、オブジェクトは横方向、縦方向に配置でき、ある程度の速度と方向を持ちます(4つの機能)。解決しようとすること:人が最も快適に感じる場所。オブジェクトが1つしかない場合もありますが、2つ以上ある場合もあります。

免責事項:私はMLアプローチについての知識が限られています。私は何年も前に大学で授業をしていて、Andrew NgのMLコースを復習としてオンラインで受講しましたが、それ以外の点ではスピードが出ませんでした。見てみるところに感謝します。


オブジェクトとは何か、回帰問題とは何かについてもう少し詳しく教えてください。これは、機能のエンコードの処理方法に影響する可能性があります。
イムラン2018

@Imranオブジェクトは、オブザーバーに関する物理的なオブジェクト(たとえば、他の人々)を表します。タイムスライスの場合、オブジェクトは横方向、縦方向に配置でき、ある程度の速度とある程度の向きを持ちます(4つの機能)。解決しようとすること:人が最も快適に感じる場所。オブジェクトが1つしかない場合もありますが、2つ以上ある場合もあります。
オットーナーム

@Emre元の質問を例で更新
Otto Nahmee

説明をありがとう。ラベル付けされたトレーニングセットがありますか。たとえば、誰かがこれらのオブジェクトに囲まれているシナリオのリストで、最も快適に感じる正しい場所にマークを付けていますか?
イムラン2018

@Imranまだ完全なセットではありません-これはまだ収集の段階にあるものです
Otto Nahmee '22

回答:


3

まずはコミュニティへようこそ!

質問については誤解があると思います。「オブジェクトごとに」4つのフィーチャを計算するとします。つまり、すべてのデータポイント(オブジェクト)は4つの機能で記述されます。したがって、機能の長さは変わりません。「サンプル/データポイント/オブジェクトの特徴を計算する」ので、ここで言うすべてのオブジェクトは4次元空間のポイントであるため、これを言っていることに注意してください。他に何か意味がある場合は訂正してください。

つまり、いくつかの行(オブジェクトの数)と4つの列を持つデータマトリックスがあります。

コンセプト全体についてより一般的です。いいえ、これは標準データを作成する有効な方法ではありません。標準データでは、オブジェクトが異なるスペースで定義されているとオブジェクトを調査できないため、列の数は常に同じです。多くのMLアルゴリズムは標準データでも機能します。つまり、特徴ベクトルのサイズが異なる場合、それらを使用することはできません。いわば概念的なものであり、オブジェクトに対して計算するフィーチャのサイズは変更できません。どうやって?顔から特徴を抽出したい。私が言うの目の色目の間の距離耳の間の距離を。私には3つの機能があり、私の研究に来た人は誰でも同じ機能のセットを計算します。特徴抽出プロセスが標準の場合、サイズはどのように異なる可能性がありますか?

しかし、非標準のデータでは、そのようなケースに終わる可能性があります。この場合、機能を標準化できます。たとえば、赤ちゃんの例として、ノードとエッジの数が異なるさまざまなグラフを想像してみてください。各グラフは、平均次数平均パス長ノード数で説明できます。次に、各グラフが3つの機能で説明され、アルゴリズムにフィードできます。

ただし、データを標準化したくない場合は(通常、情報が失われるため)、データについて詳しく説明する必要がある、調整された分析メソッドを見つける必要があります。

お役に立てば幸いです。

幸運を!


ありがとう!あなたは、と述べた標準的なデータでは、列の数は常に同じで、私は右のそれのように読んでいましたので、これは、同様の行に適用されると言うことになっている標準的なデータの列数行を常に同じですか
オットーナーム

1
いいえいいえいいえ...列の数は機能であるため、同じである必要があります。ただし、行数はデータのサイズです。10人、20人、または1人だけから3つの特徴を抽出できます。つまり、X、Y、Z座標でポイントを表示する場合、3ポイントまたは10ポイントを表示できます。それらは変化する可能性がありますが、X、Y、Zは固定座標です。
Kasra Manshaei、

ネットワークデバイスごとに異なる数のインターフェイスがあるというシナリオがあります。すべてのインターフェイスが異なるため、すべてのインターフェイスの平均をとることはできません。おっしゃるとおり、「テーラードアナリティックメソッド」を使用します。解決できない場合は、問題を明確に説明し、折り返しご連絡いたします。@KasraManshaei
debaonline4u

1
@ debaonline4u確かに!お手伝いさせていただきます!
Kasra Manshaei、

1

さて、可変数のオブジェクトの位置と速度を各トレーニング例にエンコードしようとしているようです。

これを行う1つの方法は、畳み込みニューラルネットワークへのチャネル入力として、トレーニング例ごとに2つの特徴平面を使用することです。最初のフィーチャプレーンは、そのオブジェクトの位置にある各オブジェクトの速度のxコンポーネントをエンコードし、2番目のフィーチャプレーンはyコンポーネントに対して同じことをエンコードします。

位置はオブザーバーに対してであると述べたので、オブザーバーは常に同じ場所にいると想定します。したがって、入力に追加情報を追加する必要はありません。

また、2つのオブジェクトを同じ場所に配置することはできないと仮定します。

たとえば、3x3の世界にいて、速度がそれぞれ(3,2)と(1,7)のオブジェクトが(0,1)と(2,2)にあるとします。この入力例は、次のようにエンコードできます。

[ 0 0 0
  3 0 0
  0 0 1 ]

[ 0 0 0
  2 0 0
  0 0 7 ]

ご覧のとおり、オブジェクトの数に関係なく、入力サイズは常に同じです。オブジェクトが増えると、ゼロ以外のエントリが増えます。

空間ネットで特にうまく機能するので、変換ネットを提案しましたが、バニラニューラルネットワークを最初に試したい場合は、入力形状を(m、3,3,2)から(m、12)にフラット化できます。


ありがとう、それはかなり興味深いアプローチです。入力の範囲を離散化しなければならないという制限はありますか?回帰問題で値が連続する可能性がありますが、連続値を表すためにここで実行できることはありますか?
Otto Nahmee
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.