軌道をベクトルにマップする方法は?


9

一連のユーザー向けに、この形式の一連のデータポイント(タイムスタンプ、緯度、経度)があります。各ユーザーは、ポイントAからポイントBに移動するときに軌道を持っています。AからBまでのポイントはいくつあってもかまいません。これらは、タイムスタンプに基づいて順序付けられたデータポイントです。さまざまな分析タスクを実行するベクトルとしてそれらを変換したいと思います。私が考えているのは、ターンを見て、それを次元として作ることです。もっとアプローチを教えてください。必要なのは、軌道全体を表す1つのベクトルです。軌道の1つの点のように考えてください。今、3D点のコレクションがあります。

軌跡類似検索を行いたいのですが。時間内に互いに接近している2つの軌道がある場合、それらは類似しています。自宅から午前9時に仕事に行くような感じで考えてください。午前9時10分に他の誰かが彼の仕事の家でもあり、あなたから少し離れています。uは同じ職場を持っているので、おそらく同じ軌跡をたどります。軌道の上に構築された分類子のようなもの。軌跡でアクティビティ検出を実行できます。また、送信元宛先分析も実行できます。


4
ベクトルへの変換の例を教えてください。数学的な観点から見ると、データはすでに3次元空間のベクトルのコレクションであり、明らかに別のものが必要です。したがって、この例は大歓迎です。
mpiktas 2013

1
また、実行する分析の種類も重要です。最初のステップとして、とにかく(単純にベクトル化された)パスにKarhunen-Loeve拡張を試してみます。これにより、パスの特徴をキャプチャするために必要な構造が「自動的に」構築されます。
クォーツ2013

編集は、重要な情報を要求する@Quartzによるコメントに応答しないと思います。どのような「さまざまな分析タスク」を検討しますか?
whuber

1
@Quartz異なる速度パターンで移動した同じ幾何学的曲線が私に関連しています
ギズゴック2013

回答:


1

動的なタイムワーピングから始めます。2つのポイント間の距離(緯度、経度)がある限り、このアプローチは機能します。動きの速度に合わせて調整します。たとえば、あなたと私は同じ村に住んでいて、同じ工場に通勤していますが、途中で喫茶店に立ち寄ります。到着するまでに時間がかかりますが、同じ道を進んでいるため、類似性の測定値は異なる時間スケールに合わせて調整されます。

これはあなたが考えていることとは異なります。軌道を表す1つの値(ベクトル)を考え出し、ベクトル間の距離を計算したいようです。中間ステップなしで、軌跡間の距離測定を直接使用することをお勧めします。


0

瞬間的なターン、つまり方向の変化のみを考慮する場合、これは次のタイムインスタンスでの位置を一意に定義するとは思われません-各ユーザーが一定の既知の速度で移動している場合を除きます(質問にこれを示すものはありません)。 。(球面、私は推測しますか?)サーフェスを横切って移動しているため、位置を一意に決定するには、少なくとも2番目の座標が必要になる可能性があります。なぜ単純に配列構築しないのですか?タイムスタンプをパラメータとしてユーザーごとに、これをベクトル連結します。ベクトル(または持っているのためのユーザーがタグ付けされた?あなたはまた、弧の長さを取ることができます[ xt ; yt ] 1 × 2 N [ xt yt ] 1 × 2 N × M M s t 2×N[x(t);y(t)]1×(2N)[x(t)y(t)]1×(2N×M)Ms(t)代わりにパラメーターとして移動パス。定期的なタイムスタンプです。それ以外の場合は、ルックアップのためにそれらのための別個のベクトルが必要になります。PS:統計のリンクが表示されません。これは相互検証に関連していますか?


0

ユーザーごとに、lat(t)とlong(t)の2つの時系列があります。私はそれが最も単純な表現だと思います-ターンの定義に変換することで物事を複雑にしようとはしません。これはより難しいだけでなく、最初の開始点について非常に注意し、それをどのようにでも異なるように扱う必要があります分析。(おそらくノイズも多いでしょう。)

緯度と経度の時系列としてデータを保持することで、最も可能性の高い使用のためにデータをシンプルに保つことができます-さまざまな時間ウィンドウでさまざまな時間ウィンドウを見ることができます-新しい時間ウィンドウの開始時に開始点を常に再計算する必要はありません分析されています。

すべてのユーザーの時系列緯度と経度がすべてまったく同じ時間にサンプリングされた場合、別の返信で述べたように、2つの時系列ベクトルを1つの長いベクトルに連結することができます。5つの時系列を持つ同様の例は、次のようになります
。次に、ユーザーごとに1つの長いベクトルがあり、パターン認識、距離測定、クラスタリングなどの他のベクトルと同じように分析できます。

ユーザー間の距離測定では、通常、アプリケーションに応じて加重フォームを使用します。たとえば、共通の目的地への収束に焦点を当てる場合、時間ウィンドウの終わりに向かって最も重みを増やします(ユークリッド計算、最大距離などのいずれを見ても)。

ただし、元の質問では、ユーザーごとにAとBのポイント数が異なる可能性があると言われています。そして、いずれの場合でも、同じサンプリング間隔であっても、時間が完全に同じではない可能性があります(サンプリングが異なる時間に開始されたため、定数が異なる場合があります)。さらに、一部のデータが欠落している可能性もあります。これらのいずれの場合でも、概念的には、各時系列を連続形式で考える必要があります。おそらくそれに曲線を適合させ、すべてのユーザーをまったく同じ時間にリサンプリングします。(これは、写真を縮小するときに写真分析で発生するリサンプリングに類似しています)。次に、緯度と経度の時系列ベクトルは同じ長さで、正確に同じ時間に対応します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.