ベンチマークGPS軌跡データセットが必要ですか?


13

研究目的で無料で利用できるベンチマークGPSデータセットを探しています。私が見つけたGeoLife GPS軌跡データセットのMicrosoft Researchから、私は少し不完全なそれを見つけます。

必要なのは、(緯度、経度、日付)タプルのように、少なくとも数か月間、できれば継続的に追跡される人のGPSアクティビティデータです。また、録音がスパースでないことを望みます。各レコード間で最大1分。

このような信頼性の高いデータセットを教えていただければ幸いです。


2
このデータセットは人間のものでなければなりませんか?(これまですべてをフレージングしてきた方法は、はいを意味しますが、明示的に述べられているとは思いません。)
ダンS.

回答:


17

あなたの一番のチャンスは自分を追跡することだと思います。アイデアが気に入らない場合、そのようなデータがどこにも公開されないのはそのためです。



4

私は息を止めません。このような精度のデータは大規模な取り組みであり、プライバシーに大きな影響を与えます(1人の個人が30日間でさえ、43,200個のデータポイント(毎分記録される場合)を含み、間違いなく自宅の場所を特定します)。

そのようなデータが保持するという実質的な質問に興味がある場合、このアドバイスは役に立ちません。しかし、このような大量のデータを処理するための何らかの分析戦略にのみ興味がある場合は、目的に応じてその規模でデータをシミュレートするだけで済みます。データをシミュレートするには、R統計プログラム、特にspatstattripパッケージ(およびRのすべての空間モジュール)を確認することをお勧めします。

動物追跡データがこのような短い間隔でのデータポイントの要件を満たす場合でも、私は懐疑的です。携帯電話のデータを使用して人間の活動パターンを推定するいくつかの記事をリストすることはできますが、私が読んだ記事のどれも、そのような長い時間に近づいたり、頻繁に個人の活動を測定したりすることはありません。


4

1つの選択肢は、契約を作成し、多くの人を雇うことです。必要なデータを提供する読み取り値を取得するように構成されたGPSユニット、契約を継続するのに十分なバッテリー、および指示を提供します(夜間にアップロードするには、このケーブルで接続し、このファイルをメールで送信します)。

データの分布を制限し、それを保護するために匿名化する方法を契約書に間違いなく記述する必要があります(おそらく、個人がプライベートであることを示すポイントの周りにおよそ半マイルの除外半径を提供します)。損失に対する保険の購入を検討してください。人々の活動の痕跡が公開されると、「毎朝7時に出勤し、毎晩19:00に帰宅する」などの情報でいっぱいになり、プロットは中央に巨大なアスタリスクのように見えます。 「この場所を8:00から18:00に奪う」と彼らの家で。プライバシーとセキュリティを心配する必要がある理由がわかります。

考えてみると、非常に高価なデータを要求しています。そして、統計的に十分な大きさのセットがなければ、疑わしい価値があります。建設労働者(建物が完成するたびに新しい反復通勤)、郵便運送業者(非常に反復的で非常に曲がりくねったルート)、オフィスワーカー(主に反復的な直接ルート)、およびレッカー車の間にどのようなトレースがあるかを考えてくださいドライバー(新しいルートが絶え間なくあります。)学齢期の子供の親は、仕事後の通勤距離が平均して高い場合があります。Google Street View車を運転する人は言うまでもありません。

これらのトレースはいずれも、意味のある方法で他のトレースと交差する可能性はありません。

ユニークなスタイルの数は有限である可能性がありますが、取得するにはかなりの予算が必要なほど多くなります。そして、それはたった1つの都市にあるでしょう。

目標をより適切に定義すれば、より小さな(より安価な)データセットを取得できる場合があります。さまざまなタイプのパターンを定量化しようとしている場合は、さまざまな都市の幅広い人々をサンプリングすることができます。誰が大量輸送の恩恵を受けるか、または通勤鉄道の通路をどこに置くかを把握しようとしている場合は、おそらく、サービスを提供し、調査を行う予定の周辺のさまざまな道路で車を数える方が良いでしょう。


2

あなたが探しているデータセットの正確なタイプも探しています。残念ながら、これまでのところ私はまだ見つけていません。GeoLifeデータにもかかわらず、私が見つけた別のソースはCRAWDADです。このサイトには、サンフランシスコのタクシーとニューヨークの歩行者からのGPSログがあります。残念ながら、NYCの歩行者には、緯度/経度ではなく相対座標のみが提供されます。


2

質問に答えるために必要なデータが道徳上の理由で利用できない多くの研究トピックがあり、これらの限界を超える実験は、ミルグラム実験の場合のように、将来の制限につながる可能性があります。最近では、AOLがプライバシーの懸念のために検索クエリのコーパスをプルする必要があり、電子メールの習慣に関する唯一の信頼できるデータセットはEnronトライアルからのものでした。

そのため、このような軌跡データセットを取得することは技術的には完全に可能ですが、プライバシーへの影響のために実用的ではない場合があります。他の回答で述べたように、プライバシーの問題を回避しながら、相対的なデータセット、個人に対する集計、またはシミュレーションはすべて、質問に対処するためのより良いアプローチかもしれません。



2

Open PFLOWプロジェクトは以下を提供します。

都市部における典型的な人々の集団運動のためのオープンデータセット

東京圏は利用可能であり、中京圏は準備中のようです。

詳細は最近の出版物にあります。

K山武弘、ヤンボ・パン、関本義秀、オープンPFLOW:都市部における一般的な人々の集団移動のためのオープンデータセットの作成と評価、輸送研究パートC:新興技術(2017)Volume 85、249〜267ページ。


T-Drive軌跡データセットは最近発見されました。以下を提供します。

10,357タクシーの1週間の軌跡。このデータセットのポイントの合計数は約1500万であり、軌跡の合計距離は900万キロメートルに達します。


人間の動きに関するものではありませんが、Liquid Robotics社はPacXチャレンジから興味深いデータセットを提供しています。太平洋を航行する4台のロボットグライダーの位置と環境センサーの測定値に関するデータをダウンロードできます。上の(本当にクール)プロジェクトについての詳細情報のブログを経由して、WIREDそしてこの話


プライバシーの問題に取り組む別のオプションは、動物追跡データを使用することです。ここでは、データ保護はそれほど問題ではないと思います。利点として、実世界の移動データを使用してソフトウェア/メソッドをテストできる場合があります。欠点は、アプリケーションが「人間固有の」動作を必要とする場合、目的に合わない可能性があることです。

MovebankまたはDRYADの Webサイトを見て、それらのデータの一部がプロジェクトに適合するかどうかを確認してください。


Matthewが言及したiphoneデータに関しては、crowdflowおよびopenpathsプロジェクトを見ることができます。おそらくそれらを介してデータを取得する方法はありますか?更新:両方のリンクは現在無効になっているようです。


さらに別のオプションは、Chris WhongのNYCタクシーデータの空間部分です。ピックアップとドロップオフの場所のみを提供しますが、ボリューム(11 GB!)とコンテキスト情報(運賃、乗客など)が非常に魅力的です(代替ダウンロード、データによって提起されたプライバシーの懸念に関する詳細情報)。


「ボランティアの運動データとコンテキスト情報からの人間の移動性の分析」の約束に関する最近の論文へのUrškaDemšarの投稿:

また、このペーパーにリンクされた自発的なGPS軌跡の無料データセットも近日中に利用可能になります。乞うご期待。

詳細

アップデート:紙が上のデータが利用可能になると述べてCRAWDADが挙げ@ejelが、私のhaventははそれをそこに見つけました。


別のオプションは、合成データセットを自分で作成することです。あなたは、複数の移動ウィンドウでGPSデータから活動トラベルポイントを識別バンダイクJ(2018)による最近の論文で、いくつかのインスピレーションを見て必要な場合は コンピュータ、環境と都市システムリンク)。詳細は論文の付録に記載されており、コードとサンプルのデータセットはgithubで入手できます。


1

Tahina Expedition(Google Earthブログ)http://www.tahinaexpedition.com/map は、昨年の大半を航海しています。

KMLを処理できますhttp://maps.google.com/maps/ms?source=embed&hl=ja&geocode=&ie=UTF8&t=k&msa=0&output=nl&msid=103005318482134016767.0004670ab348ba9fa7b1f [gpsトラックはkmlに変換されました]


@Mapperez-Mapperezに感謝しますが、必要なのは少し異なります。陸上にいる人の毎日、毎分記録されたGPSポイントが欲しいです。起きている、仕事に行く、そこで何時間も過ごす、買い物に行く、家に帰る、繰り返すなど、毎日のルーチン(ある程度ルーチン)を持つ人。
ミュラ

1

そのデータは24時間無料でGoogleに提供されます。Latitudeと呼ばれます。たぶん彼らはユーザーが彼らと共有したのと同じくらい寛大にそれを共有するでしょう。


1
私は確かに彼らがそうしないことを願っています。@Muratのアプリケーションに必要なレベルのデータをリリースすることは許可されないと確信しています。
暗闇
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.