私は、適切なサイズの時系列データを処理することが多く、タイムスタンプが5億から2億倍になり、タイムスタンプを動的に視覚化したいと考えています。
これを効果的に行うための既存のソフトウェアはありますか?ライブラリとデータ形式はどうですか?ズームキャッシュは、大規模な時系列に焦点を当てたライブラリの一例です。ズームキャッシュでは、さまざまな解像度で見やすくするために、データがいくつかの解像度で要約されます。
編集:また、この質問をするか、答えを探す必要がある場合は、お知らせください。
私は、適切なサイズの時系列データを処理することが多く、タイムスタンプが5億から2億倍になり、タイムスタンプを動的に視覚化したいと考えています。
これを効果的に行うための既存のソフトウェアはありますか?ライブラリとデータ形式はどうですか?ズームキャッシュは、大規模な時系列に焦点を当てたライブラリの一例です。ズームキャッシュでは、さまざまな解像度で見やすくするために、データがいくつかの解像度で要約されます。
編集:また、この質問をするか、答えを探す必要がある場合は、お知らせください。
回答:
大規模な時系列データセットを処理する方法のいくつかの例を提供するTimeSearcher 1--3と呼ばれる一連のリサーチツールがあります。以下は、TimeSearcher 2および3の画像の例です。
自己宣伝は申し訳ありませんが、Thunderplot(thunderplot.com)はその候補として適しています。大規模なデータセットのインタラクティブなプロット用に正確に記述しました。200KK行のデータセットではテストしませんでしたが、〜10KK行で正常に動作しました。また、「N番目の行ごとに読み取る」機能があるため、格納/視覚化するデータの量を減らすことができます。これらの大きなデータセットの1つと引き換えに、登録キーを送信できます。:-)
私がこの会社で働いているため、もう1つの自己宣伝ポストですが、SensorCloud(sensorcloud.com)は、スマートアルゴリズムを使用して大規模なデータセットを非常にすばやくグラフ化します。もともとは物理センサーを念頭に置いて設計されましたが、時系列データを処理するためのCSVアップローダーが用意されています。
たとえば、1,000億のデータポイント(1テラバイトのタイムスタンプ+データ値)を含むデータセットをアップロードし、それをグラフ化して非常にすばやく操作できます。
そのデータセットへの公開リンクは次のとおりです。https: //sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/
上記のリンクはフラッシュビューアを使用しています。Flashを使用したくない場合は、JavaScriptビューアを使用してください。https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/js/
スクロールホイールを使用するか、Shift +左クリックしてズームインします。