データベースにこのデータを保存する方法を決めるのに問題があります。それを行う最善の方法に関する提案はありますか?私はデータベースについて多くのことを知りません、私は付け加えるかもしれません。
データはそのようにフォーマットされていますが、列の数は4ではなく約240であるため、各日付には240の一意の値が関連付けられています。
Date/Time 200,00 202,50 205,00
2010.11.12 13:34:00 45,8214 43,8512 41,5369
2010.11.12 13:35:00 461,9364 454,2612 435,5222
また、行はDataSiteに関連付けられています。
最初に考えたのは、DataID(pk)、DataSiteID、ParameterID、Date、Valueのようなテーブルを作成し、DataSite、Parameter、Dateのインデックスを作成することでした。ParameterIDは、入力列ヘッダー(200,00 202,50 205,00 ...)を格納する別のテーブルを参照します。
私の第2の考えは、240奇数列すべてのテーブルを作成することでした。私は他にもいくつかの方法を考え出しましたが、それらもかなり不満足です。
私が最初の解決策で抱えている問題(それほど大きな問題ではありませんが、好きではありません)は、DateとDataSiteIDがその入力行の240個の値すべてに対して繰り返されるため、かなり多くの余分なスペース。
(上記のテキスト形式で)年間約40GBのデータが入り、データはDataSite、Parameter、Dateで検索されます。入ってくるデータの量は、おそらく1年程度で4倍になります。
良いアイデアはありますか?ありがとう、ジェームス
編集:これは時系列データであり、列は異なる波長での測定値です。データは比較的狭い波長範囲で分析する必要があります。将来のある時点で追加の波長が追加される可能性もあります。
編集:回答者のおかげで、私はそれを本当に感謝します:)私はおそらく500gb程度のテストデータでいくつかの実験を実行する時間を見つけることができると思います。結論を投稿します;)