一般公開されているデータのホスティングオプション


12

そのため、あなたは再現性のある研究のアイデアを支持し、人々がオンラインでデータを閲覧して利用できるようにしたいと考えています。問題は、それをどこでホストしていますか?

私の最初の傾向は、もちろん大学のサーバー上にあるプライベートWebスペースですが、これらのことは実際にはそれほど永続的ではありません-離れると、ディレクトリは消えるまで非常に短い時間開いたままになります。将来、人々がデータを使用および使用できるようにするための適切な設定はほとんどありません。

GitHubやSourceForgeなどを使用していますか?または別のサービス?

問題のデータは、非常に狭い関心のあるシミュレーションの出力です。そのため、InfoChimpsや他の公開データリポジトリのような場所が必ずしも適切だとは思いません。これは「このコードで物事を学ぶことができます!」さらに、「このペーパーの図3を複製できます」。



1
絶対に関連性-重複とは思わなかった理由を示唆する詳細を追加します。
フォマイト

@EpiGrad:どのような日付を考えていますか?研究プロジェクトに関連するソースコードである場合は、arXivプレプリントに添付できます。
ピョートルミグダル

@PiotrMigdal理想的には、データが通常の紙の引用の伝播などが機能するのに十分な長さで、数年間ぶらぶらできるようにしたいと思います。私のフィールドだけがそれを使用した場合は、arXivプレプリントに添付します;)
Fomite

@EpiGradはその後、多分検索には良い場所ですオープンデータ -オープン・サイエンスの側面としてmichaelnielsen.org/blog/open-science
ピョートルミグダル

回答:


4

1つの簡単なオプションはgithubです。

データとデータ分析コードを共有するために少し使用します。サイトでコードとデータを共有する他のいくつかの良い例はこの質問に記載されています

GitHubの利点

  • gitに慣れたら簡単にアップロードできます。バージョン管理のニーズに合わせてgitを使用してください。
  • シンプルな単一ファイルに要旨を使用できます
  • 他の人が単一または複数のファイルをアーカイブとしてダウンロードするのは簡単です
  • 十分な空き容量があります
  • ソースコードはインターネットで閲覧できます
  • もっと...

もちろん、githubはデータに最適ではありません。より永続的な機関リポジトリや、より深刻なアーカイブのための専用ツールを使用するメリットがわかります。


1
これは実際に私が行った解決策です。機関リポジトリの問題の一部は、私が所属している機関が流動的であり、ビッグデータウェアハウスの1つにとってデータが実際に十分に重要ではないことです。
フォマイト


2

学内の人々の可能性の1つは、キャンパスの図書館でホストされることが多いキャンパスデジタルリポジトリの使用です(私にとっては、出版物に付随するデータセットの論理的な場所です)。

人気のある(無料の)デジタルリポジトリはDSpaceで、私の知る限り、データセットをホストできます。しかし、これはあなたの機関の誰かがホストしなければならないサービスです。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.