回答:
スタンフォード大規模ネットワークデータセットコレクションSNAPをご覧ください。
Facebookページの大きなインデックスが作成され、トレント(〜2.8Gb)として利用可能ですhttp://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
TwitterデータセットはInfochimpsでタグ付けされています:http ://infochimps.com/tags/twitter
ちょうどこれを見つけました:4億7600万のTwitterツイート(@yarapavan経由)。
2009年にユーザーの友人向けにTwitterデータセットをキュレートしました。2009年に詳細を確認できます。詳細については、http://strict.dista.uninsubria.it/?p = 364をご覧ください。
Facebookソーシャルグラフ、アプリケーションのインストール、Last.fmユーザー、イベント、グループ( http://odysseas.calit2.uci.edu/research/)
Facebook全体で約100万人のユーザーの代表的なサンプルを含む2つのデータセット(2009年4月から5月に収集)。いくつかの注釈付きプロパティがあります。3番目のデータセット(2008年2月に収集)には、Facebookユーザーによるアプリケーションのインストールを表す2部グラフが含まれています。6か月にわたる毎日のアクティブユーザーとアプリケーションのインストールを含む4番目のデータセット(2007年9月から2008年2月に収集)。マルチグラフサンプリングを使用して取得したLast.fmユーザーの代表的なサンプルを含む5番目のデータセット(2010年7月収集)。
このホワイトペーパーでは、こちらから入手できるfacebookデータセットを使用しています。著者の説明は次のとおりです。
データには、2005年9月の1回限りのスナップショットからの100の米国の大学からのノードとリンクの完全なセット(およびいくつかの人口統計情報)が含まれています。