タグ付けされた質問 「census」

14
名前からどれだけの情報を抽出できますか?
名前:最初に、おそらくミドルネームと姓。 公開されているデータセットを使用して、名前からどれだけの情報をマイニングできるか知りたいです。米国国勢調査データを使用して、低入力(入力によって異なります)の間のどこでも以下を取得できることを知っています。1)性別。2)レース。 たとえばFacebookは、それを正確に使用して、まともなレベルの正確さで、サイトのユーザーの人種分布を見つけました(https://www.facebook.com/note.php?note_id=205925658858)。 他に何が採掘できますか?私は具体的なものを探しているわけではありません。これは私の好奇心を和らげるための非常に自由な質問です。 私の例は米国固有のものなので、名前は米国にいる誰かの名前であると想定します。しかし、他の国で公開されているデータセットを知っている人がいれば、私もそれらを受け入れるだけではありません。 これがこの場所に適しているかどうかはよくわかりません。そうでない場合は、誰かが私をより適切な場所に案内してくれるとありがたいです。 これが面白い質問だといいのですが、これは適切な場所です!

3
1%マイクロデータサンプルを大規模に使用し、統計を小さな領域スケールで集計して、どのようにして小さな領域の人口調査マイクロデータをシミュレーションできますか?
個人レベルの多変量解析を、地理的集計の小さなレベル(オーストラリアの国勢調査区)で実行したいと思います。明らかに、プライバシーの理由から、これらの小さなレベルの集計では国勢調査を利用できないため、他の代替案を調査しています。関心のある変数のほとんどすべてがカテゴリカルです。自由に使える2つのデータセットがあります。 1%の国勢調査サンプルは、はるかに高いレベルの空間集約(人口が約190,000で、人口統計の空間分離が広大な地域)で利用できます。 小領域レベルで関心のある変数の度数分布表(500小領域、平均ポップ= 385、sd = 319、中央値= 355)。 これらの2つのデータセットを使用して、小区域の実際の人口にできるだけ近い小区域レベルでの人口分布をシミュレートするにはどうすればよいですか? これを行うための通常の方法があることを私は感謝しています。もしそうなら、教科書または関連する雑誌の記事へのポインタが非常に高く評価されます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.