タグ付けされた質問 「social-network-analysis」

2
データサイエンスでの倫理の適用方法
最近、ユーザーの感情を変えることができるかどうかを確認するためにユーザーを実験しているFacebookで激しい論争がありました。 私はプロのデータ科学者ではありませんが、キャシー・オニールの本「Doing Data Science」からデータ科学の倫理について読んでおり、これが専門家が学術レベルで教えられているものかどうかを知りたいです(私はそう期待します)無視されるか、プロの世界で軽く適用されます。特に誤ってデータサイエンスを行うことになった人たちにとって。 リンクされた記事ではデータの整合性について触れましたが、この本では、作成されたデータモデルの影響と、不適切に(時には無意識に)使用されたり、モデルが不正確で、やはり不利な結果を生む。 この記事では、実践規範について説明し、データサイエンス協会の行動規範に言及していますが、これは使用されているものですか?ルール7は特に興味深い(ウェブサイトから引用): (a)問題に関してクライアントとデータの科学者の関係を形成する可能性についてデータ科学者と相談する人は、見込み顧客です。 (b)クライアントとデータの科学者との関係が続かない場合でも、見込みのあるクライアントから情報を学んだデータ科学者は、その情報を使用または開示してはなりません。 (c)パラグラフ(b)の対象となるデータサイエンティストは、データサイエンティストが見込み客から情報を受け取った場合、同じまたは実質的に関連する業界の見込み客の利益に実質的に不利な利益をクライアントに専門のデータサイエンスサービスを提供してはなりませんそれは問題のその人に著しく有害である可能性があります これは専門的に実践されているものですか?多くのユーザーは、私たちが何らかの無料サービス(メール、ソーシャルネットワーク、画像ホスティング、ブログプラットフォームなど)を利用していることを盲目的に受け入れ、広告を私たちにプッシュするためにEULAに同意します。 最後に、これはどのように規制されていますか?サービスの条件が変わったときにユーザーが武装していることをよく読みますが、何かが起こる前にそのようなことに反応するためにいくつかの自由組織、集団訴訟または上院議員が必要であるようです。 ちなみに、ここで判断を下したり、すべてのデータサイエンティストがこのように振る舞うとは言っていませんが、学術的に教えられ、専門的に実践されていることに興味があります。

1
Neo4j対OrientDB対Titan
私は社会関係マイニングに関連するデータサイエンスプロジェクトに取り組んでおり、いくつかのグラフデータベースにデータを保存する必要があります。最初は、データベースとしてNeo4jを選択しました。しかし、Neo4jの継ぎ目はうまく拡張できません。私が見つけた代替手段は、TitanとoriebtDBです。これら3つのデータベースについてこの比較を行ってきましたが、これらのデータベースについてさらに詳しく知りたいと思います。だから、誰かが最高のものを選ぶのに私を助けることができますか?主に、これらのデータベースのパフォーマンス、スケーリング、利用可能なオンラインドキュメント/チュートリアル、Pythonライブラリのサポート、クエリ言語の複雑さ、グラフアルゴリズムのサポートを比較したいと思います。他にも良いデータベースオプションはありますか?

7
LinkedIn Webスクレイピング
LinkedIn APIに接続するための新しいRパッケージを最近発見しました。残念ながら、LinkedIn APIはそもそもかなり制限されているようです。たとえば、企業の基本データしか取得できず、これは個人のデータから切り離されています。特定の会社のすべての従業員に関するデータを取得したいのですが、これはサイトで手動で行うことができますが、APIからはできません。 import.ioは、LinkedInのページネーションを認識していれば完璧です(ページの終わりを参照)。 LinkedInの現在のフォーマットに適用可能なWebスクレイピングツールやテクニック、またはより柔軟な分析を実行するためにAPIを曲げる方法を知っている人はいますか?できればRまたはWebベースですが、他のアプローチも可能です。

3
ソーシャルネットワークの成長をアニメーション化する方法
新しいノード/エッジが追加されたときにソーシャルネットワークがどのように変化するかを視覚化するライブラリ/ツールを探しています。 既存のソリューションの1つは、SoNIA:Social Network Image Animatorです。このような映画を作ってみましょう。 SoNIAのドキュメントには、現時点では壊れていると記載されています。これに加えて、代わりにJavaScriptベースのソリューションを使用することをお勧めします。だから、私の質問は:あなたは任意のツールに精通していますか、またはこのタスクをできるだけ簡単にするいくつかのライブラリを私に示すことができますか? この質問を投稿したらすぐにsigma.jsを掘り下げますので、このライブラリがカバーされていると考えてください。 一般的に、私の入力データは次のようになります。 time_elapsed; node1; node2 1; A; B 2; A; C 3; B; C したがって、ここでは3つの時点(1、2、3)、3つのノード(A、B、C)、および3つのエッジがあり、これらは3つの考慮されたノード間の3つの閉合を表します。 さらに、すべてのノードには2つの属性(年齢と性別)があるため、ノードの形状/色を変更できるようにしたいと思います。 また、新しいノードを追加した後、グラフのレイアウトを調整するためのForceAtlas2または同様のアルゴリズムを用意するのが最適です。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.