回答:
ここで行われていることの多くは非常にヒューリスティックであるという印象を持っています。実際、ほとんどの人はこれを120文字未満のTwitterステートメントに適用しているようです。おそらく結果は(この方法で計算されていない間)、少しの位置情報を持つ「ポジティブ」と「ネガティブ」の単語を数えるよりもはるかに優れています(「AはBより良い」= Aはポジティブ、Bはネガティブ)。
次に、Twitterフィード全体(毎秒何メガビットか)を購入している企業を見て、これについて感情分析を行うと主張すると、ここに統計的な妥当性があるのかと真剣に思います。たとえば、Yahooがサウスカロライナの選挙を予測することにひどく失敗したのも不思議ではありません:http ://www.technologyreview.com/web/39487/
人々は誇りへの道であり、ちょうどであることに熱心すべてのデータの量を処理することができ、彼らは完全に適切に彼らのパフォーマンスを検証し無視するようです。
最先端技術についてこの悲観的になって申し訳ありません。