おそらく、これは非常に基本的な質問ですが、それに対する確固たる答えを見つけることができないようです。ここでできることを願っています。
現在、自分の修士論文の準備として論文を読んでいます。現在、ツイートと株式市場の特徴との関係を調査した論文を読んでいます。
彼らの仮説の1つでは、彼らは「ツイート量の増加は取引量の増加に関連している」と提案しています。
私は相関して、ペアワイズ相関で、それらを期待tweetVolume
してtradingVolume
、その代わりに、彼らはログに記録されたバージョンを使用してレポート:LN(tweetVolume)
とLN(tradingVolume)
。
私の論文のために、私は彼らの論文のこの部分を複製しました。6か月以上にわたって100社ほどのツイート(tweetVolume
)と同じ期間の株式取引量を収集しました。絶対変数を相関させると見つけられますr=.282, p.000
が、ログに記録されたバージョンを使用すると、が見つかりますr=.488, p=.000
。
私は理解していない理由は、研究者が時々使用がその変数のバージョンをログに記録し、相関はそれほど高く、あなたがそうするならば、なぜそうです。ここでの理由は何ですか?また、ログに記録された変数を使用するのはなぜですか?
あなたの助けは大歓迎です:-)