回答:
最初のステップは、するべきである理由を尋ねるあなたの変数が非正規分布しています。これは明るいかもしれません。私の経験からの一般的な発見:
この最初のステップは、テストの設計変更を提案する場合があります。これらの問題を事前に認識している場合は、問題があると見なされれば、それらを回避するようにテストを設計することもできます。
第二段階は、することです何をすべきかを決定しますが、非正規のデータを持っている状況で。変換は可能な戦略の1つにすぎないことに注意してください。非正規性に関する以前の回答からの一般的なアドバイスを繰り返します。
John Tukeyは、EDAに関する本の中で、変換について体系的に説明しています。Box-Coxファミリー(アフィンスケーリングされた累乗変換)に加えて、比率(基本的にx /(1-x)の累乗)と「開始」カウント(カウントされたデータに正のオフセットを追加)の「フォールド」変換のファミリーを定義します。それらを変換する前に)。本質的にロジットを一般化する折り返し変換は、テストスコアに特に役立ちます。
まったく異なる流れで、Johnson&Kotzの分布に関する本では、カイ二乗の立方根変換など、テスト統計を近似正規性(または他のターゲット分布)に変換することを目的とした多くの変換が提供されています。この資料は、データが特定の分布に従うと予想される場合に役立つ変換のアイデアの優れた情報源です。
単純なオプションは、スコア自体ではなく、スコアの合計を使用することです。分布の合計は正規化する傾向があります。たとえば、教育では、一連のテストで生徒のスコアを追加できます。
もちろん、別のオプションは、過小評価され、十分に使用されていない、正規性を前提としない手法を使用することです。
データ変換として、これは変換が全単射(歪んだ場合はほぼ全単射)であり、ランベルトのW関数(したがって、ランベルトW x Fという名前)を使用して明示的に取得できるため、興味深いものになります。これは、データから歪度を削除し、重い尾を(全単射的に)削除することもできることを意味します。
LambertW Rパッケージを使用して、それを使用する方法の多くの例を示すマニュアルとともに、それを試すことができます。
アプリケーションについては、これらの投稿を参照してください