統計ソフトウェアの使用から数式の理解への移行?


12

環境:

私は心理学博士課程の学生です。多くの心理学博士課程の学生と同様に、PCA、分類木、クラスター分析などの手法まで、統計ソフトウェアを使用してさまざまな統計分析を実行する方法を知っています。しかし、分析を行った理由と指標の意味を説明することはできますが、この手法がどのように機能するかを説明することはできないため、それは本当に満足のいくものではありません。

本当の問題は、統計ソフトウェアの習得は簡単ですが、制限されていることです。記事で新しいテクニックを学ぶには、数式の読み方を理解する必要があります。現在、固有値またはK平均を計算できませんでした。方程式は私にとって外国語のようなものです。

質問:

  • 雑誌記事の方程式を理解するのに役立つ包括的なガイドはありますか?

編集:

この質問はもっと自明なものだと思った。特定の複雑さを超えると、統計表記は意味が分からなくなる。テクニックを理解するためにRまたはC ++で独自の関数をコーディングしたいが、障壁があるとしましょう。方程式をプログラムに変換できません。そして本当に:私は米国の博士課程の状況を知りませんが、私の(フランス)で、私が従うことができる唯一のコースは16世紀のごく少数の運動です...


@Coronier申し訳ありませんが、統計モデリングを使用する心理学の記事を理解するための包括的なガイドはありません。しかし、必要な背景はすべて統計学の修士号のレベルでなければなりません。プログラムで費用が発生する場合は、統計でMAを取得することを検討してください。あなたの目的のための次の最適なオプションは、統計部の多変量統計のバージョンを再取得することです-通常、PCA、クラスタリング、ツリーなどの数学的な背景を持つメモを提供します。線形代数と基本的な数学の背景が必要になります統計に関係なく。
ロックオフ

より具体的な質問をしてください。

4
私も心理学博士課程の学生であり、学部時代にかなりの数の数学を取ることを選択しました。なぜなら、PCA(たとえば)の計算方法がわからない心理学博士号が非常に多かったからです。最初に行う必要があるのは、適切な線形代数の教科書を読み進めることです。まともな線形代数の教科書とは何ですか?ギルバート・ストラングは爆弾であり、彼はMITのウェブサイトで彼の線形代数コースのビデオ講座を開いています。iTunesで入手することもできます。
フィリップクラウド

1
質問は非常に広範であるため、数段落で満足のいく回答を得ることはできません。統計は質問のようなものです。複数の管理可能なコンポーネントに分類すると、統計が簡単になります。
神父

上記のコメントにのみ同意できます。特定の問題に焦点を合わせる必要があるか、最初にいくつかの教科書やオンライン配布資料を使用する必要があります。イラスト付きの多変量統計の基本概念を扱ったまともな教科書は、キャロルとグリーンによる応用多変量解析のための数学ツールです(AP、1997、Rev. Ed。)。もう1つは、Tinsley and BrownによるApplied Multivariate Statistics and Mathematical Modelingです(AP、2000)。
-chl

回答:


9

概要:

  • 私の印象では、あなたの経験は社会科学の多くの学生に共通しているということです。
  • 出発点は、学ぶ意欲です。
  • 独学または正式な指導ルートを下ることができます。

正式な指示:

これに関して多くのオプションがあります。統計学の修士号を検討するか、統計部門でいくつかの科目を履修するだけです。ただし、必要な数学的背景があることを確認することをお勧めします。コースによっては、大学レベルの数学的に厳密な統計科目に取り組む前に、微積分前の数学、おそらく微積分や線形代数などの資料を再検討する必要がある場合があります。

独学

または、独学のルートをたどることもできます。インターネットには豊富なリソースがあります。特に、数学の教科書を読んで練習することは重要ですが、おそらく十分ではありません。数学について話しているインストラクターの話を聞いて、問題を解決するのを見ることが重要です。

また、数学的な目標と、それらの目標を達成するために必要な数学的な前提条件について考えることも重要です。方程式が外国語のようなものである場合、最初に初等数学を勉強する必要があることに気付くかもしれません。

統計ソフトウェアの使用から基礎となる数学の理解に移行する人々を支援することを目的としたいくつかのリソースを用意しました。


おかげで、あなたが提供するリソースは素晴らしいです。ところで、あなたのブログは完全に夢中になっています(私はI / OPの学生でありuseRであり、それは私にとって啓示のようなものです)。
コロニエ

@Coronier RとI / O Psychを組み合わせた別の人に会えるのは素晴らしいことです。
ジェロミーアングリム

3

統計方程式をRまたはC ++にプログラミングすることで、統計方程式を洞察できると思うという印象を受けます。できません。統計方程式を理解するには、方程式を含む各章の終わりに宿題の問題が多い「学部」教科書を見つけ、方程式を含む章の終わりに宿題をします。

たとえば、PCAを理解するには、線形代数、特に特異値分解の十分な理解が必要です。Michael Nielsenの本を通して量子コンピューティングを学んでいるうちに、線形代数を復習する必要があることが明らかになりました。Gilbert Strangのビデオに出くわしました。それらは概念の基本的な理解を確立するのに非常に役立ちました。しかし、宿題の問題がたくさんある線形代数の本を見つけるまで、素材のニュアンスは伝わりませんでした。


4
@ schenectady私はあなたの視点に同情しますが、少なくとも私にとっては、Rコードは、関係する方程式と数学の理解を深めるために使用できるブリッジを提供します。そうは言っても、私は問題、統計、数学の一般的な必要性に心から同意します。
richiemorrisroe

2

統計学で何か新しいことをしようとすると同様の問題があるので、私はあなたの難しさを理解しています(私は大学院生でもありますが、異なる分野です)。Rコードを調べると、何かがどのように計算されるかを知るのに非常に役立ちます。たとえば、最近、kmeansクラスタリングの使用方法を学び、概念と実装方法の両方について多くの基本的な質問をしています。Rインストールを使用して(http://www.rstudio.org/を推奨R Studioますが、どのインストールでも機能します)、kmeansコマンドラインに入力するだけです。出力の一部の例を次に示します。

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

毎回ソースを調べることがどれほど実用的かはわかりませんが、構文にある程度精通していれば、何が起こっているのかを知るのに本当に役立ちます。

stackoverflowで私が尋ねた以前の質問は、この方向を示してくれましたが、コードに関するコメントが時々ここに含まれいることも教えてくれました


より一般的には、Journal of Statistical Softwareは理論と実装の間のこのリンクを示していますが、多くの場合、高度なトピック(個人的に理解するのが難しい)についてですが、例として役立ちます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.