タグ付けされた質問 「terminology」

統計における特定の専門用語/概念の使用法と意味。


10
なぜ2つのランダム変数の合計が畳み込みなのですか?
長い間、2つの確率変数の「合計」が畳み込みである理由を理解できませんでしたが、と混合密度関数の合計はf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); 畳み込みではなく算術和。「2つのランダム変数の合計」というフレーズは、googleで146,000回表示され、次のように楕円形です。RVが単一の値を生成すると考える場合、その単一の値を別のRVの単一の値に追加できます。これは、少なくとも直接ではなく、畳み込みとは関係ありません。それは2つの数値の合計です。ただし、統計のRV結果は値の集合であるため、より正確なフレーズは「2つのRVからの関連する個々の値のペアの調整された合計のセットは離散畳み込み」のようになり、...それらのRVに対応する密度関数の畳み込み。さらに単純な言語: 2 RVnnn-サンプルは、事実上、ベクトルの合計として加算される2つのn次元ベクトルです。 2つのランダム変数の合計が畳み込みと合計である方法の詳細を示してください。

5
「heteroskedastic」または「heteroscedastic」の2つのスペルがあるのはなぜですか?
「heteroskedastic」と「heteroscedastic」、および「homoscedastic」と「homoskedastic」の両方のスペルがよく見られます。「c」と「k」の変形の間に意味の違いはないようで、単に単語のギリシャ語の語源に関する正書法の違いです。 2つの異なるスペルの起源は何ですか? ある使用法が他の使用法よりも一般的であり、それらは地域や研究分野間のばらつきを反映しているか、それとも著者の(または実際に編集上の)選好以上のものを反映しているのでしょうか? 余談ですが、他の言語はギリシャ語のルーツを英語にラテン化するための異なるポリシーを持っています。したがって、第二言語として英語を使用している著者が、母国語に対応する英語の綴りを好むかもしれませんが、私は驚かないでしょう。おそらく本当のテストは、ギリシャの統計学者が英語で書くときにそれを呼ぶものです!

5
LSTMユニットとセルの理解
私はしばらくの間LSTMを研究してきました。私はすべてがどのように機能するかを高いレベルで理解しています。ただし、Tensorflowを使用して実装する場合、BasicLSTMCellには多数のユニット(つまりnum_units)パラメーターが必要であることに気付きました。 LSTMのこの非常に徹底的な説明から、単一のLSTMユニットが次のいずれかであることがわかりました。 これは実際にはGRUユニットです。 のパラメーターnum_unitsは、BasicLSTMCellレイヤー内で相互に接続するこれらの数を参照していると想定しています。 それは疑問を残します-この文脈での「セル」とは何ですか?「セル」は、通常のフィードフォワードニューラルネットワークのレイヤーと同等ですか?

6
期待される値の名前はなぜですか?
公平な6面ダイスを振る期待値として3.5を得る方法を理解しています。しかし、直感的には、各面に1/6の平等なチャンスが期待できます。 だから、サイコロを振るときの期待値は、同じ確率で1から6までの数字のいずれかではないでしょうか? 言い換えれば、「公平な6面ダイスを投げることに期待される価値は何ですか?」代わりに3.5です。 現実の世界では、誰かがサイコロを投げるときに期待する価値が3.5であることを誰かが説明できますか? 繰り返しますが、式や期待値の導出は必要ありません。


7
推論対推定?
機械学習のコンテキストでの「推論」と「推定」の違いは何ですか? 初心者として、私はランダム変数を推測し、モデルのパラメーターを推定すると感じています。私のこの理解は正しいですか? そうでない場合、違いは正確に何であり、どれをいつ使用する必要がありますか? また、「学習」の同義語はどれですか?

9
推定量と統計量の違いは何ですか?
統計はサンプルから取得できる属性であることを学び、同じサイズの多くのサンプルを取得し、それらすべてについてこの属性を計算し、pdfをプロットすると、対応する属性の分布または対応する統計の分布が得られます。 また、統計は推定量になるように作られていると聞きましたが、これら2つの概念はどのように異なるのですか

2
飽和非線形性という用語はどういう意味ですか?
ディープコンボリューショナルニューラルネットワークを使用したImageNet分類の論文を読んでいたのですが、セクション3では、コンボリューショナルニューラルネットワークのアーキテクチャについて説明し、次の使用方法を説明しました。 非飽和非線形性f(x )= m a x (0 、x )。f(バツ)=maバツ(0、バツ)。f(x) = max(0, x). 訓練するのが速かったからです。その論文では、CNNで使用されるより伝統的な関数、シグモイド関数および双曲線正接関数(すなわち、および(飽和)。f(x )= t a n h (x )f(バツ)=tanh(バツ)f(x) = tanh(x)f(x )= 11 + e− x= (1 + e− x)− 1f(バツ)=11+e−バツ=(1+e−バツ)−1f(x) = \frac{1}{1 + e^{-x}} = (1 + e^{-x})^{-1} なぜこれらの関数を「飽和」または「非飽和」と呼ぶのですか?これらの機能はどのような意味で「飽和」または「非飽和」ですか?畳み込みニューラルネットワークのコンテキストでは、これらの用語はどういう意味ですか?機械学習(および統計)の他の分野で使用されていますか?

3
多様体とは何ですか?
主成分分析、LDAなどの次元削減手法では、多くの場合、マニホールドという用語が使用されます。技術用語ではない多様体とは何ですか?ポイントが次元を削減したい球体に属し、ノイズyがあり、xとyが無相関の場合、実際のポイントxはノイズのため互いに遠く離れます。したがって、ノイズフィルタリングが必要になります。したがって、次元削減はz = x + yで実行されます。したがって、ここでxとyは異なる多様体に属しますか?バツxxyyyバツxxyyyバツxxz= x + yz=x+yz = x+yバツxxyyy 私はロボットビジョンでよく使用されるポイントクラウドデータに取り組んでいます。取得時のノイズのために点群はノイズが多く、次元を減らす前にノイズを減らす必要があります。そうしないと、誤った次元削減が行われます。それでは、ここでの多様体とは何ですか?また、ノイズは属する同じ多様体の一部ですか?バツxx

4
外挿v。内挿
外挿と内挿の違いは何ですか?また、これらの用語を使用する最も正確な方法は何ですか? たとえば、次のような補間を使用した論文の文を見ました。 「手順は、ビン点間の推定関数の形状を補間します」 外挿と内挿の両方を使用する文は、たとえば次のとおりです。 前のステップでは、カーネル法を使用して補間関数を左と右の温度テールに外挿しました。 誰かがそれらを区別し、例を使用してこれらの用語を正しく使用する方法を導くための明確で簡単な方法を提供できますか?

5
2つの多変量分布間の「距離」の測定
リソースを探しやすくするために、私がやろうとしていることを説明するための良い用語を探しています。 したがって、ポイントAとBの2つのクラスターがあり、それぞれが2つの値XとYに関連付けられており、AとBの間の「距離」を測定したいとします。 (分布は正常であると仮定できます)。たとえば、XとYがAでは相関しているがBでは相関していない場合、分布は異なります。 直観的には、Aの共分散行列を取得し、Bの各点がそこに収まる可能性を調べ、逆も同様です(おそらくマハラノビス距離のようなものを使用して)。 しかし、それは少し「アドホック」であり、おそらくこれを記述するためのより厳密な方法があります(もちろん、実際には3つ以上の変数を持つ3つ以上のデータセットがあります-私は自分のデータセットのどれかを特定しようとしています外れ値です)。 ありがとう!

6
素人の言葉では、モデルと分布の違いは何ですか?
ウィキペディアで定義されている回答(定義)は、高等数学/統計になじみのない人にとっては間違いなく少し不可解です。 数学用語では、統計モデルは通常ペア()と考えられますは可能な観測値のセット、つまりサンプル空間、は確率分布のセットです上の。S、PS、PS, \mathcal{P}SSSPP\mathcal{P}SSS 確率と統計では、確率分布は、ランダムな実験、調査、または統計的推論の手順の可能な結果の各測定可能なサブセットに確率を割り当てます。サンプル空間が非数値である例が見つかります。この例では、分布はカテゴリー分布になります。 私は非常に趣味としてこの分野に関心のある高校生だと現在あるものとの違いに苦しんでいますstatistical modelし、Aprobability distribution 私の現在の非常に初歩的な理解はこれです: 統計モデルは、測定された分布を近似する数学的な試みです 確率分布は、ランダムイベントの各可能な結果に確率を割り当てる実験から測定された説明です 混乱は、文学で「分布」と「モデル」という言葉が同じ意味で使用されているか、または少なくとも非常によく似た状況(たとえば、二項分布と二項モデル)で見られる傾向によってさらに悪化します。 誰かが私の定義を検証/修正し、おそらくこれらの概念に対してより形式化されたアプローチを提供できますか?

3
「正規化」という用語の由来
生徒に概念を紹介するとき、用語の由来を教えてくれるのが楽しいことがよくあります(たとえば、「回帰」は興味深い起源を持つ用語です)。統計/機械学習で「正規化」という用語の歴史/背景を明らかにすることはできませんでした。 それでは、正則化という用語の起源は何ですか?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.