統計とビッグデータ indicator-function

5

非常に大きなデータセットがあり、約5％のランダムな値が欠落しています。これらの変数は互いに相関しています。次のRデータセットの例は、ダミーの相関データを使用した単なるおもちゃの例です。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

3

モンテカルロPi推定の誤解

私はモンテカルロ積分がどのように機能するかを理解していると確信していますが、それがPiを推定するためにどのように使用されるかの定式化を理解していません。このプレゼンテーションの5番目のスライドhttp://homepages.inf.ed.ac.uk/imurray2/teaching/09mlss/slides.pdfで説明されている手順に従います。準備手順を理解しました。Piは、単位円の4分の1の面積の4倍に相当します。また、（0,0）を中心とする単位円の右上4分の1の領域は、および0 < y <における単位円の右上4分の1である曲線の積分に相当します。１。 0 < x < 10<x<10<x<10 < y< 10<y<10<y<1 私が理解していないのは、この積分がいかにであるかです ∬私（（x2+ y2）< 1 ）P（x 、y）dx dy∬I((x2+y2)<1)P(x,y)dxdy\iint I((x^2+y^2)<1)P(x,y)dxdy ここで、一様に四分円の周り単位正方形に分布している（すなわち、それは常に1に等しい場合に0 < X < 1および0 < Y < 1、さもなければ0）。このように意味している I （（X 2 + Y 2）< 1 ）P （X 、Yは）における単位円の右上象限である関数で0 < X < 1とP（x 、y）P(x,y)P(x,y)0 < x < 10<x<10<x<10 …

9 monte-carlo indicator-function

1

カンテッリの不等式証明

私は次の不平等を証明しようとしています：編集：私がこの質問を投稿した直後に、私は証明するように求められている不平等がカンテリの不平等と呼ばれていることを発見しました。これを書いたとき、この特定の不平等に名前があることに気づきませんでした。私はGoogleを介して複数の証明を見つけたので、厳密に言えば、もうソリューションは必要ありません。ただし、元々あったように、であるという事実を呼び出す証拠が見つからないため、この質問を続けています。意図されました。t=E(t−X)≤E[(t−X)IX<t]t=E(t−X)≤E[(t−X)IX<t]t=E(t-X)\leq E[(t-X)\mathbb{I}_{Xt)またはむしろ。以来、、我々は交換することができると後者の左側を。 E（X）=0XX−E（X）P(X>t)≤V(X)t2P(X>t)≤V(X)t2P(X>t)\leq \frac{V(X)}{t^2}E(X)=0E(X)=0E(X)=0XXXX−E(X)X−E(X)X-E(X) ここが先に進むのに苦労しているところです。という事実を使用する方法がわかりません。再度、以降、我々は、で置換することができるのための。これはと同等です。次に、不等式の右辺の分母のをに書き換えます。これは、中間の項が欠落するため、簡略化され。しかし、私はここからどこへ行くことができるかもわかりません。これをとしてさらに書き換えることができますが、少なくとも項が正しい場所にあります。E （X ）= 0 T - E （X ）T E （T - X ）T 2 [ E （T - X ）] 2 t 2 − [ E （X ）] 2t=E(t−X)≤E[(t−x)IX<t]t=E(t−X)≤E[(t−x)IX<t]t=E(t-X)\leq E[(t-x)\mathbb{I}_{X<t}]E(X)=0E(X)=0E(X)=0t−E(X)t−E(X)t-E(X)tttE(t−X)E(t−X)E(t-X)t2t2t^2[E(t−X)]2[E(t−X)]2[E(t-X)]^2t2−[E(X)]2t2−[E(X)]2t^2-[E(X)]^2V （X ）+ t 2t2+V(X)−E(X2)t2+V(X)−E(X2)t^2+V(X)-E(X^2)V(X)+t2V(X)+t2V(X)+t^2 明らかに、ここにに関連する何かが欠けていますが、率直に言って、この用語の処理方法がまったくわかりません。私はこの用語が私に言っていることを概念的に理解しています。直感的には、が未満に制限されている場合、の期待値は同じ量よりも小さくなります。つまり、前者は否定的である可能性が高く、後者は肯定的である必要があります。しかし、私はこの事実を証明にどのように使用できるかわかりません。T - X X TE(t−X)≤E[(t−X)IX<t]E(t−X)≤E[(t−X)IX<t]E(t-X) \leq E[(t-X)\mathbb{I}_{X<t}]t−Xt−Xt-XXXXttt 簡単にするために内側を「配布」してみましたが...... E[(t−X)IX<t]=E[tIX<t−XIX<t]=tP(X<t)−?E[(t−X)IX<t]=E[tIX<t−XIX<t]=tP(X<t)−?E[(t-X)\mathbb{I}_{X<t}]=E[t\mathbb{I}_{X<t} …

8 self-study mathematical-statistics probability-inequalities indicator-function

2

インジケーター機能の背後にある直感は何ですか？

インジケーター機能とは？インジケーター機能の背後にある直感は何ですか？次の例でインジケータ関数必要なのはなぜですか？私あIAI_A 次の例は、インジケーター機能を使用せずに書き換えることはできますか？してみましょう任意のイベントで。次のように、を期待値として書くことができます。あAAP（A）P(A)\Bbb P(A) インジケーター関数を定義します。私あ= {1 、0 、イベント A が発生した場合さもないとIA={1,if event A occurs0,otherwise I_A = \begin{cases} 1, & \text{if event $A$ occurs} \\ 0, & \text{otherwise} \end{cases} 次に、は確率変数であり、私あIAI_A E（私あ）=Σr = 01R ⋅ P（私あ= r ）= P（A ）。E(IA)=∑r=01r⋅P(IA=r)=P(A). \Bbb E(I_A) = \sum_{r=0}^1 r \cdot \Bbb P(I_A = r) …

8 probability random-variable indicator-function

1

複合イベントの期待値を計算する方法は？

期待値の計算方法がわからないので、参考になれば幸いですロットには17品目が含まれており、各品目は2人の品質保証エンジニアによる検査の対象です。各エンジニアは、ランダムに独立して、ロットから4つのアイテムを選択します。以下によって選択されるアイテムの予想数を決定します。 a。両方のエンジニアb。どちらのエンジニアc。ちょうど1人のエンジニア。

7 self-study expected-value indicator-function

タグ付けされた質問 「indicator-function」

タグ付けされた質問「indicator-function」