タグ付けされた質問 「randomness」

ランダム性は、イベントのパターンまたは予測可能性の欠如です。ランダム性は確率分布でモデル化されることが多いですが、決定論的プロセスによって生成することもできます。

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

7
なぜp値は発見が偶然によるものである確率であると学生に教えるのが悪いのですか?
誰かにp値が確率であることを生徒に教えるのが良い考えではない理由を簡潔に説明してもらえますか(彼らの発見は[偶然]チャンスによる)。私の理解では、p値は確率です(より極端なデータを取得する|帰無仮説は真です)。 私の本当の関心は、それが前者であることを彼らに伝えることの害である(それはそうではないという事実は別として)。

3
の数字は統計的にランダムですか?
シーケンスを観察するとします: 7、9、0、5、5、5、4、8、0、6、9、5、3、8、7、8、5、4、0、0、6、6、4、5、3、 3、7、5、9、8、1、8、6、2、8、4、6、4、1、9、9、0、5、2、2、0、4、5、2、8。 .. これが本当にランダムかどうかを判断するために、どの統計的検定を適用しますか?参考までに、これらは番目の数字です。したがって、数字は統計的にランダムですか?これは定数について何か言っていますか?nnnππ\piππ\piππ\pi


3
標準的な統計テストを使用して、非ランダムサンプルを分析できますか?
多くの臨床研究は、無作為ではないサンプルに基づいています。ただし、ほとんどの標準テスト(たとえば、t検定、ANOVA、線形回帰、ロジスティック回帰)は、サンプルに「乱数」が含まれているという仮定に基づいています。これらの非ランダムサンプルが標準テストで分析された場合、結果は有効ですか?ありがとうございました。

5
この「単純な」シャッフルアルゴリズムの何が問題になっていますか?
これは、配列をランダムにシャッフルすることに関する Stackoverflowの質問のフォローアップです。 「単純な」アドホックな実装に依存するのではなく、配列をシャッフルするために使用する確立されたアルゴリズム(Knuth-Fisher-Yates Shuffleなど)があります。 私は今、私の素朴なアルゴリズムが壊れていることを証明(または反証)することに興味があります(すべての可能な順列を等しい確率で生成するわけではありません)。 アルゴリズムは次のとおりです。 ループを数回繰り返し(配列の長さで行う必要があります)、繰り返しごとに2つのランダム配列インデックスを取得し、2つの要素を交換します。 明らかに、これにはKFY(2倍)よりも多くの乱数が必要ですが、それ以外は適切に動作しますか?そして、適切な反復回数は何ですか(「配列の長さ」で十分ですか)。

7
誰かが独立とランダムの違いを説明するのを助けることができますか?
統計では、独立とランダムは同じ特性を記述していますか?それらの違いは何ですか?「2つの独立したランダム変数」や「ランダムサンプリング」などの説明によく出くわします。それらの正確な違いは何だろうと思っています。誰かがこれを説明し、いくつかの例を挙げることができますか?たとえば、独立ではないがランダムなプロセスですか?

5
データがランダムに欠落しているかどうかを判断する統計的アプローチ
バイナリ分類問題を攻撃するために使用する機能ベクトルの大きなセットがあります(Pythonでscikitを使用して)。代入について考える前に、データの残りの部分から、欠落しているデータが「ランダムに欠落している」か、ランダムに欠落していないかを判断することに興味があります。 この質問にアプローチする賢明な方法は何ですか? より良い質問は、データが「ランダムに完全に欠落している」かどうかを尋ねることです。それを行う賢明な方法は何ですか?

2
勢いのあるランダムウォーク
次の条件で、0から始まる整数のランダムウォークを検討します。 最初のステップは、等しい確率でプラスまたはマイナス1です。 将来のすべてのステップは次のとおりです。前のステップと同じ方向になる可能性が60%、反対の方向になる可能性が40% これはどのような分布をもたらしますか? 非運動量のランダムウォークが正規分布をもたらすことを知っています。勢いが分散を変えるだけなのか、それとも分布の性質を完全に変えるのか? 私は一般的な答えを探していますので、60%と40%上で、本当にpと1-pを意味します

2
イベントが「最終的に発生する」とはどういう意味ですか?
整数の1次元ランダムウォークを検討ZZ\mathbb{Z}初期状態でx∈Zx∈Zx\in\mathbb{Z}: Sn=x+∑i=1nξiSn=x+∑i=1nξi\begin{equation} S_n=x+\sum^n_{i=1}\xi_i \end{equation} 増分は、ここでξiξi\xi_i IIDがそのようなことであるP{ξi=1}=P{ξi=−1}=12P{ξi=1}=P{ξi=−1}=12P\{\xi_i=1\}=P\{\xi_i=-1\}=\frac{1}{2}。 それを証明することができます(1) Px{Sn reaches +1 eventually}=1Px{Sn reaches +1 eventually}=1\begin{equation} P^x{\{S_n \text{ reaches +1 eventually}\}} = 1 \end{equation} ここで、添え字は初期位置を示します。 してみましょうττ\tau状態への最初の通過時間が。つまり、です。次のことも証明できます(2)+1+1+1τ:=τ(1):=min{n≥0:Sn=1}τ:=τ(1):=min{n≥0:Sn=1}\tau:=\tau(1):=\min\{n\geq0:S_n=1\} Eτ=+∞Eτ=+∞\begin{equation} E\tau = +\infty \end{equation} 両方の証明はhttp://galton.uchicago.edu/~lalley/Courses/312/RW.pdfにあります。記事を読んで、私は両方の証拠を理解しています。 しかし、私の質問は、「最終的に」の意味が最初の文だけでなく一般的に何であるかです。「最終的に」何かが発生した場合、有限時間で発生する必要はありませんか?もしそうなら、実際に発生しないものと、「最終的に」発生しないものの違いは何ですか?ステートメント(1)および(2)は、ある意味で私自身と矛盾しています。このような他の例はありますか? 編集 質問の動機付けを追加したい、つまり、「最終的に」発生するものの単純な例ですが、待機時間は有限です。 P{walker eventually moves left}=1−P{walker never moves left}=1−limn→∞12n=1P{walker eventually moves left}=1−P{walker never moves left}=1−limn→∞12n=1\begin{split} P\{\text{walker eventually moves left}\} …

1
低不一致シーケンスでのスクランブルと相関(ハルトン/ソボル)
現在、HaltonやSobolのポイントセットなど、低不一致/準ランダムポイントセットを使用してランダムな値を生成するプロジェクトに取り組んでいます。これらは、基本的には次元のベクトルその模倣A次元の制服(0,1)の変数が、より良い広がりを持っています。理論的には、プロジェクトの別の部分での私の見積もりの​​分散を減らすのに役立つはずです。ddddddd 残念ながら、私は彼らと仕事をする問題に遭遇しており、それらに関する多くの文献は密集しています。したがって、私は彼らと経験を積んだ人から何らかの洞察を得ること、または少なくとも何が起こっているかを経験的に評価する方法を見つけたいと思っていました。 それらを使用した場合: スクランブルとは何ですか?また、生成されるポイントのストリームにどのような影響がありますか?特に、生成されるポイントの寸法が増加すると効果がありますか? MatousekAffineOwenスクランブリングでSobolポイントの2つのストリームを生成すると、2つの異なるポイントストリームが得られるのはなぜですか。Haltonポイントで逆基数スクランブルを使用する場合、なぜこれが当てはまらないのですか?これらのポイントセットに存在する他のスクランブリングメソッドはありますか?存在する場合、それらのMATLAB実装はありますか? それらを使用していない場合: 私が持っていると言う列おそらく乱数の、私は彼らがお互いに相関していないことを示すために使用すべき統計のどのタイプ?そして、何の数、私は私の結果は統計的に有意であることを証明する必要があるでしょうか?また、どのように私は私が持っていたならば、同じこと何ができる列の次元ランダムベクトルは?S 1、S 2、... 、S N N N S 1、S 2、... 、S N D [ 0 、1 ]nnnS1,S2,…,SnS1,S2,…,SnS_1, S_2, \ldots,S_nnnnnnnS1,S2,…,SnS1,S2,…,SnS_1, S_2, \ldots,S_nddd[0,1][0,1][0,1] Cardinalの回答に関する追加の質問 理論的に言えば、スクランブル方法と低不一致シーケンスを組み合わせることができますか?MATLABでは、Haltonシーケンスに逆基数スクランブルを適用することしかできず、それが単に実装の問題なのか互換性の問題なのか疑問に思っています。 相互に関連のない2つの(t、m、s)ネットを生成できる方法を探しています。MatouseAffineOwenはこれを許可しますか?決定論的なスクランブリングアルゴリズムを使用し、kが素数であるすべての「kth」値を選択するだけの場合はどうでしょうか。

1
微分エントロピー
ガウスRVの差動エントロピーがあるlog2(σ2πe−−−√)log2⁡(σ2πe)\log_2(\sigma \sqrt{2\pi e})。これは、標準偏差であるσσ\sigmaに依存します。 ランダム変数を正規化して単位分散を持たせると、差分エントロピーが低下します。コルモゴロフの正規化定数の複雑さはエントロピーの減少と比較して非常に小さいはずなので、私にとってこれは直感に反します。このランダム変数によって生成されたデータセットを復元するために、正規化定数で除算/倍数するエンコーダーデコーダーを簡単に考案できます。 おそらく私の理解は外れています。私の欠陥を指摘してもらえますか?

3
いくつかの(すべてではないにしても)パラメトリック仮説検定がランダムサンプリングを前提としているのはなぜですか?
Z、tなどのテストでは、データがランダムサンプリングに基づいていることを前提としています。どうして? 私は実験的な研究を行っていると仮定します。そこでは、外部の妥当性よりも内部の妥当性を重視しています。したがって、母集団全体の仮説を推測しないことを受け入れたので、私のサンプルに少し偏りがあるかもしれません。また、グループ化はランダムに行われます。つまり、サンプルの参加者を便宜上選択しますが、異なるグループにランダムに割り当てます。 なぜこの仮定を無視できないのですか?

2
コインを投げることは、グループを2つのグループにランダム化する公平な方法ですか?
私と叔父は、コインフリップが本当にランダムかどうかについて議論しています。コイントッサーは常にコインを操作するため、結果は50/50ではないため、臨床試験でグループを割り当てるためのランダム化手法としては適切な選択ではないためだと思います。しかし彼は、コイン投げのわずかな欠陥がランダム性を生み出すと主張しています。それで彼は、永遠に公正なコインを投げてそれを頭に乗せることができるマシンを仮定しました、そして正直に言うと、私のためにこの議論を解決する誰かが必要です。コインを投げることは、グループを2つのグループにランダム化する公平な方法ですか?

2
これは、乱数であるべきものにバイアスを導入しますか?
ランダムに生成された、1千万以上の1と0を含むデータファイルがあるとします。 このファイルから、ランダムな10進整数のリストを作成します。 これは、この変換を行う計画です。 8000万桁を4つの2進数のグループに分けます。 各4桁のバイナリを10進数に変換します。 9より大きいすべての10進数値を破棄します。 これにより、0〜9のランダムな整数の文字列が生成されます。 ここに懸念があります。10から15の値に対応する4つの2進数の6つのグループを構成する24の2進数には、1が17、0が7のみ含まれます。この不均衡は、偶数と奇数の整数の分布に影響を及ぼしますか、または何らかの方法で10進数の最後の文字列のランダム性を損ないますか? 更新:投稿された回答から、上記で列挙した方法は適切であるようです。私はその結論に同意します。ただし、バイナリ文字列からゼロの2倍を超える数を削除しても、結果が奇数の少ない方に偏らない理由はまだわかりません。説明を求めます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.