5 
 
        
      
      非常に多数のデータポイントで値の代入を実行する方法は?
      
  非常に大きなデータセットがあり、約5%のランダムな値が欠落しています。これらの変数は互いに相関しています。次のRデータセットの例は、ダミーの相関データを使用した単なるおもちゃの例です。 set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds <- round ( runif(N, 1, length(xmat)) …
      
        
          
                   12
                
        
        
          
                  
                    r 
                  
                    random-forest 
                  
                    missing-data 
                  
                    data-imputation 
                  
                    multiple-imputation 
                  
                    large-data 
                  
                    definition 
                  
                    moving-window 
                  
                    self-study 
                  
                    categorical-data 
                  
                    econometrics 
                  
                    standard-error 
                  
                    regression-coefficients 
                  
                    normal-distribution 
                  
                    pdf 
                  
                    lognormal 
                  
                    regression 
                  
                    python 
                  
                    scikit-learn 
                  
                    interpolation 
                  
                    r 
                  
                    self-study 
                  
                    poisson-distribution 
                  
                    chi-squared 
                  
                    matlab 
                  
                    matrix 
                  
                    r 
                  
                    modeling 
                  
                    multinomial 
                  
                    mlogit 
                  
                    choice 
                  
                    monte-carlo 
                  
                    indicator-function 
                  
                    r 
                  
                    aic 
                  
                    garch 
                  
                    likelihood 
                  
                    r 
                  
                    regression 
                  
                    repeated-measures 
                  
                    simulation 
                  
                    multilevel-analysis 
                  
                    chi-squared 
                  
                    expected-value 
                  
                    multinomial 
                  
                    yates-correction 
                  
                    classification 
                  
                    regression 
                  
                    self-study 
                  
                    repeated-measures 
                  
                    references 
                  
                    residuals 
                  
                    confidence-interval 
                  
                    bootstrap 
                  
                    normality-assumption 
                  
                    resampling 
                  
                    entropy 
                  
                    cauchy 
                  
                    clustering 
                  
                    k-means 
                  
                    r 
                  
                    clustering 
                  
                    categorical-data 
                  
                    continuous-data 
                  
                    r 
                  
                    hypothesis-testing 
                  
                    nonparametric 
                  
                    probability 
                  
                    bayesian 
                  
                    pdf 
                  
                    distributions 
                  
                    exponential 
                  
                    repeated-measures 
                  
                    random-effects-model 
                  
                    non-independent 
                  
                    regression 
                  
                    error 
                  
                    regression-to-the-mean 
                  
                    correlation 
                  
                    group-differences 
                  
                    post-hoc 
                  
                    neural-networks 
                  
                    r 
                  
                    time-series 
                  
                    t-test 
                  
                    p-value 
                  
                    normalization 
                  
                    probability 
                  
                    moments 
                  
                    mgf 
                  
                    time-series 
                  
                    model 
                  
                    seasonality 
                  
                    r 
                  
                    anova 
                  
                    generalized-linear-model 
                  
                    proportion 
                  
                    percentage 
                  
                    nonparametric 
                  
                    ranks 
                  
                    weighted-regression 
                  
                    variogram 
                  
                    classification 
                  
                    neural-networks 
                  
                    fuzzy 
                  
                    variance 
                  
                    dimensionality-reduction 
                  
                    confidence-interval 
                  
                    proportion 
                  
                    z-test 
                  
                    r 
                  
                    self-study 
                  
                    pdf