タグ付けされた質問 「functional-data-analysis」

3
対数変換された予測子および/または応答の解釈
従属変数のみ、従属変数と独立変数の両方、または独立変数のみが対数変換されるかどうかの解釈に違いがあるのか​​と思います。 の場合を考えます log(DV) = Intercept + B1*IV + Error IVはパーセントの増加として解釈できますが、 log(DV) = Intercept + B1*log(IV) + Error または私が持っているとき DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
2つの分布間のHellinger距離の不偏推定量はありますか?
密度分布から分布観察する設定では、密度別の分布、すなわち 距離の不偏推定量(基づく)があるのだろうかX1,…,XnX1,…,XnX_1,\ldots,X_nX 、I 、F 0 H(F 、F 0)= { 1 - ∫ X √fffXiXiX_if0f0f_0H(f,f0)={1−∫Xf(x)f0(x)−−−−−−−−√dx}1/2.H(f,f0)={1−∫Xf(x)f0(x)dx}1/2. \mathfrak{H}(f,f_0) = \left\{ 1 - \int_\mathcal{X} \sqrt{f(x)f_0(x)} \text{d}x \right\}^{1/2}\,.

2
統計的観点から:フーリエ変換とフーリエ基底を使用した回帰
離散フーリエ変換が、フーリエ基底を使用した回帰と同じ曲線の表現を与えるかどうかを理解しようとしています。例えば、 library(fda) Y=daily$tempav[,1] ## my data length(Y) ## =365 ## create Fourier basis and estimate the coefficients mybasis=create.fourier.basis(c(0,365),365) basisMat=eval.basis(1:365,mybasis) regcoef=coef(lm(Y~basisMat-1)) ## using Fourier transform fftcoef=fft(Y) ## compare head(fftcoef) head(regcoef) FFTは複素数を返しますが、回帰は実数を返します。 彼らは同じ情報を伝えていますか?2つの数値セットの間に1対1のマップがありますか? (答えがエンジニアの観点ではなく、統計学者の観点から書かれていれば幸いです。多くのオンライン資料には、エンジニアリングの専門用語が至る所にあり、私には好まれません。)

2
機能データをシミュレートする方法は?
さまざまな機能データ分析アプローチをテストしようとしています。理想的には、シミュレートされた機能データでのアプローチのパネルをテストしたいと思います。ガウスノイズの加算に基づくアプローチ(以下のコード)を使用してシミュレートされたFDを生成しようとしましたが、結果の曲線は実際のものと比較して非常に頑丈に見えます。 もっとリアルな見た目の機能データを生成するための関数/アイデアへのポインタがあるのか​​と思っていました。特に、これらは滑らかでなければなりません。私はこの分野に完全に慣れていないので、どんなアドバイスも歓迎します。 library("MASS") library("caTools") VCM<-function(cont,theta=0.99){ Sigma<-matrix(rep(0,length(cont)^2),nrow=length(cont)) for(i in 1:nrow(Sigma)){ for (j in 1:ncol(Sigma)) Sigma[i,j]<-theta^(abs(cont[i]-cont[j])) } return(Sigma) } t1<-1:120 CVC<-runmean(cumsum(rnorm(length(t1))),k=10) VMC<-VCM(cont=t1,theta=0.99) sig<-runif(ncol(VMC)) VMC<-diag(sig)%*%VMC%*%diag(sig) DTA<-mvrnorm(100,rep(0,ncol(VMC)),VMC) DTA<-sweep(DTA,2,CVC) DTA<-apply(DTA,2,runmean,k=5) matplot(t(DTA),type="l",col=1,lty=1)

1
RのPROC Mixedとlme / lmerの違い-自由度
注:法的な理由で以前の質問を削除する必要があったため、この質問は再投稿です。 SASのPROC MIXED をR lmeのnlmeパッケージの関数と比較していると、やや紛らわしい違いを見つけました。より具体的には、異なるテストの自由度はとの間PROC MIXEDで異なり、lmeなぜだろうと思いました。 次のデータセットから開始します(以下のRコード)。 ind:測定が行われる個人を示す因子 fac:測定が行われる臓器 trt:治療を示す因子 y:連続応答変数 アイデアは、次の単純なモデルを構築することです: y ~ trt + (ind):indランダムな要因として y ~ trt + (fac(ind)):facにネストされたindランダムな要因として、 最後のモデルでは特異性が生じることに注意してください。とのyすべての組み合わせに対しての値は1つだけです。indfac 最初のモデル SASでは、次のモデルを作成します。 PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; チュートリアルによると、使用しているRの同じモデルnlmeは次のようになります。 > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 両方のモデルは、係数とそのSEに対して同じ推定値を与えますがtrt、の効果に対してF検定を実行する場合、異なる自由度を使用します。 SAS …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
密度関数の予測
確率密度関数の時系列の予測について調査しています。過去に観測された(通常は推定された)PDFを与えられたPDFを予測することを目指しています。私たちが開発している予測方法は、シミュレーション研究でかなりうまく機能します。 ただし、この方法をさらに説明するには、実際のアプリケーションからの数値例が必要です。では、時系列のPDFが収集され、そのような時系列を予測することが重要で難しいアプリケーション(金融、経済学、生物学、工学など)に適切な例はありますか?

1
Rのfdaパッケージを使用して新しい曲線からの応答を予測する
基本的には、いくつかの曲線を使用してスカラー応答を予測するだけです。私は(fdaパッケージのfRegressを使用して)回帰を行っていますが、結果を新しい曲線セット(予測用)に適用する方法がわかりません。 N = 536の曲線と536のスカラー応答があります。これまでに行ったことは次のとおりです。 カーブのベースを作成しました。 ペナルティを導入するためにfdParオブジェクトを作成しました 指定したペナルティで選択したペナルティでカーブを滑らかにするために、smooth.basisを使用してfdオブジェクトを作成しました。 私はfRegress()を使用して回帰を実行し、スカラー応答の曲線を回帰しました。 さて、私がやりたいのは、その回帰を使用して、私が持っている新しいデータセットの予測を生成することです。これを行う簡単な方法を見つけることができないようです。 乾杯

1
動的タイムワーピングと正規化
私は動的時間ワーピングを使用して「クエリ」と「テンプレート」の曲線を一致させ、これまでのところ妥当な成功を収めていますが、いくつかの基本的な質問があります。 DTWの結果がヒューリスティックに思いついたあるしきい値よりも小さいかどうかを評価することで、「一致」を評価しています。これは、DTWを使用して「一致」を決定するための一般的なアプローチですか?そうでない場合は、説明してください... (1)の答えが「はい」であるとすると、DTWの結果はa)曲線の振幅の違いとb)クエリベクトルの長さと "テンプレート」ベクトル。 私は対称ステップ関数を使用しているため、(b)については、DTWの結果をM + N(DTWマトリックスの幅+高さ)で除算することで正規化しています。これはある程度効果的であるようですが、対角線から遠い(つまり、DTWマトリックスを通るパスが長い)DTWの一致にペナルティを課すようです。これは、「正規化」アプローチにとっては恣意的なようです。マトリックスを介してステップ数で除算することは直感的に理解できるようですが、文献によるとそれを行う方法とは思われません。 では、DTWの結果をクエリベクトルとテンプレートベクトルのサイズに合わせて調整するより良い方法はありますか? 最後に、クエリとテンプレートベクトル間の振幅の差についてDTW結果を正規化するにはどうすればよいですか? 確かに、信頼できる正規化手法の欠如(または私の理解の欠如)を考えると、「一致」を定義するための最適なしきい値レベルを特定するためのサンプルデータの操作には、多くの手作業が伴うようです。何か不足していますか?

3
軌道をベクトルにマップする方法は?
一連のユーザー向けに、この形式の一連のデータポイント(タイムスタンプ、緯度、経度)があります。各ユーザーは、ポイントAからポイントBに移動するときに軌道を持っています。AからBまでのポイントはいくつあってもかまいません。これらは、タイムスタンプに基づいて順序付けられたデータポイントです。さまざまな分析タスクを実行するベクトルとしてそれらを変換したいと思います。私が考えているのは、ターンを見て、それを次元として作ることです。もっとアプローチを教えてください。必要なのは、軌道全体を表す1つのベクトルです。軌道の1つの点のように考えてください。今、3D点のコレクションがあります。 軌跡類似検索を行いたいのですが。時間内に互いに接近している2つの軌道がある場合、それらは類似しています。自宅から午前9時に仕事に行くような感じで考えてください。午前9時10分に他の誰かが彼の仕事の家でもあり、あなたから少し離れています。uは同じ職場を持っているので、おそらく同じ軌跡をたどります。軌道の上に構築された分類子のようなもの。軌跡でアクティビティ検出を実行できます。また、送信元宛先分析も実行できます。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.