タグ付けされた質問 「measurement」


4
困惑とは何ですか?
見えないデータの対数平均された逆確率を指す用語「perplexity」に出会いました。困惑に関するウィキペディアの記事は、そのための直感的な意味を与えません。 この困惑度の尺度は、pLSAの論文で使用されました。 誰もが困惑度の必要性と直感的な意味を説明できますか?

3
ロジスティック回帰の95%信頼区間を手動で計算することと、Rでconfint()関数を使用することに違いがあるのはなぜですか?
皆さん、私は説明できない奇妙なことに気づきました、できますか?要約すると、ロジスティック回帰モデルで信頼区間を計算する手動のアプローチとR関数confint()は異なる結果をもたらします。 Hosmer&LemeshowのApplied Logistic Regression(第2版)を行ってきました。第3章には、オッズ比と95%の信頼区間を計算する例があります。Rを使用すると、モデルを簡単に再現できます。 Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
2つの信号を整列/同期するにはどうすればよいですか?
私はいくつかの研究を行っていますが、分析段階で立ち往生しています(統計の講義にもっと注意を払うべきでした)。 私は2つの同時信号を収集しました:体積に統合された流量と胸部拡張の変化。信号を比較し、最終的に胸部拡張信号からボリュームを導き出したいと思います。しかし、最初にデータを調整/同期する必要があります。 記録が正確に同時に開始されず、胸部拡張がより長い期間キャプチャされるため、胸部拡張データセット内でボリュームデータに対応するデータを見つけ、それらがどれだけ適切に調整されているかを測定する必要があります。2つの信号がまったく同じ時間に開始しない場合、または異なるスケールと異なる解像度のデータ間でこれを実行する方法がわからない。 2つの信号の例(https://docs.google.com/spreadsheet/ccc?key=0As4oZTKp4RZ3dFRKaktYWEhZLXlFbFVKNmllbGVXNHc)を添付しました。さらに提供できるものがあればお知らせください。

5
広がりの「均一性」の尺度はありますか?
私はウェブで調べましたが、役に立つものは見つかりませんでした。 私は基本的に、値がどのくらい「均等に」分布しているかを測定する方法を探しています。同様に、Xのような「均等な」分散ディストリビューション: そして、ほぼ同じ平均と標準偏差の「不均一」な分布Y: しかし、m(X)> m(Y)のような均等性の尺度mはありますか?存在しない場合、このようなメジャーを作成する最良の方法は何でしょうか? (Khan Academyの画像スクリーンショット)

3
「天井効果」が発生していると結論付けるには、どのような基準を満たす必要がありますか?
社会科学研究方法のSAGE百科事典によると… [a]メジャーに潜在的な応答の明確な上限があり、この制限で、またはその近くで参加者の集中度が高い場合、天井効果が発生します。スケール減衰は、この方法で分散が制限されるたびに発生する方法論的な問題です。…たとえば、天井効果は、高いスコアが好ましい態度を示し、最高の反応が可能な限り最も肯定的な評価を得ることができない態度の尺度で発生する場合があります。…天井効果の問題に対する最適なソリューションはパイロットテストであり、これにより問題を早期に特定することができます。天井効果が見つかった場合[および]結果の尺度がタスクのパフォーマンスである場合、潜在的な応答の範囲を拡大するためにタスクをより困難にすることができます。1 [強調を追加] あるように思わたくさんのアドバイスや質問(ここおよび上記の引用で説明したものと同様の天井効果を示すデータを分析することを扱います)。 私の質問は単純なものでも素朴なものでもかまいませんが、データに天井効果が存在することを実際にどのように検出しますか?具体的には、心理測定テストが作成され、天井効果(視覚検査のみ)につながる疑いがある場合、テストを修正してより広い範囲の値を生成するとします。改訂されたテストにより、生成されたデータから天井効果が除去されたことをどのように示すことができますか?データセット内の天井効果があることを示しているテストがありますが、データセットの中にいない天井効果bが? 私の素朴なアプローチは、分布のゆがみを調べることです。もしそれがゆがんでいなければ、天井効果はないと結論付けます。それは過度に単純化されていますか? 編集 より具体的な例を追加するために、年齢とともに増加するが最終的には横ばいになり、高齢になると減少し始める潜在的な特性xを測定する機器を開発するとします。範囲が1〜14の最初のバージョンを作成し、パイロット操作を行って、天井効果(最大値である14付近で多数の応答が発生する可能性があることを発見しました。しかし、なぜですか?その主張をサポートする厳密な方法はありますか? 次に、1〜20の範囲になるようにメジャーを修正し、より多くのデータを収集します。この傾向は私の予想とより密接に一致していることがわかりますが、測定範囲が十分に大きいことをどのようにして知ることができますか。再度修正する必要がありますか?視覚的には問題ないようですが、疑念を確認するためにテストする方法はありますか? 単に見ているだけでなく、データ内でこの天井効果を検出する方法を知りたいです。グラフは理論的なものではなく、実際のデータを表しています。機器の範囲を拡大すると、データの広がりが改善されましたが、それで十分ですか?どうすればテストできますか? 1 Hessling、R.、Traxel、N.、&Schmidt、T.(2004)。天井効果。Michael S. Lewis-Beck、A。Bryman、およびTim Futing Liao(編)、The SAGE Encyclopedia of Social Science Research Methodsで。(p。107)。カリフォルニア州サウザンドオークス:Sage Publications、Inc. doi:10.4135 / 9781412950589.n102

2
エコノミストは闇市場の運営をどのように定量化していますか?
私は私の著者の友人に有利なプロジェクトのために東アジアの組織犯罪に関する多くの研究を行っていました、そして、一緒に世界の闇市場活動の価値を見積もる著名な経済学者とジャーナリストがいることに気付きました。 これの方法論は何ですか?これらの数字はどのようにまとめられますか?これらの数値は、従来の市場モデルに取り込まれていますか?

5
使用するのに最適な距離測定
環境 比較したい2組のデータがあります。両方のセット内の各データ要素は、(すべての間に22件の角度を含むベクターである−π−π-\pi及びππ\pi)。角度は特定の人間のポーズ構成に関連しているため、ポーズは22の関節角度によって定義されます。 最終的に私がやろうとしているのは、2つのデータセットの「近さ」を判断することです。そのため、1つのセットの各ポーズ(22Dベクトル)について、他のセットの最も近い隣を見つけ、最も近い各ペアの距離プロットを作成します。 ご質問 単純にユークリッド距離を使用できますか? :意味のあるものにするには、私は距離メトリックは、次のように定義される必要があることを前提と、ここで | 。。。| は絶対値で、modはモジュロです。次に、結果の22シータを使用して、標準のユークリッド距離計算を実行できます。√θ=|θ1−θ2|modπθ=|θ1−θ2|modπ\theta = |\theta_1 - \theta_2| \quad mod \quad \pi|...||...||...|。t21+t22+…+t222−−−−−−−−−−−−−−√t12+t22+…+t222\sqrt{t_1^2 + t_2^2 + \ldots + t_{22}^2} これは正しいです? カイ2乗、Bhattacharyya、または他のメトリックなど、別の距離メトリックがより有用でしょうか?もしそうなら、その理由についての洞察を提供してください。

1
平日の分布の均一性を測定する
私はここで尋ねられた質問と同様の問題を抱えています: 分布の不均一性をどのように測定しますか? 曜日全体にわたる一連の確率分布があります。各分布が(1 / 7,1 / 7、...、1/7)にどれだけ近いかを測定したいと思います。 現時点では、上記の質問の回答を使用しています。L2ノルムは、分布の1日の質量が1の場合に値1を持ち、(1 / 7,1 / 7、...、1/7)に対して最小化されます。私はこれを線形にスケーリングして、0と1の間にあるようにします。それを反転させると、0は完全に不均一になり、1は完全に均一になります。 これはかなりうまく機能しますが、私には1つの問題があります。平日は7次元空間の次元として等しく扱われるため、日数の近さは考慮されません。つまり、(1 / 2,1 / 2,0,0,0,0,0)と(1 / 2,0,0,1 / 2,0,0,0)にも同じスコアを与えますある意味では、後者はより「広がり」、均一であり、理想的にはより高いスコアを取得する必要があります。日付の順序が循環的であるという追加の複雑さが明らかにあります。 日の近さを説明するために、このヒューリスティックをどのように変更できますか?

4
この場合、xのyの回帰はxのyよりも明らかに良いですか?
人の血液中のブドウ糖のレベルを測定するために使用される機器は、10人のランダムなサンプルで監視されます。レベルはまた、非常に正確な実験室手順を使用して測定されます。計器メジャーはxで示されます。検査手順の測定値はyで示されます。 個人的には、実験室の測定値を予測するために機器の測定値を使用することを目的としているため、y on xの方が正しいと思います。そして、y on xは、そのような予測の誤差を最小限に抑えます。 しかし、提供された答えはx対yでした。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.