統計とビッグデータ terminology

1

別の質問へのコメントでは、議論中のトピックが「割合のカウント」か「継続的な割合」かを明確に尋ね、フォローアップにより、差が重要な情報であることが示されました（ロジスティック/二項対ベータ回帰のトピック）。この2つの違いは何ですか？どこで区別が重要ですか？「割合を数える」作業と「継続的な割合」を使用する場合の留意点は何ですか？

12 terminology proportion

4

ニューラルネットワークとパーセプトロンの違いは何ですか？

「ニューラルネットワーク」と「パーセプトロン」という用語に違いはありますか？

12 machine-learning neural-networks terminology perceptron

1

遠隔監視、自己訓練、自己監視学習、および弱い監視の間に違いはありますか？

私が読んだことから：遠隔監督： A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled data and label them and this operator is …

12 machine-learning terminology unsupervised-learning semi-supervised

10

特定の統計的意味を持つ一般的な単語

私は統計学者ではありませんが、私の研究作業には統計が含まれます（データの分析、文献の読み取りなど）。ここに投稿された質問の1つに対するコメントから、統計の分野で十分に実践されている人にとって特に特定の意味または意味をもつ一般的な単語があることを思い出しました。このような単語のリストを用意しておくと役立ちます。コメントと一緒にフレーズを追加することもできます。

12 terminology

1

「積分の平均」よりも良い名前はありますか？

私は私のビジネスが販売するスロットルポジションセンサー（TPS）をテストしており、スロットルシャフトの回転に対する電圧応答のプロットを印刷しています。TPSは、 90°の範囲の回転センサーであり、出力はポテンショメーターのようなもので、全開が5V（またはセンサーの入力値）で、初期開度が0〜0.5Vの値です。0.75°ごとに電圧測定を行うPIC32コントローラーを備えたテストベンチを構築し、黒い線がこれらの測定を接続しています。≈≈\approx 私の製品の1つは、ローカライズされた低振幅の変動を理想的なラインから遠ざけてしまう傾向があります。この質問は、これらのローカライズされた「ディップ」を定量化するための私のアルゴリズムに関するものです。ディップを測定するプロセスの良い名前または説明は何ですか？（完全な説明が続きます）次の図では、プロットの左3分の1でディップが発生します。これは、この部分を通過するか失敗するかについてのわずかなケースです。そこで、消化器感覚を定量化するために、ディップディテクタ（アルゴリズムに関するstackoverflow qa）を構築しました。最初は「面積」を測定していると思っていました。このグラフは、上記のプリントアウトと、アルゴリズムをグラフィカルに説明しようとする私の試みに基づいています。17〜31の間で13のサンプルが持続するディップがあります。 deltasdeltasdeltasdeltasdeltasdeltas deltasdeltasdeltasdydxdydx\frac {dy}{dx} deltasdeltasdeltasdeltasdeltasdeltas 0.7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2.0+1.5+1.0+1.20.7+1.2+1.3+1.4+1.8+2.5+2.9+3.0+2.5+2.0+1.5+1.0+1.20.7 + 1.2 + 1.3 + 1.4 + 1.8 + 2.5 + 2.9 + 3.0 + 2.5 + 2.0 + 1.5 + 1.0 + 1.2 232323 緑色の線は、領域をディップの長さで割って得られたこれらの「平均値未満」の平均です。 23 ÷ 13 = 1.7723÷13=1.7723 \div 13 = 1.77 2.62.62.63.03.03.0 |deltas−avg|>avg+stddev|deltas−avg|>avg+stddev|deltas - avg| > …

12 terminology

3

共同推定とは何ですか？

私の質問は単純です：共同推定とは何ですか？そして、それは回帰分析の文脈ではどういう意味ですか？それはどのように行われますか？私はかなりの時間インターネットをさまよいましたが、これらの質問に対する答えは見つかりませんでした。

12 regression estimation terminology

1

時系列分析が機械学習アルゴリズムと見なされない理由

時系列分析が機械学習アルゴリズムと見なされないのはなぜですか（線形回帰とは異なります）。回帰分析と時系列分析はどちらも予測方法です。では、なぜそれらの1つが学習アルゴリズムと見なされ、他のアルゴリズムと見なされないのでしょうか。

12 regression machine-learning time-series terminology

2

「部分的」および「限界的」相関の名前の背後にある直観

2つの変数間の条件付き相関が「部分」相関と呼ばれ、それらの間の単純な相関（他の変数で条件付けされていない場合）が「限界」相関と呼ばれる理由について誰かが知っていますか？「部分的」および「限界的」という言葉の背後にある直観は何ですか？彼らは「パーツ」や「マージン」をどのように扱いますか？これらの概念をよりよく理解するには、答えを学ぶのが良いでしょう。

12 correlation terminology marginal partial-correlation

1

左スキューが負のスキューと呼ばれ、右スキューが正のスキューと呼ばれるのはなぜですか？

命名法について知りたいのですが、左に傾いているのが負に歪んでいて、右に傾いているのが正に歪んでいるのはなぜですか？

12 terminology skewness

4

「曲線」とはどういう意味ですか？

私の知る限り、曲線は漠然と定義されていますが、非線形と同じ意味です。あれは正しいですか？あるいは、曲線は明確な定義を持っていますか？

12 linear-model nonlinear-regression terminology definition

2

因子ローテーションメソッド（varimax、obliminなど）-名前の意味とメソッドの役割

因子分析には、varimax、quartimax、equamax、promax、obliminなど、いくつかの回転方法があります。名前と実際の数学的または統計的処理とを関連付ける情報を見つけることができません。「equa-max」または「quarti-max」と呼ばれるのはなぜですか？軸や行列がどのように回転して、そのような名前が付けられますか？残念ながら、それらのほとんどは1950年代から1970年代に発明されたので、著者に連絡することはできません。

12 factor-analysis terminology factor-rotation

3

PCAおよびLDAにおける「再構築エラー」の意味

PCA、LDA、Naive Bayesをそれぞれ圧縮と分類に実装しています（圧縮と分類にLDAの両方を実装しています）。私はコードを書いてあり、すべてが動作します。私が知っておく必要があるのは、報告書に関して、再構成エラーの一般的な定義です。私は多くの数学とその使用法を文献で見つけることができます...しかし、私が本当に必要なのは鳥瞰図/わかりやすい言葉の定義なので、レポートに適合させることができます。

12 machine-learning pca terminology dimensionality-reduction discriminant-analysis

1

「バニラ」とはどういう意味ですか？

機械学習のブログでは、「バニラ」という言葉に頻繁に出会います。たとえば、「バニラグラディエントディセント」や「バニラメソッド」などです。この用語は、最適化の教科書では文字通り見られません。たとえば、この投稿では、次のように述べています。これは、勾配降下法の最も単純な形式です。ここで、バニラとは、純粋な/不純物のないものを意味します。その主な特徴は、コスト関数の勾配をとることにより、最小値の方向に小さなステップを踏むことです。この文脈で「姦淫」は何を意味するのでしょうか。著者は、バニラ勾配降下と運動量を伴う勾配降下を対比することでさらに進んでいます。したがって、この場合、バニラ勾配降下法は勾配降下法の別の言葉です。別の投稿では、バニラ勾配降下、別名バッチ勾配降下、... 悲しいことに、バッチ勾配降下法について聞いたことがありません。ああ少年。誰かが「バニラ」の意味を明確にできますか、そしてそれに対してより確固たる数学的な定義があるかどうか。

12 machine-learning optimization terminology gradient-descent

2

母集団のサイズはパラメータですか、それともサンプルサイズは統計ですか？

パラメータと統計の定義はほぼ一致します。パラメータと統計は、特定の研究の母集団と標本の数値特性または数値要約です。これは一般的な使い方ではないと思いますが... 母集団サイズはパラメータと見なすことができますか？サンプルサイズは統計と見なすことができますか？NNNnnn 結局のところ、母集団またはサンプルのサイズは、母集団またはサンプルの数値の要約または特性です。

11 terminology definition

5

情報を借りるとはどういう意味ですか？

ベイジアン階層モデルでの情報の借用や情報の共有についてよく話します。これが実際に何を意味するのか、そしてそれがベイジアン階層モデルに固有のものであるのかどうかについて、正直な答えを得ることができないようです。私はある種のアイデアを得ました。階層内のいくつかのレベルは共通のパラメーターを共有しています。しかし、これが「情報の借用」にどのように変換されるのかはわかりません。「情報を借りる」/「情報を共有する」という言葉は人々が捨てたいと思う流行語ですか？この共有現象を説明する、閉じた形式の後継者の例はありますか？これはベイジアン分析に固有のものですか？一般に、「情報の借用」の例を見ると、それらは単なる混合モデルです。たぶん私は昔ながらの方法でこのモデルを学びました、しかし私はどんな共有も見ません。私は方法についての哲学的議論を始めることに興味はありません。この用語の使用に興味があります。

11 machine-learning bayesian multilevel-analysis terminology hierarchical-bayesian

タグ付けされた質問 「terminology」

タグ付けされた質問「terminology」