タグ付けされた質問 「terminology」

統計における特定の専門用語/概念の使用と意味について尋ねる質問を示します。

10
機械学習モデルがブラックボックスと呼ばれるのはなぜですか?
私は、金融界がAIのブラックボックスを開きたいというタイトルのこのブログ記事を読んでいました。著者はMLモデルを「ブラックボックス」と繰り返し呼んでいます。 MLモデルを参照する場合、いくつかの場所で同様の用語が使用されています。なぜそうですか? MLのエンジニアがニューラルネットの内部で何が起こっているのかを知らないわけではありません。すべてのレイヤーは、使用するアクティベーション関数、そのタイプのレイヤーが何をするか、エラーがどのように伝播されるかなどを知っているMLエンジニアによって選択されます。

4
パフォーマンス測定:なぜリコールと呼ばれるのですか?
精度は、関連する検索されたインスタンスの割合ですが、再現率(感度とも呼ばれます)は、検索された関連するインスタンスの割合です。 私はそれらの意味を知っていますが、なぜそれがリコールと呼ばれるのか分かりませんか?私は英語のネイティブスピーカーではありません。思い出すということは覚えているということを知っているのですが、この意味とこの概念との関連性がわかりません!カバーされたインスタンスの数を示しているため、カバレッジの方が良かったのかもしれません。 しかも感度も鈍感! これらの単語をコンセプトに関連付けて、意味を理解するのを手伝っていただけませんか。

3
機械学習のコンテキストで「ベースライン」とはどういう意味ですか?
機械学習とデータサイエンスのコンテキストで「ベースライン」とはどういう意味ですか? 誰かが私に書いた: ヒント:適切なベースラインでは、約200のRMSEが得られます。 わかりません。彼は、トレーニングデータの私の予測モデルが500未満のRMSEを持っている場合、それは良いことを意味しますか? 「ベースラインアプローチ」とは何でしょうか。

3
Word2VecとDoc2Vecはどちらも分布表現ですか、それとも分散表現ですか?
私は、分布表現が、類似した文脈で出現する単語は類似した意味を持つ傾向があるという分布仮説に基づいていることを読みました。 Word2VecとDoc2Vecはどちらも、この仮説に従ってモデル化されています。ただし、元の論文では、Distributed representation of words and phrasesととタイトルが付けられていDistributed representation of sentences and documentsます。したがって、これらのアルゴリズムは、分散表現または分散表現に基づいています。 LDAやLSAなどの他のモデルについてはどうでしょうか。

2
線形回帰、ディシジョンツリー、またはランダムフォレスト回帰を選択するのはいつですか?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 4年前休業。 私はプロジェクトに取り組んでおり、どのアルゴリズムを選択するかを決定するのが困難ですregression。私は1つを選ぶ必要がありますどのような条件の下で知りたいlinear regressionか、Decision Tree regressionまたはRandom Forest regression?上記のツリーの中で特定のアルゴリズムに移行することを決定するデータの特定の特性はありますか?決定を下すためにデータセットを調べる必要がある特性は何ですか?そして、もう一つが選択になるだろういくつかの理由があるdecision treeかrandom forest、アルゴリズム同じ正しさをすることによって達成することができたとしてもはlinear regression?
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 


3
「曲線」は「線形」と見なされますか?
線形回帰では、多項式を一連のデータポイントに近似します。Bishopのパターン認識と機械学習の本には、フィットが曲線または直線である例がいくつかあります。曲線が線形であるかどうか、私は少し混乱しています。線形という用語は、近似が線形関数または次数1の多項式、つまり直線であることを意味します。しかし、多くのリソースでは、フィットが次数3、9などの多項式になる例が示されています。したがって、これらの高次多項式は線形ですか?



1
「ビジネスインテリジェンス」における「インテリジェンス」の本来の意味
「インテリジェンス」という用語は、もともと「ビジネスインテリジェンス」で何を表していますか。「人工知能」や「諜報機関」で使われている意味ですか? 言い換えれば、「ビジネスインテリジェンス」とは、「ビジネスにおいて賢くインテリジェントに行動する」または「ビジネスに関するデータと情報を収集する」という意味ですか。 この質問は、データサイエンスチームの一部のフェローの間での議論のテーマだったので、他の専門家から質問したいと思いました。両方の意味が当てはまると言うかもしれませんが、1980年代に提案された単語の本来の意図された意味を求めています。 受け入れられる答えは間違いなく元の参照を引用するはずであり、個人的な意見は私が求めているものではありません。

4
モデルがモデル化されているものに作用し、それによって概念が変わるときの用語は何ですか?
私は、文学の研究や執筆で私を助けるために、この概念に慣習的な用語があるかどうかを確認しようとしています。機械学習モデルが現実の世界で将来のインスタンスに影響を与えるアクションを起こすとき、それは何と呼ばれますか? ある特定の製品を推奨し、別の特定の製品を推奨しないレコメンダーシステムのようなものを考えています。次に、誰かが最初の製品を購入する可能性を高め、誰かが2番目の製品を購入する可能性を減らしました。したがって、これらの販売数は最終的にトレーニングインスタンスになり、一種のフィードバックループが作成されます。 これに用語はありますか?


5
「分類」と「表示」に違いはありますか?
最近まで「ラベリング」と「分類」は同義語だと思っていました。しかし、コンピュータービジョンの用語について別の質問を始めたとき、それについて考えました。「ラベル付け」と「分類」の間に違いはありますか? 「クラス」はあなたが検出したい概念であり、「ラベル」はあなたがデータに割り当てるものだと思いました。したがって、「クラス」はデータにつながる概念であり、「ラベル」は名前だけです。したがって、「ラベル付け」は「分類」と同じになります。どちらも、データにつながる基になるクラスに関するステートメントを作成したいからです。 記事 Google Scholarで簡単に検索すると、一部の記事でタイトルに両方の用語が使用されていることがわかりました。 Markus Eich、Malgorzata Dabrowska、Frank Kirchner:「セマンティックラベリング:空間特徴記述子に基づく3Dエンティティの分類」 Chunlin Li、Dmitry B. Goldgof、およびLawrence 0. Hall:「人間の脳のMR画像の知識ベースの分類と組織のラベル付け」 レイブランチャード:「非同性愛の性別違和の分類とラベル付け」-別の研究分野ですが、おそらく2つの単語の違いは同じですか? したがって、「ラベル付け」と「分類」には違いがあると思います。違いはなんですか? Google N-Gram 分類ははるかに境界の用語のようです。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.