統計とビッグデータ valuation

4

4つの数値変数があります。それらはすべて土壌の品質の尺度です。変数が大きいほど、品質が高くなります。それらすべての範囲は異なります： 1から10までのVar1 1000から2000までのVar2 150から300までのVar3 0から5までのVar4 4つの変数を組み合わせて、順序を正常にランク付けする単一の土壌品質スコアにする必要があります。私の考えはとても簡単です。4つの変数すべてを標準化し、それらを合計します。得られるものは、ランク付けする必要があるスコアです。このアプローチの適用に問題はありますか？あなたがお勧めする他の（より良い）アプローチはありますか？ありがとう編集：みんなありがとう。「ドメインの専門知識」については多くの議論が行われました...農業関連...一方で、より多くの統計情報が期待されていました。私が使用するテクニックに関しては、おそらく実験として単純なzスコアの合計+ロジスティック回帰になります。サンプルの大部分の品質が90％低いため、3つの品質カテゴリを1つにまとめ、基本的にバイナリの問題（品質が同じか品質が低いか）を考えます。私は1つの石で2羽の鳥を殺します。イベントレートの観点からサンプルを増やし、サンプルを分類してもらうことで専門家を活用しています。その後、専門家の分類されたサンプルを使用して、log-regモデルに適合させ、専門家との一致/不一致のレベルを最大化します。

22 ranking valuation

3

複数のランク付けリストからの総合ランク

このフォーラムを含め、オンラインで入手可能な多くの文献を調べましたが、幸運なしに、現在直面している統計上の問題を誰かが助けてくれることを望んでいます。ランク付けされたデータの5つのリストがあり、各リストには、位置1（最高）から位置10（最悪）までの10個のアイテムが含まれています。コンテキストのために、各リストの10個の項目は同じですが、ランクを決定するために使用される手法が異なるため、ランクの順序が異なります。サンプルデータ： List 1 List 2 List 3 ... etc Item 1 Ranked 1 Ranked 2 Ranked 1 Item 2 Ranked 3 Ranked 1 Ranked 2 Item 3 Ranked 2 Ranked 3 Ranked 3 ... etc 上記のデータを解釈および分析して、各テストとその位置に基づいて各アイテムの全体的なランクを示す最終結果を取得する方法を探しています。 Result Rank 1 = Item 1 Rank 2 = Item 3 Rank …

13 statistical-significance ranking valuation

1

複数のメトリックを組み合わせて、k個のオブジェクトの比較/ランキングを提供する[質問と参照のリクエスト]

k個のオブジェクトに関するメトリックを収集するんnnkkk k個のオブジェクトについてメトリックを収集するとします。「ランク付け」できるようにk個のオブジェクトを比較する有効な方法を探しています。私はこれはよく踏みにじられた根拠かもしれないと思います（総クォーターバック評価などのスポーツ統計）が、私はこの分野に慣れていません。んnnkkkkkk どのオブジェクトが最適かという質問に答えたいですか？収集されたメトリックに関する情報各メトリックの、iは範囲である1 ≤ I ≤ N、メトリックのスコアM iは、の範囲[ 0 、rは私が ]。これらのメトリックのいくつかは100 ％パーセントなどの理論上の最大値を持ち、他のr iはサンプル内の収集された最大スコア（たとえば、最高速度、高さなど）であることに注意してください。メートル私mim_i私ii1つの≤ I ≤ N1≤i≤n1 \leq i \leq nメートル私mim_i[ 0 、r私][0,ri][0, r_i]100 ％100%100\%r私rir_i メトリックスコアの正規化/標準化私の直感は、間の第1正規化するために、すべてのこれらのスコアである各スコアは、後に計算することが、全体的なスコアに等しく寄与するように、。[0,1][0,1][0,1] つまり、各メトリックについて、そのメトリックのスコアはm iになります。mimim_i。ここで、max（ri）は、サンプル内のそのメトリックの最大スコアです。私の直感では、これが有効であると確信することはできません。それが私の質問1です。この正規化手順は有効ですか？mimax(ri)mimax(ri)\frac{m_i}{\text{max}(r_i)}max(ri)max(ri)\text{max}(r_i) Also for each question the implicit question is I am probably completely wrong, what resources and topics should I be …

13 references descriptive-statistics ranking valuation

3

エキスパートセットを注文またはランク付けするにはどうすればよいですか？

ある分野の専門家を多数含むデータベースがあります。これらの各エキスパートについて、私は次のようなさまざまな属性/データポイントを持っています。経験年数。ライセンスレビューの数それらのレビューのテキストコンテンツ速度、品質などのさまざまな要因に対する、これらの各レビューの5つ星評価。賞、協会、会議などこれらの専門家の重要性に基づいて、10人中1人に評価を付けたいと思います。一部の専門家にとって、一部のデータポイントが欠落している可能性があります。今私の質問はどのように私はそのようなアルゴリズムを思いつくのですか？誰かが私にいくつかの関連文献を指摘できますか？また、私はすべての評価/レビューと同様に、いくつかの値の近くで数値がまとまる可能性があることを懸念しています。たとえば、それらのほとんどが8または5になる可能性があります。わずかな属性の違いを強調して、一部の属性のみのスコアのより大きな違いに変える方法はありますか？私が考えた他のいくつかの議論は関連しているかもしれません：各評価に複数のカテゴリがあるベイジアン評価システム IMDBの映画の評価をどのように計算しますか？専門家から事前情報を引き出す賛成票と反対票としての入力を使用した最良のランキングアルゴリズムにはどのようなものがありますか？

11 rating valuation

タグ付けされた質問 「valuation」

タグ付けされた質問「valuation」