私たちの職業におけるドメイン知識はどのくらい重要ですか?


8

または: ジョブを入力するときにドメインを選択すると、ドメインの将来のオプションが狭くなり、ジョブが絞り込まれますか?

この質問をできるだけ広く適用するには...

  • 職業とは、統計学者から機械学習者プログラマー、データマイナーまで、あらゆる種類のデータアナリストを指します。
  • 異なる年齢クラスの学生と専門家の両方を含む聴衆にアドバイスを求められたと想像してください

多分出発点:

Kaggleでの競争は、部外者が会社の従業員によって作成されたモデルを上回ることができることを示しています(たとえば、こちらを参照)。一方、私の(限られた)仕事の経験から、データが生成された方法と場所を理解することが、Kaggleの競争のようなことが起こり得る抽象的な環境を作成するために絶対に必須であるという結論に至りました。さらに、ドメインに関する知識がなければ、結果を他のレイヤー/部門に報告するのは難しいと思います。最後のスキルを「新しい」職業「データサイエンス」のキーとして関連付ける人もいます(たとえば、ここまたはここを参照)。


質問はcwにするためにフラグが付けられています。
steffen 2013

1
に関して。Kaggleの例:1.「内部ベンチマーク」(「340%が優れている」の基礎と思われる)は、Allstateが持っている最良のモデルであるとは言いません。他のコンテストでは、ベンチマークにかなり単純で基本的なモデルを使用しています。2.ドメインの知識がない:データセットの準備中に発生するドメインとデータ分析の知識の両方の量を忘れないでください。そして:私は勝者の職業/アプリケーションの専門知識を知りません。
cbeleitesは2013

回答:


7

私は類推をします:コンテキストなしで統計的問題を解決することは、目隠しされているボクシングのようなものです。相手をノックアウトするかもしれませんが、リングポストに手を打ちつけるかもしれません。

私は主に医学および社会科学の研究者と協力しています。研究の適切なモデルは

1)彼らはアイデアを思いつき、データを収集し、それについて書き、それから 2)「統計を行う」ためにそれを私たちに与えます。

したがって、私は問題を理解する必要があることに同意します。もちろん、開業医のように研究を完全に理解する必要はありません。そのため、私(および他の多くのデータ関係者)は、さまざまな職業の人々と仕事をすることができます。しかし、主題についての知識が少ないほど、結果が意味のあるものであることを確認するために専門家と対話する必要があります。

私が何をしているのかについて私が好きな多くのことの1つは、多くの異なる主題について少し学ぶことができることです。


1
とてもいいアナロジー。DoEの統計の一部(ランダム化、サンプルサイズ計画)は害になりませんが、どちらも害はありません...知識(および用語)​​の重複が低すぎる場合、相互作用の必要性が爆発する可能性があります。
cbeleitesは2013

5

私たちの職業におけるドメイン知識はどのくらい重要ですか?

  • ドメイン指向のデータ分析に異なる名前を付けるのに十分重要(例:-metrics:生体認証、心理測定、ケモメトリックス、...)

  • ドメイン知識と統計知識の組み合わせは、

    • 実験計画、例えば実用的./。統計的実現可能性、ドメイン固有の基準、サンプルサイズ計画
    • データ分析のガイド(物理的/生物学的/化学的に意味のある変換または前処理の種類。生データのどのような修正が必要か、データ品質の基準、ヒューリスティック)
    • 結果が意味のある/正しい可能性があるかどうかを確認する
    • 結果の解釈は
      ここだクラシファイアのドメイン固有の解釈の例の両方のデータ分析および分光知識が一緒に手にあったからこそ可能だった(セクション「記述LDAおよび分光解釈」)。分光学的知識のないデータ分析者と、そのような解釈に到達するためにLDAを知らない分光分析者との間で必要とされるコミュニケーションの量を想像してみてください。
    • 公表された結果の再現性(欠如)のコンテキストでは、フィールド/問題/データのさらなる知識がないかのように実施された研究についての懸念があります 。再現性、BioEssays、2012、34、277-279。
      Beck-Bornholt&Dubbenは、より多くのドメイン知識を組み込むと、優れた科学的アイデアの普及(事前確率)が高まると主張するでしょう。
    • ノーフリーランチ定理同じ方向へのヒント。

    (私はケモメトリックスと分光法に特化した化学者であり、測定とデータ分析の両方を行います)

ジョブを入力するときにドメインを選択すると、ドメインの将来のオプションが狭くなり、その結果ジョブが狭まりますか?

たぶん、しかし同時に、あなたはその分野でより多くの専門知識を主張することができ、その結果、専門的な仕事に応募することができます(そして、私の経験は、計量化学者は非常に望まれる種であるということです)。

さらに、新しいドメインの仕事に参加できることを示しています。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.