私たちは常に統計はデータを扱っているだけだと言っています。しかし、情報学もデータ分析から知識を得ていることも知っています。たとえば、バイオインフォマティクスの人々は完全に生物統計学なしで行くことができます。統計学と情報学の本質的な違いは何か知りたい。
私たちは常に統計はデータを扱っているだけだと言っています。しかし、情報学もデータ分析から知識を得ていることも知っています。たとえば、バイオインフォマティクスの人々は完全に生物統計学なしで行くことができます。統計学と情報学の本質的な違いは何か知りたい。
回答:
素晴らしい質問!!
バイオインフォマティシャンは生物統計学なしでも、統計なしでも行くことができると何度も聞いたことがあります。それが偽になるまで、それは完全に真です。私の意見では、統計的知識の一般的な欠如は、Keith Baggerlyが示すように、この分野で悲惨な影響を及ぼします。統計(および線形代数)の基本的な知識の欠如が長期的にはバイオインフォマティシャンの停滞の原因であることも観察できました。理論の深い知識がなければ、彼らは車輪を再発明し、解決するアドホックな解決策に頼る傾向があります自分の問題にすぎません。
しかし今、あなたの質問に答えるために、私は全体として、統計は当時コンピューターなしでは成り立たないことに同意します。しかし、統計の主要な側面の1つは推論です。これはコンピューターとは何の関係もありません。統計的推論は、実際に統計を科学にするものです。なぜなら、それはあなたの結論が他の文脈で成り立つかどうかを教えてくれるからです。
つまり、データから地獄を分析することができますが、分析に基づいて行う予測や決定の妥当性を知るには、統計が必要です。
私の見解では、フィールド間にかなりのオーバーラップがある一方で、重要な違いもあると思います。一般に、統計学の学生(より高い学位)は、情報学の学生よりも多くの理論クラス(mathおよびmathstat)を受講しますが、情報学の学生は、コンピューティング(特にデータベース部分)についてより多くを学びます。
新しい統計的検定を開発することは、情報学者よりも統計学者に当てはまりますが、ユーザーがデータを入力してテーブルやプロットを作成するためのインターフェースを設計することは、統計学者よりも情報学者に当てはまります。
統計学者にとって、コンピュータは統計を支援するツールです。情報学者にとって統計は、(一般的にはコンピュータを介して)情報を収集および配布するのに役立つツールです。
ここで編集-----
拡大するには、ここに例を示します。私は情報科学者(私は統計学者です)と一緒にプロジェクトに取り組んでいますリスクについて知らせるように警告します。プロジェクトにおける私の役割(統計学者の役割)は、予測変数が与えられた場合にリスクを予測するモデルを開発することです(ロジスティック回帰モデルはそのようなモデルの1つです)。プロジェクトにおける情報学者の役割は、予測変数を収集するツールを開発し、それらのモデルを使用して、結果を医師に送信することです。データは、電子カルテから、または看護師が記入するデータ入力画面などから収集できます。
現在、私(および他の多くの統計学者)は、データベースにクエリを実行して予測子を取得し、何らかのタイプのアラートを作成できるプログラミングを十分に理解していますが、情報学者に任せて喜んでいます(とにかく彼らはより優れています)。ロジスティック回帰モデルに適合するのに十分な統計を知っている情報学者がいます。したがって、このプロジェクトの単純なバージョンは、統計学者のみ、または情報学者のみが実行できますが、両方が連携する場合に最適です。このプロジェクトを見て、モデリングの部分が楽しい部分であり、データ収集、アラート、およびその他のインターフェースが、情報をモデルとの間で移動するための単なるツールであると考えると、統計学者になります。インターフェースの設計、データ取得の最適化、さまざまなタイプのアラートのテストなどが見られる場合。
統計はデータから推測します。情報学はデータを操作します。もちろん、それらは重複しますが、より広い範囲を持っている問題には答えがありません。