統計学と情報学の違いは何ですか?


10

私たちは常に統計はデータを扱っているだけだと言っています。しかし、情報学もデータ分析から知識を得ていることも知っています。たとえば、バイオインフォマティクスの人々は完全に生物統計学なしで行くことができます。統計学と情報学の本質的な違いは何か知りたい。


7
いや、これは「情報学」という言葉が決定的な意味を完全に失ったからです。「バイオインフォマティクス」は「コンピュータでつくる生物学」のために造られたもので、これには何も深いところはありません。

1
@mbq同意した。「インフォマティクス」と「バイオインフォマティクス」は、意味のある定義を失っています。
Fomite

明確な方法でバイオインフォマティクス(生物学的方法で結果を観察するために結果を適用します)
Kamal Alblwei

回答:


20

素晴らしい質問!!

バイオインフォマティシャンは生物統計学なしでも、統計なしでも行くことができると何度も聞いたことがあります。それが偽になるまで、それは完全に真です。私の意見では、統計的知識の一般的な欠如は、Keith Baggerlyが示すように、この分野で悲惨な影響を及ぼします。統計(および線形代数)の基本的な知識の欠如が長期的にはバイオインフォマティシャンの停滞の原因であることも観察できました。理論の深い知識がなければ、彼らは車輪を再発明し、解決するアドホックな解決策に頼る傾向があります自分の問題にすぎません。

しかし今、あなたの質問に答えるために、私は全体として、統計は当時コンピューターなしでは成り立たないことに同意します。しかし、統計の主要な側面の1つは推論です。これはコンピューターとは何の関係もありません。統計的推論は、実際に統計を科学にするものです。なぜなら、それはあなたの結論が他の文脈で成り立つかどうかを教えてくれるからです。

つまり、データから地獄を分析することができますが、分析に基づいて行う予測や決定の妥当性を知るには、統計が必要です。


ありがとう。バイオインフォマティクスを規律化するための背後にある一般的な原則は何ですか?統計については、一般的に言えば、2つの主要な部分があります。1つは純粋なデータ操作であり、もう1つは統計的推論です。これは確率に基づいており、1つは純粋な数学です。統計モデル(確率モデル)に基づいて、統計の人々は科学を行うことができます。バイオインフォマティクスはどうですか?
Honglang Wang

4
バイオインフォマティクスは、単に生物学的問題を研究するためのコンピューターの使用です。学問分野は通常、手法ではなく、彼らが尋ねる質問によって定義されるため、バイオインフォマティクスは生物学の一部であると私は考えています。生物学者はコンピューターが非常に苦手なので特別な名前が付けられています。そのため、それを実行できる人には特別なラベルが必要です。生物学者がITと数学に優れている50年後も、バイオインフォマティクスが存在するかどうかはわかりません。
gui11aume

2
キースの努力に感謝する誰かを見るのは素晴らしいことです。彼は確かに論争や困難で不快なプロの状況から逃れていません。
枢機卿

@cardinal Saw Keithが1、2年前にAPHA会議で講演しました。それは私が今まで見た中で最高の講演の1つでした。
フォミテ

9

私の見解では、フィールド間にかなりのオーバーラップがある一方で、重要な違いもあると思います。一般に、統計学の学生(より高い学位)は、情報学の学生よりも多くの理論クラス(mathおよびmathstat)を受講しますが、情報学の学生は、コンピューティング(特にデータベース部分)についてより多くを学びます。

新しい統計的検定を開発することは、情報学者よりも統計学者に当てはまりますが、ユーザーがデータを入力してテーブルやプロットを作成するためのインターフェースを設計することは、統計学者よりも情報学者に当てはまります。

統計学者にとって、コンピュータは統計を支援するツールです。情報学者にとって統計は、(一般的にはコンピュータを介して)情報を収集および配布するのに役立つツールです。

ここで編集-----

拡大するには、ここに例を示します。私は情報科学者(私は統計学者です)と一緒にプロジェクトに取り組んでいますリスクについて知らせるように警告します。プロジェクトにおける私の役割(統計学者の役割)は、予測変数が与えられた場合にリスクを予測するモデルを開発することです(ロジスティック回帰モデルはそのようなモデルの1つです)。プロジェクトにおける情報学者の役割は、予測変数を収集するツールを開発し、それらのモデルを使用して、結果を医師に送信することです。データは、電子カルテから、または看護師が記入するデータ入力画面などから収集できます。

現在、私(および他の多くの統計学者)は、データベースにクエリを実行して予測子を取得し、何らかのタイプのアラートを作成できるプログラミングを十分に理解していますが、情報学者に任せて喜んでいます(とにかく彼らはより優れています)。ロジスティック回帰モデルに適合するのに十分な統計を知っている情報学者がいます。したがって、このプロジェクトの単純なバージョンは、統計学者のみ、または情報学者のみが実行できますが、両方が連携する場合に最適です。このプロジェクトを見て、モデリングの部分が楽しい部分であり、データ収集、アラート、およびその他のインターフェースが、情報をモデルとの間で移動するための単なるツールであると考えると、統計学者になります。インターフェースの設計、データ取得の最適化、さまざまなタイプのアラートのテストなどが見られる場合。


(+1)この答えのバランスが気に入っています。最後の文が何を意図していたのかよくわかりません。
枢機卿

1
あなたの例はとてもいいと思います、そして土地の基本的な一般の良い肖像画を与えます。その部分だけもう一度投票できるといいのですが。乾杯。
枢機卿

あなたの例は本当にクールです。どうもありがとう。今私はただ一つ疑問に思っています。統計学者の場合、すべての統計モデルに信頼区間や仮説検定などの推論部分が必要かどうか、したがって確率モデルに基づいているかどうか。それ以外の場合は、プロットおよび要約によってデータセットを操作するだけです。
Honglang Wang

9

統計データから推測します。情報学データを操作します。もちろん、それらは重複しますが、より広い範囲を持っている問題には答えがありません。


「統計はデータから推測します。情報学はデータを操作します。」これは本当に確認したいことです。推論では、常に確率分布に基づいて、信頼区間または仮説検定を含める必要があります。それ以外の場合は、データを操作しているだけです。
Honglang Wang
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.