私はデータサイエンティストであり、現在と近い将来の両方の現代の天文学における彼らの役割に興味があります。データサイエンティストが天文学で最も活躍している役割とプロジェクトの種類は何ですか?天文学のデータサイエンティストによって提供される基本的なソリューションは何ですか。主任研究者としてデータサイエンティストはいますか、それとも少なくとも研究活動のチームメンバーですか?
私はデータサイエンティストであり、現在と近い将来の両方の現代の天文学における彼らの役割に興味があります。データサイエンティストが天文学で最も活躍している役割とプロジェクトの種類は何ですか?天文学のデータサイエンティストによって提供される基本的なソリューションは何ですか。主任研究者としてデータサイエンティストはいますか、それとも少なくとも研究活動のチームメンバーですか?
回答:
天文学者は、多くの天体観測技術により、ビッグ(より古い)データ時代に向かっています。今後のリリースには、LSST、JWST、WFIRSTなどがあります。
測量という意味で、通常は数日かけて全天を観測し、何度も繰り返します。また、調査のほとんどは画像技術であるため、画像のすべてのピクセルが重要です。
したがって、1日に受信するデータの量、および天文学(および宇宙論)の多くの分野で重要なデータサイエンスの量を想像できます。したがって、データサイエンスは、調査のデータを分析することになると、一種の引き継ぎです。
私は天文学者であり、データサイエンティストとして再教育するために多くの仕事のオファーを受け取っていますが、他の方法をとるのはもっと難しいかもしれません。
天文学は間違いなく「ビッグデータ」が重要な分野であり、私たちが毎日使用する分析と視覚化の技術は、コンピューター科学者に教えられているものよりもおそらく数十年遅れています。ただし、ほとんどの天文学ソフトウェアは非常にニッチで、世界中の少数の人々だけが使用しており、通常は特定の目的に合わせて編集されています。標準化して広く使用できるより一般的な天文ソフトウェアを作成する試みを見てきましたが、通常は毎回少しずつ異なる制約で作業しているため、自動化および標準化できるタスクを見つけるのは困難です。
数年前に、コンピュータサイエンスを学部で学び、その後天文学に移った博士課程の学生に出会いました。彼は、私たちが今手に入れようとしている技術がどれほど古いかに驚いていましたが、彼は自分が何であるかを理解するのに本当に苦労しましたデータのエラーとノイズのすべての原因を知る天文学的な知識を持っていなかったため、分析を試みました。
望遠鏡のパイプラインなど、より抽象的な問題に取り組んでいるデータサイエンティストがいると思いますが、残念ながら、この領域については観察上の問題であり、私の研究は理論的なものであるため、あまりアドバイスはできません。