データサイエンス

データサイエンスの専門家、機械学習の専門家、およびこの分野に関する知識が豊富な方へ

4
勾配降下は常に最適に収束しますか?
勾配降下が最小に収束しないシナリオがあるかどうか疑問に思っています。 勾配降下が常にグローバルな最適値に収束することが保証されているわけではないことを認識しています。また、たとえば、ステップサイズが大きすぎると、最適値から逸脱する可能性があることも認識しています。しかし、ある最適から逸脱すると、最終的には別の最適に移行するように思えます。 したがって、勾配降下はローカルまたはグローバル最適に収束することが保証されます。そうですか?そうでない場合、大まかな反例を示してください。

1
LSTMを使用した時系列予測:時系列を静止させることの重要性
定常性と差分に関するこのリンクでは、ARIMAのようなモデルは平均、分散、自己相関などの統計的特性が時間とともに一定であるため、予測には定常化された時系列が必要であると述べられています。RNNは非線形関係を学習する能力が優れているため(ここでの説明:時系列予測のためのリカレントニューラルネットワークの約束)、データが大きい場合は従来の時系列モデルよりも優れたパフォーマンスを発揮するため、定常化の方法を理解することが不可欠ですデータは結果に影響します。答えを知る必要がある質問は次のとおりです。 従来の時系列予測モデルの場合、時系列データの定常性により、予測が容易になり、その理由と方法がわかります。 LSTMを使用して時系列予測モデルを構築する際、時系列データを固定することは重要ですか?もしそうなら、なぜですか?

4
ブートストラップと相互検証の違いは何ですか?
私は以前、機械学習モデルのロバスト評価にK分割交差検証を適用していました。しかし、この目的のためのブートストラップメソッドの存在も知っています。ただし、パフォーマンスの見積もりに関しては、両者の主な違いはわかりません。 私の知る限り、ブートストラップは一定の数のランダムなトレーニング+テストサブセットを(別の方法ではありますが)生成するので、CVよりもこの方法を使用する利点は何ですか?ブートストラップの場合、事実上任意の数のそのようなサブセットを人工的に生成できる可能性があることを私が理解できる唯一のことは、CVの場合、インスタンスの数はこれに対する一種の制限です。しかし、この側面はごくわずかな迷惑のようです。




3
データサイエンティストとしての私のキャリアを始めるには、ソフトウェアエンジニアリングの経験が必要ですか?[閉まっている]
閉まっている。この質問はトピック外です。現在、回答を受け付けていません。 この質問を改善したいですか? 質問を更新することがありますので、上のトピックデータサイエンススタックExchange用。 5年前に閉鎖されました。 私は、エディンバラ大学で機械学習と自然言語処理を専門とする修士課程の学生です。データマイニングに焦点を当てた実践的なコースと、機械学習、ベイジアン統計、グラフィカルモデルを扱うコースがありました。私の経歴はコンピューターサイエンスの理学士です。 ソフトウェアエンジニアリングをいくつか行い、デザインパターンなどの基本的な概念を学びましたが、大規模なソフトウェア開発プロジェクトに関与したことはありません。しかし、私はMScにデータマイニングプロジェクトがありました。私の質問は、データサイエンティストとしてのキャリアを希望する場合、まず大学院のデータサイエンティストのポジションに応募するか、大学院のソフトウェアエンジニアとしてのポジションを最初に取得すべきか、ビッグデータなどのデータサイエンスに関連するものかもしれませんインフラストラクチャまたは機械学習ソフトウェア開発? 私の懸念は、データサイエンスのために優れたソフトウェアエンジニアリングスキルが必要になる可能性があることであり、これらが大学院のデータサイエンティストとして直接働くことで得られるかどうかはわかりません。 さらに、現時点ではデータマイニングが好きですが、将来自分のキャリアをソフトウェアエンジニアリングに変えたい場合はどうすればよいですか?データサイエンスを専門に扱うのは難しいかもしれません。 私はまだ雇用されていないので、私の知識はまだ限られています。私は修士課程を修了しようとしていますので、明確化やアドバイスを歓迎します。10月上旬に大学院への応募を開始したいと思います。

2
Word2vecモデルを使用して単語を予測する
「??ドアを開くと、自動的に加熱が開始されます」という文が与えられます。 ??で可能な単語のリストを取得したい 確率で。 word2vecモデルで使用される基本的な概念は、周囲のコンテキストが与えられた単語を「予測」することです。 モデルが構築されたら、新しい文に対して予測タスクを実行するための正しいコンテキストベクトル操作は何ですか? それは単なる線形和ですか? model.most_similar(positive=['When','I','open','the','door','it','starts' ,'heating','automatically'])

14
データサイエンス会議?
これは、CrossValidatedのStatistics Conferences質問と同様の質問です 最も重要な年次データサイエンス会議は何ですか? ルール: 会議へのリンクを含める トークへのリンクを含めてください(YouTube、会議サイト、またはその他のビデオストリーミングサイト)
20 community 

4
単語のセマンティックな類似性の尺度を取得するにはどうすればよいですか?
単語の意味的類似性を把握する最良の方法は何ですか?Word2Vecは大丈夫ですが、理想的ではありません。 # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # Cold is much closer to 'hot' than 'popular' In [9]: model.similarity('hot', 'popular') Out[9]: 0.33708479049537632 NLTKのWordnetメソッドはあきらめたようです: In [25]: …

3
ディープラーニングライブラリを使用したテキストからのキーワード/フレーズ抽出
おそらくこれは広すぎるかもしれませんが、テキスト要約タスクでディープラーニングを使用する方法に関するリファレンスを探しています。 標準の単語頻度アプローチと文のランク付けを使用してテキストの要約を既に実装していますが、このタスクにディープラーニングテクニックを使用する可能性を調査したいと思います。また、センチメント分析にConvolutional Neural Networks(CNN)を使用してwildml.comで提供されているいくつかの実装も行っています。テキストの要約とキーワード抽出にTensorFlowやTheanoなどのライブラリをどのように使用できるか知りたいのですが。ニューラルネットの実験を始めてから約1週間が経過しました。これらのライブラリのパフォーマンスが、この問題に対する以前のアプローチと比較してどうなるか、とても楽しみです。 これらのフレームワークを使用したテキスト要約に関連する興味深い論文とgithubプロジェクトを特に探しています。誰かが私にいくつかの参照を提供できますか?

3
テキスト分類とトピックモデルの違いは何ですか?
機械学習におけるクラスタリングと分類の違いは知っていますが、ドキュメントのテキスト分類とトピックモデリングの違いはわかりません。ドキュメントに対してトピックモデリングを使用してトピックを特定できますか?分類方法を使用して、これらのドキュメント内のテキストを分類できますか?

2
ケラスvs. tf.keras
私は間を選択する際に混乱ビットだKeras(keras-チーム/ keras)とtf.keras私の新しい研究プロジェクトのために(tensorflow / tensorflow /パイソン/ keras /)。 Kerasは誰にも所有されていないという議論があります。そのため、人々は貢献することに満足しており、将来プロジェクトを管理するのがはるかに容易になります。‬ 他の側では、tf.kerasは、Googleがこれより厳密なテストとメンテナンスを所有しています。さらに、これはTensorflow v.2に存在する新機能を利用するためのより良いオプションのようです。 ですから、データサイエンス(機械学習)プロジェクト(研究段階)を開始するには、最初は両方とも大丈夫ですが、どちらを選択しますか?!‬

4
Intel GPUでTensorFlowを使用する
私はディープラーニングの初心者です。 TensorFlowをIntel GPUで使用する方法はありますか?はいの場合は、正しい方向に向けてください。 そうでない場合は、Intel Corporation Xeon E3-1200 v3 / 4th Gen Core Processor Integrated Graphics Controllerに使用できるフレームワーク(ある場合)(Keras、Theanoなど)をお知らせください。
20 tensorflow  keras  theano  gpu 

3
データを分割する前後のStandardScaler
を使用して読んでいたときStandardScaler、推奨事項のほとんどは、データを電車/テストStandardScaler に分割する前に使用する必要があると言っていましたが、オンラインで投稿されたコードの一部をチェックするときに(sklearnを使用して)2つの主要な用途がありました。 1- StandardScalerすべてのデータで使用。例えば from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_fit = sc.fit(X) X_std = X_fit.transform(X) または from sklearn.preprocessing import StandardScaler sc = StandardScaler() X = sc.fit(X) X = sc.transform(X) または単に from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_std = sc.fit_transform(X) 2- StandardScaler分割データで使用。 from sklearn.preprocessing import StandardScaler sc = …

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.