タグ付けされた質問 「machine-learning」

機械学習アルゴリズムに関する実装の質問。機械学習に関する一般的な質問は、特定のコミュニティに投稿する必要があります。

6
Appleはどのように電子メールの日付、時刻、アドレスを見つけますか?
iOSメールクライアントでは、メールに日付、時刻、場所が含まれている場合、テキストがハイパーリンクになり、リンクをタップするだけで予定を作成したり、地図を見たりすることができます。英語のメールだけでなく、他の言語でも機能します。私はこの機能が大好きで、彼らがそれをどのように行うかを理解したいと思います。 これを行う素朴な方法は、多くの正規表現を用意してそれらをすべて実行することです。ただし、これはあまりスケールできず、特定の言語や日付形式でのみ機能します。Appleは、エンティティを抽出するために機械学習の概念を使用している必要があると思います(8:00 PM、8PM、8:00、 0800、20:00、20h、20h00、2000など)。 Appleがどのようにして電子メールクライアントでエンティティを非常に迅速に抽出できるかについてのアイデアはありますか?どのような機械学習アルゴリズムを適用して、このようなタスクを達成しますか?

3
1つのホットエンコーディングで機械学習のパフォーマンスが向上するのはなぜですか?
ワンホットエンコーディングを特定のデータセット(マトリックス)で使用し、学習アルゴリズムのトレーニングデータとして使用すると、元のマトリックス自体をトレーニングデータとして使用する場合と比較して、予測精度に関してはるかに優れた結果が得られることに気付きました。このパフォーマンスの向上はどのように起こりますか?


6
TensorFlowのステップとエポックの違いは何ですか?
ほとんどのモデルには、データを実行するステップの数を示すstepsパラメータがあります。しかし、ほとんどの実際的な使用法では、フィット関数N epochsも実行しています。 1エポックで1000ステップを実行することと10エポックで100ステップを実行することの違いは何ですか?実際にはどちらが良いですか?連続するエポック間でロジックの変更はありますか?データシャッフル?

3
Python-正確にはsklearn.pipeline.Pipelineとは何ですか?
どのようにsklearn.pipeline.Pipeline動作するのか正確に理解できません。 ドキュメントにいくつかの説明があります。たとえば、次の意味は何ですか。 最終的な推定量を使用した変換のパイプライン。 私の質問をより明確にするために、何stepsですか?それらはどのように機能しますか? 編集する 回答のおかげで、質問をより明確にすることができます: パイプラインを呼び出して、ステップとして、2つのトランスフォーマーと1つの推定器を渡します。例: pipln = Pipeline([("trsfm1",transformer_1), ("trsfm2",transformer_2), ("estmtr",estimator)]) これを呼び出すとどうなりますか? pipln.fit() OR pipln.fit_transform() 推定器を変圧器にする方法や、変圧器を取り付ける方法を理解できません。

6
C#の機械学習ライブラリ[終了]
現在のところ、この質問はQ&A形式には適していません。事実、参考文献、専門知識によって回答が裏付けられることを期待していますが、この質問は、討論、議論、投票、または拡張ディスカッションを求める可能性があります。この質問を改善でき、再開できると思われる場合は、ヘルプセンターにアクセスしてください。 8年前に閉鎖。 C#に機械学習ライブラリはありますか?私はWEKAのようなものを求めています。ありがとうございました。

12
リモートサーバーでTensorboardを実行するにはどうすればよいですか?
私はTensorflowを初めて使用するので、自分が何をしているかを視覚化することで大きなメリットが得られます。Tensorboardは便利な視覚化ツールであることを理解していますが、リモートのUbuntuマシンで実行するにはどうすればよいですか?

9
Google Colaboratory:GPUに関する誤解を招く情報(一部のユーザーは5%のRAMしか利用できません)
更新:この質問は、Google Colabの「ノートブック設定:ハードウェアアクセラレータ:GPU」に関連しています。この質問は、「TPU」オプションが追加される前に書かれました。 Google Colaboratoryが無料のTesla K80 GPUを提供していることについての興奮する発表を何度も読んで、私はそれについてfast.aiのレッスンを実行しようとしました。その理由を調べ始めました。 結論としては、「無料のTesla K80」は「無料」ではないということです。一部の場合、「無料」である場合もあります。 カナダ西海岸のGoogle Colabに接続しましたが、24GB GPU RAMであるはずの0.5GBしか取得できません。他のユーザーは11GBのGPU RAMにアクセスできます。 明らかに0.5GB GPU RAMはほとんどのML / DL作業には不十分です。 何が得られるかわからない場合は、ここで一緒に削った小さなデバッグ関数を示します(ノートブックのGPU設定でのみ機能します)。 # memory footprint support libraries/code !ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smi !pip install gputil !pip install psutil !pip install humanize import psutil import humanize import os import GPUtil as GPU GPUs = GPU.getGPUs() …

8
期待値最大化手法の直感的な説明とは何ですか?[閉まっている]
休業。この質問には、より焦点を当てる必要があります。現在、回答を受け付けていません。 この質問を改善してみませんか?質問を更新して、この投稿を編集するだけで1つの問題に焦点を当てます。 2年前休業。 この質問を改善する 期待値最大化(EM)は、データを分類するための一種の確率的手法です。分類器でない場合は、誤りがあれば訂正してください。 このEM技術の直感的な説明は何ですか?expectationここには何があり、何があるのmaximizedでしょうか。

4
scikit learnを使用したマルチクラスケースの精度、再現率、精度、およびf1スコアを計算する方法
私はデータがこのように見える感情分析問題で働いています: label instances 5 1190 4 838 3 239 1 204 2 127 したがって、1190はでinstancesラベル付けされて5いるため、私のデータは不均衡です。分類については、scikitのSVCを使用しています。問題は、マルチクラスの場合の精度、再現率、精度、およびf1-scoreを正確に計算するために、データを正しい方法でバランスを取る方法がわからないことです。だから私は次のアプローチを試しました: 最初: wclf = SVC(kernel='linear', C= 1, class_weight={1: 10}) wclf.fit(X, y) weighted_prediction = wclf.predict(X_test) print 'Accuracy:', accuracy_score(y_test, weighted_prediction) print 'F1 score:', f1_score(y_test, weighted_prediction,average='weighted') print 'Recall:', recall_score(y_test, weighted_prediction, average='weighted') print 'Precision:', precision_score(y_test, weighted_prediction, average='weighted') print '\n clasification report:\n', …

5
Kerasでの "Flatten"の役割は何ですか?
FlattenKeras における関数の役割を理解しようとしています。以下は、単純な2層ネットワークである私のコードです。形状(3、2)の2次元データを取り込み、形状(1、4)の1次元データを出力します。 model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', optimizer='SGD') x = np.array([[[1, 2], [3, 4], [5, 6]]]) y = model.predict(x) print y.shape これyは、形状(1、4)の出力です。ただし、Flatten線を削除すると、y形(1、3、4)のものが印刷されます。 分かりません。ニューラルネットワークについての私の理解から、このmodel.add(Dense(16, input_shape=(3, 2)))関数は、16ノードの完全に接続された非表示のレイヤーを作成しています。これらの各ノードは、3x2入力要素のそれぞれに接続されています。したがって、この最初のレイヤーの出力にある16個のノードはすでに「フラット」です。したがって、最初のレイヤーの出力形状は(1、16)になります。そして、第2層はこれを入力として、形状(1、4)のデータを出力する。 では、最初のレイヤーの出力がすでに「フラット」で形状(1、16)である場合、なぜさらにフラットにする必要があるのでしょうか。

2
Kerasでの多対一および多対多のLSTMの例
私はLSTMと、それらをKerasで構築する方法を理解しようとしています。私は、RNNを実行するために主に4つのモードがあることを発見しました(図の4つの正しいモード) 画像ソース:Andrej Karpathy さて、それぞれのミニマルなコードスニペットがKerasでどのように見えるのかと思います。だから何かのような model = Sequential() model.add(LSTM(128, input_shape=(timesteps, data_dim))) model.add(Dense(1)) 4つのタスクのそれぞれについて、少しの説明があるかもしれません。

9
ニューラルネットワークの重みを乱数に初期化する必要があるのはなぜですか?
私はニューラルネットワークをゼロから構築しようとしています。すべてのAI文献全体で、ネットワークの収束を速くするために、重みを乱数に初期化する必要があるというコンセンサスがあります。 しかし、なぜニューラルネットワークの初期の重みが乱数として初期化されるのでしょうか。 これは「対称性を壊す」ために行われ、これによりニューラルネットワークの学習が速くなることをどこかで読んだことがあります。対称性を壊すことで、学習がどのように速くなりますか? 重みを0に初期化した方がいいでしょうか?そのようにして、重みはそれらの値(正または負にかかわらず)をより速く見つけることができますか? 初期化時に重みが最適値に近いことを期待することとは別に、重みをランダム化する背後にある他の基本的な哲学はありますか?

4
多層パーセプトロン(MLP)アーキテクチャ:隠れ層の数と隠れ層のサイズを選択するための基準?
10個の固有ベクトルがある場合は、入力層に10個のニューラルノードがあります.5個の出力クラスがある場合は、出力層に5個のノードがあります。ただし、MLPの非表示層の数とニューラル数1つの非表示レイヤー内のノード?


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.