ログブック:機械学習のアプローチ


7

以前は、問題を解決するためにさまざまな機械学習アルゴリズムを試すときに、機能、機能の前処理、正規化、アルゴリズム、アルゴリズムパラメーターなどの詳細を保持しながら、ノートブックに一連のアプローチを溺れさせていました...したがって、手書きのログブックを作成する。

しかし、私は現在、「より専門的な」ツールを使用することを懸念しています。そのため、詳細を保持し、他のチームメンバーと共有することもできます。

これは、機能、アルゴリズム、アルゴリズムパラメータ、データの前処理、データ、メトリックなど、Googleの共同ドライブスプレッドシートを超えた詳細を考慮して、完了した作業を追跡する自動化された協調的なツールです。

これをどのように解決していますか?作業の進捗状況をどのように管理していますか?あなたの何日誌ツールは?

事前にどうもありがとうございました。

回答:


4

これをどのように解決していますか?作業の進捗状況をどのように管理していますか?ログブックツールは何ですか?

これは最善の方法ではないかもしれません。しかし、これが私のチームのやり方です。エンドツーエンドのデータサイエンス実験を成功させるには、適切な良心が非常に重要であるとGoogleは考えています。そのため、ディスカッションとミーティングで同じようにSlackを使用します。

それらに加えて、計画と分析のパーツを文書化するためのRmd(Rマークダウン)ファイルがあります。


1
マークダウンを使用するアイデアは好きですが、それが最善のアプローチ/ソリューションではないようです。それは出発点に適しています。私はSlackも使用しており、チームの調整や会議に使用することを強くお勧めします。
ホルヘ

@Jorgeええ、私はそれが最善のアプローチではないことに同意します:)しかし、私は費やす価値のある良い代替案を見つけていません!
Dawny33

3

これをチェックしてください、あなたが正確に必要なもののように見えますhttp://www.openml.org


これはGoogle製品ですか?UIは非常にグーグルのように見えます
Dawny33

1
知りません。私はそのサイトとは何の関係もありません。彼らは所有者とホスティング業者の情報を表紙に掲載しています。
ディエゴ

2

これをどのように解決していますか?作業の進捗状況をどのように管理していますか?ログブックツールは何ですか?

以下のために私の学士論文write-math.com)私は非常に高速なステップを前処理/異なるモデルを通過するために私自身の小さなツールキットを書きました。各実験には1つの構成ファイルがありました(hwr-experimentsリポジトリーを参照)。例えば:

data-source: feature-files/baseline-3-points
training: '{{nntoolkit}} train --epochs 1000 --learning-rate 0.1 --momentum 0.1 --print-errors --hook=''!detl
    test {{testing}},err=testresult_%e.txt'' {{training}} {{validation}}
    {{testing}} < {{src_model}} > {{target_model}} 2>> {{target_model}}.log'
model:
    type: mlp
    topology: 24:500:369

トレーニングされたモデルが保存されます。評価結果(精度、混乱マトリックスなど)を取得するのはかなり高速です。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.