TensorFlowのドキュメント、prefetch
およびクラスのmap
メソッドにはtf.contrib.data.Dataset
、両方ともというパラメータがありますbuffer_size
。
ためのprefetch
方法は、パラメータとして知られているbuffer_size
とマニュアルに従って。
buffer_size:tf.int64スカラーtf.Tensor。プリフェッチ時にバッファーされる要素の最大数を表します。
ためのmap
方法は、パラメータとして知られているoutput_buffer_size
とマニュアルに従って。
output_buffer_size:(オプション)バッファリングされる処理済み要素の最大数を表すtf.int64スカラーtf.Tensor。
同様に、shuffle
メソッドについては、同じ数量が表示され、ドキュメントに従っています:
buffer_size:新しいデータセットがサンプリングする、このデータセットからの要素の数を表すtf.int64スカラーtf.Tensor。
これらのパラメータ間の関係は何ですか?
Dataset
次のようにオブジェクトを作成するとします。
tr_data = TFRecordDataset(trainfilenames)
tr_data = tr_data.map(providefortraining, output_buffer_size=10 * trainbatchsize, num_parallel_calls\
=5)
tr_data = tr_data.shuffle(buffer_size= 100 * trainbatchsize)
tr_data = tr_data.prefetch(buffer_size = 10 * trainbatchsize)
tr_data = tr_data.batch(trainbatchsize)
buffer
上記のスニペットのパラメーターはどのような役割を果たしていますか?