毎分データセットを生成するスパークストリーミングアプリケーションがあります。処理したデータの結果を保存/上書きする必要があります。
データセットorg.apache.hadoop.mapred.FileAlreadyExistsExceptionを上書きしようとすると、実行が停止します。
Sparkプロパティを設定しましたset("spark.files.overwrite","true")
が、うまくいきません。
スパークからファイルを上書きまたは事前削除するにはどうすればよいですか?
set("spark.files.overwrite","true")
を介して追加されたファイルに対してのみ機能しますspark.addFile()