タグ付けされた質問 「apache-flink」

4
FlinkとStormの主な違いは何ですか?
FlinkはSparkと比較されていますが、これはウィンドウ表示のイベント処理システムをマイクロバッチ処理と比較するため、これは間違った比較です。同様に、FlinkをSamzaと比較しても、あまり意味がありません。どちらの場合も、Samzaの場合は「スケール」が小さくても、リアルタイムとバッチ処理のイベント処理戦略を比較します。しかし、私はFlinkとStormの比較を知りたいと思っています。 私はこれ(スライド4)でFlinkの「調整可能なレイテンシ」としての主な違いを説明しています。もう1つのヒントは、FlinkがSparkまたはHadoopMRの世界によりよく統合されることを示唆するSlicon Angleの記事のようですが、実際の詳細については言及も参照もされていません。最後に、Fabian Hueske自身がインタビューで、「Apache Stormと比較して、Flinkのストリーム分析機能は高レベルのAPIを提供し、より軽量なフォールトトレランス戦略を使用して、1回限りの処理を保証します」と述べています。 私にとってそれは少しまばらであり、私は要点をまったく理解していません。誰かがStormでのストリーム処理のどの問題をFlinkによって正確に解決できるのか説明できますか?APIの問題とその「より軽量なフォールトトレランス戦略」でHueskeは何を参照していますか?

1
バッチ処理でSpark / FlinkよりもApacheBeamの利点は何ですか?
Apache Beamは、ApacheSparkやFlinkなどの複数のランナーバックエンドをサポートしています。私はSpark / Flinkに精通しており、バッチ処理のBeamの長所/短所を確認しようとしています。 Beamの単語数の例を見ると、ネイティブのSpark / Flinkの同等のものと非常に似ているように感じますが、構文が少し冗長になっている可能性があります。 私は現在、そのようなタスクにSpark / FlinkよりもBeamを選択することに大きなメリットは見られません。私がこれまでに行うことができる唯一の観察: 長所:さまざまな実行バックエンドの抽象化。 短所:この抽象化には、Spark / Flinkで実行される内容を正確に制御できないという代償が伴います。 ビームモデルの他の長所/短所を強調するより良い例はありますか?制御の喪失がパフォーマンスにどのように影響するかについての情報はありますか? この質問で部分的にカバーされ、この記事で要約されているストリーミングの側面の違いを求めていないことに注意してください(Spark 1.Xのために古くなっています)。
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.