私のクラスであるRandomized Algorithmsのためにこの本を読んでいます。この特定の本では、ランダム選択を使用して配列の中央値を見つけることに専念するセクション全体があり、より効率的なアルゴリズムにつながります。今、私は、理論の改善に加えて、コンピューターサイエンスの領域で、このアルゴリズムの実用的なアプリケーションがあるかどうかを知りたかったのです。配列の中央値を見つける必要があるアルゴリズムまたはデータ構造はありますか?
私のクラスであるRandomized Algorithmsのためにこの本を読んでいます。この特定の本では、ランダム選択を使用して配列の中央値を見つけることに専念するセクション全体があり、より効率的なアルゴリズムにつながります。今、私は、理論の改善に加えて、コンピューターサイエンスの領域で、このアルゴリズムの実用的なアプリケーションがあるかどうかを知りたかったのです。配列の中央値を見つける必要があるアルゴリズムまたはデータ構造はありますか?
回答:
理論的な改善に加えて、コンピューターサイエンスの領域でこのアルゴリズムの実用的なアプリケーションがある場合
このアルゴリズムの適用は簡単です。一連のデータ(言い換えれば配列)の中央値を計算する場合はいつでも使用します。このデータは、天体観測、社会科学、生物学的データなど、さまざまな領域から取得される場合があります。
ただし、平均値(またはモード)の中央値を選択するタイミングについて言及する価値があります。基本的に、記述統計では、データが完全に正規分布している場合、平均、モード、および中央値は等しい、つまり一致します。一方、データが歪んでいる場合、つまりデータの頻度分布が(左/右)歪んでいる場合、歪度が通常の値から左または右にドラッグしているため、平均は最適な中心位置を提供できません、中央値は歪んだデータの影響をそれほど受けないため、典型的な値を指すこの位置を最もよく保持します。したがって、歪んだデータを処理する場合は、中央値の計算が望ましい場合があります。
また、機械学習は、中央値クラスタリングなど、統計的手法が頻繁に使用される場所です。
中央値フィルタリングは、画像処理における特定の種類のノイズの削減に一般的です。特に塩と胡noiseのノイズ。これは、画像の各ローカル近傍の各カラーチャンネルの中央値を選択し、それに置換することにより機能します。これらの近隣の大きさはさまざまです。一般的なフィルターサイズ(周辺)は、たとえば3x3および5x5ピクセルです。
中央値の計算は、ランダム化アルゴリズムでは特に重要です。
かなり頻繁に、少なくとも確率を持つ近似アルゴリズムがあります。
中央値の中央値は、いくつかのアプリケーションがあります。