回答:
アプリオリアルゴリズムは、データマイニングで使用される相関ルールマイニングアルゴリズムです。これは、指定された数のトランザクションの中から頻繁に使用されるアイテムセットを見つけるために使用されます。
基本的に2つのステップで構成されています
これらの手順をk回繰り返します(kはアイテムの数)。最後の反復では、k個のアイテムを含む頻繁なアイテムセットを取得します。
詳細な例http://nikhilvithlani.blogspot.com/2012/03/apriori-algorithm-for-data-mining-made.htmlを使用した非常に簡単な説明については、こちらをご覧ください。
複雑な方程式がなく、簡単な説明があります。
平易な英語のアプリオリ。
Aprioriは、レベルごとの検索と呼ばれる反復アプローチを採用しています。この場合、kアイテムセットを使用して(k + 1)アイテムセットを探索します。まず、データベースをスキャンして各アイテムの数を累積し、最小サポートを満たすアイテムを収集することにより、頻繁な1アイテムセットのセットが見つかります。結果のセットはL1として示されます。次に、L2を見つけるためにL1が使用されます。これは、L3を見つけるために使用される頻繁な2項目セットのセットなどで、これ以上頻繁なk項目セットが見つからなくなるまで続きます。各Lkを見つけるには、データベースの1回のフルスキャンが必要です。
最後の反復では、基本的にアソシエーションルールと呼ばれる多くのkアイテムセットが作成されます。すべての可能なルールのセットから興味深いルールを選択するために、サポートや信頼などのさまざまな制約測定が適用されます。
用語と用語
結合ステップ:1アイテムセットはそれ自体と自己結合して2アイテムセットを生成することを意味します。
プルーニングステップ:結合からの結果セットは、最小サポートしきい値でフィルタリングされます。
カーディナリティセット:プルーンステップからの結果セット。
サポート = 'a'と 'b'を含むトランザクションの数/トランザクションの合計数。
サポート=> supp(a、b)=> p(a U b)
確信度 =「a」と「b」を含むトランザクションの数/「a」を含むトランザクションの数
確信度=> con(a、b)==> P(b | a)条件付き確率のみ。