リフトは、信頼度と期待される信頼度の比に他なりません。関連ルールの分野では、「1.0より大きいリフト率は、前件と後件の間の関係が、2つのセットが独立している場合に予想されるよりも重要であることを意味します。リフト率が大きいほど、関連が大きくなります。 」例えば-
スーパーマーケットデータベースに100,000のPOSトランザクションがあり、そのうち2,000がアイテムAとBの両方を含み、そのうち800がアイテムCを含む場合、関連付けルール「AとBが購入された場合、Cは同じで購入されます」 800件のトランザクション(または0.8%= 800 / 100,000)、40%(= 800 / 2,000)の信頼度をサポートしています。サポートを考える1つの方法は、データベースからランダムに選択されたトランザクションに前件と後件のすべてのアイテムが含まれる確率であるのに対して、信頼度はランダムに選択されたトランザクションに含まれるすべてのアイテムが含まれる条件付き確率ですその結果、トランザクションには前件のすべてのアイテムが含まれます。
上記の例を使用すると、この場合、期待される自信は、「AとBを購入してもCを購入する確率が向上しない場合の自信」を意味します。結果を含むトランザクションの数をトランザクションの総数で割ったものです。Cのトランザクションの総数が5,000であるとします。したがって、期待される信頼度は5,000 / 1,00,000 = 5%です。スーパーマーケットの例では、リフト=信頼度/期待される信頼度= 40%/ 5%= 8です。したがって、リフトは、if(前件)部分が与えられたthen(後件)の確率の増加に関する情報を提供する値です。
ここにソース記事へのリンクがあります