階層的分類法からの複数のクラスに基づく類似性測定?


7

複数のクラスがあり、各クラスが階層の一部であるオブジェクトに、類似性の測定を推奨する人はいますか?

たとえば、クラスが次のようになっているとします。

1 Produce
  1.1 Eggs
    1.1.1 Duck eggs
    1.1.2 Chicken eggs
  1.2 Milk
    1.2.1 Cow milk
    1.2.2 Goat milk
2 Baked goods
  2.1 Cakes
    2.1.1 Cheesecake
    2.1.2 Chocolate

オブジェクトには、上記のアイテムのタグを任意のレベルで付けることができます。例:

Omelette: eggs, milk (1.1, 1.2)
Duck egg omelette: duck eggs, milk (1.1.1, 1.2)
Goat milk chocolate cheesecake: goat milk, cheesecake, chocolate (1.2.2, 2.1.1, 2.1.2)
Beef: produce (1)

クラスが階層の一部ではなかった場合、おそらくオブジェクトに割り当てられたクラス間のコサイン類似性(または同等のもの)を確認しますが、同じ親を持つ異なるクラスも同じであるという事実を使用したいと思います。ある程度の類似性の値があります(たとえば、上の例では、牛肉はどちらもクラス「1農産物」のアイテムを持っているため、オムレツと多少類似しています)。

それが役立つ場合、階層には最大200のクラスがあり、最大深度は5です。

回答:


9

最良の類似性尺度の選択についてアドバイスするのに十分な専門知識はありませんが、さまざまな論文でそれらの多くを見てきました。以下の研究論文のコレクションは、研究に最適な指標を決定する際に役立つことを願っています。より包括的にカバーするために、クラス情報を含む階層的分類への頻度主義的アプローチとベイズ的アプローチの両方を使用して、意図的に論文を含めたことに注意してください。

頻繁なアプローチ:

ベイジアンアプローチ:


1
それらのリンクをありがとう、2番目のダウンはほぼ正確に私が求めていたものであることがわかりました。
Dave Challis

1
@DaveChallis:私の喜び!お役に立てて嬉しいです。
Aleksandr Blekh
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.