コストを過小評価している場合でも、A *検索ヒューリスティックが最適なのはなぜですか?


8

A *検索は、ヒューリスティックが許容可能である限り、問題の最適な解決策を見つけます。つまり、特定のノードからへのパスのコストを過大評価することは決してありません(そして、一貫性がありますが、現時点では許容可能であることに焦点を当てましょう)。

しかし、ヒューリスティックが過小評価している場合、なぜ最適なソリューションが常に見つかるのでしょうか。たとえば、最適な経路を過小評価するよりも、非最適な経路を過小評価する場合、それは過大推定と同等ではありませんか?


2
どのような研究をしましたか?ほとんどの教科書には、A *が正しい理由が説明されているはずです。
DW

2
検討中のノードに関係なく常に0であるヒューリスティックを考えます。このアルゴリズムは、最適パスよりも非最適パスを常に過小評価します。A*このヒューリスティックが最適であることを示すことができますか?これA*により、より良いヒューリスティックが最適である理由がわかりますか?
Eric Lippert、2014年

回答:


19

A *は、検討中のオプションの優先度の高いキューを維持し、それらがどの程度優れているかによって並べ替えます。他のどのオプションもそれを改善することができないほど良い目標へのルートを見つけるまで、検索を続けます。代替案がどれほど優れているかは、ヒューリスティックと、これまでの検索で見つかった実際のコストに基づいています。

ヒューリスティックが過小評価している場合、他のオプションは実際よりも見栄えがよくなります。A *はこれらの他のオプションがルートを改善する可能性があると考えているので、それらをチェックアウトします。ヒューリスティックが少しだけ過小評価している場合、それらのルートのいくつかは有用であることがわかるでしょう。一方、ヒューリスティックな過大評価の場合、A *は、ルートへの代替案がすでにひどいものであると考えることができるため、それらを確認する必要はありません。しかし、ヒューリスティックは過大評価しているため、見かけよりもはるかに優れている可能性があります。

たとえば、シカゴからニューヨーク車で移動しようとしているときに、友人が地理についてヒューリスティックに考えているとします。最初の友達が「ねえ、ボストンはニューヨークに近い」(過小評価)と言ったら、ボストン経由のルートを探すのに時間を無駄にします。やがて、シカゴからボストンへの賢明なルートは、ボストンに到達する前にすでにニューヨークにかなり近づいており、実際にボストンを経由すると、さらにマイルが増えることに気付くでしょう。したがって、ボストン経由のルートの検討をやめて、最適なルートを見つけることに進みます。あなたの過小評価している友人はあなたに少しの計画時間を費やしました、しかし結局、あなたは正しいルートを見つけました。

別の友人が「インディアナはニューヨークから100万マイルです」と言ったとします。地球上の他のどの場所もニューヨークから13,000マイルを超えていないので、あなたが友人の忠告を文字どおりに受け取れば、インディアナを通るルートさえ考慮しません。これにより、運転時間はほぼ2倍になり、距離は50%長くなります。おっとっと。


4

最適パスを過小評価するよりも非最適パスを過小評価する場合、最適パスを探索する前にそれらのパスを探索することは事実です。重要であり、これが許容性を保証するのは、最適ではないパスを探索している間、最適なパスを探索する前に目標を見つけて検索を終了しないことです。これは、これらの非最適パスがダウンすると、最初は優れているように見えても、それらのコスト/長さが増え始め、ある時点でアルゴリズムが最適パスを探索するために戻るためです。目標へのコストを過大評価することが許可されており、最適パスを下回った場合、実際には非最適パスを下って目標を見つける可能性があります(これにより、検索が終了し、


サイトへようこそ!私はあなたがそれが便利であり続けてくれることを望みます。ショートツアーでは、Stack Exchangeサイトを効果的に使用する方法について説明します。
David Richerby 2017年

2

A *とベストファースト検索の重要な違いは、A *が推定関数によって与えられた値を組み合わせるということです e 検討中のノードへの(現在知られている最短の)パスの長さ。

ゴールまでの最適な経路に長さがあると仮定します k; 次に、開始状態の推定値は最大でk、および -最適パスに沿ったノード、推定は最大で k。これにより、アルゴリズムがスプリアスパスをどれだけ追跡するかの境界が与えられますp; あなたがより多くを取ったらすぐにk 歩きます p、現在探索されている最適パスのプレフィックスがより良く見える p 放棄されます。

本質的に、A *検索は、幅優先(情報なし、最短経路を見つけることが保証されているが遅い)と最高優先(推定関数によって導かれ、場合によっては高速ですが、推定の品質に大きく依存します)の中間に位置します。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.