森のシーンの画像で(トレイルに沿って立っているカメラの視点から)トレイルを特定するための研究/論文/ソフトウェアを知っている人はいますか?
私は次のような画像を取ることができるアルゴリズムを見つけようとしています:
次のような「トレイル」を特定するマスクを作成します。
ご覧のとおり、元の画像は少しぼやけており、意図的です。画像ソースは完全な焦点を保証することはできないため、適度な量のノイズとぼやけを処理できる必要があります。
私が最初に考えたのは、ガウスぼかしを適用し、画像をブロックに分割し、隣接するブロックを比較してシャープな色の違いを探します(トレイルの「エッジ」を示します)。しかし、私はすぐに、影や照明の他の変化が簡単にそれを放散することに気付きました。
私はSURFの特徴を抽出することを考えていましたが、画像が完全に鮮明で一貫した照明である場合にのみ、SURF / SIFTで成功しました。
また、画像とマスクをはるかに小さいサイズ(100x75など)に縮小し、1xNベクトルに変換し、それらを使用してFANNベースのニューラルネットワークをトレーニングしようとしました(画像は入力で、マスクが必要です)出力)。入力ベクトルの75%のサイズの1つの隠れ層があるこのような小さなサイズでさえ、トレーニングに6時間かかりましたが、それでもテストセット内のマスクを予測できませんでした。
誰もが主題に関する他の方法や論文を提案できますか?