はい、可能です。例から正規表現を生成できます(テキスト->必要な抽出)。これは、作業を行うオンラインツールです。http://regex.inginf.units.it/
Regex Generator ++オンラインツールは、GP検索アルゴリズムを使用して、提供された例から正規表現を生成します。GPアルゴリズムは、より高いパフォーマンスとよりシンプルなソリューション構造(OccamのRazor)につながる多目的フィットネスによって駆動されます。このツールは、トリエステ大学Machine Lerning Lab(トリエステ大学)によるデモアプリケーションです。こちらのビデオチュートリアルをご覧ください。
これは研究プロジェクトなので、使用されているアルゴリズムについてここで読むことができます。
見よ!:-)
例から意味のある正規表現/解決策を見つけることは、提供された例が問題をよく説明している場合にのみ可能です。抽出タスクを説明するこれらの例を検討してください。特定のアイテムコードを探しています。例はテキスト/抽出ペアです:
"The product code is 467-345A" -> "467-345A"
"The item 789-345B is broken" -> "789-345B"
例を見ると、(人間の)男は「商品コードは\ d ++-345 [AB]のようなものです」と言うかもしれません。
アイテムコードの方が許容範囲が広いが、他の例を提供していない場合、問題をよく理解するための証拠はありません。人間が生成したソリューション\ d ++-345 [AB]を次のテキストに適用すると、失敗します。
"On the back of the item there is a code: 966-347Z"
一致とは何か、望ましい一致ではないものをより適切に説明するために、他の例を提供する必要があります。--ie:
"My phone is +39-128-3905 , and the phone product id is 966-347Z" -> "966-347Z"
電話番号は製品IDではありません。これは重要な証明になる場合があります。