正規表現を使用してMediaWikiサイトを検索することは可能ですか?


9

WikipediaやWikimedia Commonsなどのサイトで正規表現を使ってフレーズを検索したいのですが。これは可能ですか?

正規表現検索クエリの例:(facebook | google)(corporate history | websites)

Googleでも同じことが可能です(ここで説明しています)。ウィキペディアでも可能かどうかを知りたいのですが。


数ギガバイトのデータをダウンロードして、自分のコンピュータですべてのフィルタリングを実行してもよろしいですか?
19:46にスビック

AutoWikiBrowserを使用してこれを行うことができるようです:en.wikipedia.org/wiki/Wikipedia
Anderson Green

AWBを使用して特定のページ(または一連のページ)を検索することはできますが、Wiki全体を検索することはできません。
スビック

はい、wiki全体を検索したいと思っていました。このためのツールサーバーにツールはありますか?
アンダーソングリーン

回答:


3

検索エンジンに依存している限り、単純な正規表現を使用してWikipedia(または検索エンジンがアクセスできる他のサイト)を検索することができます。次のGoogle検索クエリは、Wikipediaで正規表現の一致を検索します(Yahoo|Google|Microsoft)

https://www.google.com/#hl=en&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft)&gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4&pbx = 1&bav = on .2、or.r_cp.r_qf。&bvm = bv.44158598、d.dmg&fp = dc8abc04c054405e&biw = 1366&bih = 639



2

これは、利用可能とによって供給だCirrusSearch(に基づいてElasticSearch MediaWikiのサイトで使用される検索エンジン、およびウィキメディア・プラットフォームです)。

いくつかの使用例:

注:完全なガイドのリファレンスとソース-WikipediaHelp:Searching#Search_string_syntax

あなたの質問については:

論理演算子

検索エンジンは、検索でブールロジックをサポートします。論理演算子には、「論理否定」の「-」(マイナス記号)文字、AND、OR、およびグループ化括弧括弧(_)が含まれます。

論理ORは大文字でつづる必要があります。AND演算子はすべての用語(スペースで区切られている)と見なされますが、大文字のANDは同等です。

その他の例:

  • シンプルはANDOR"credit card" OR "payment card""credit card" AND "payment card"-期待どおりに動作します。
  • 例えば、探し-あいまい検索(「のような音」)のために文字チルダ接尾辞charlie~ parker~戻りCharlie ParkerCharles PalmerCharley Parks(最初のものを含まない2つの文字の違いまで、)。
  • ワイルドカード検索-検索face*e-で始まり、途中に何かがあればface終わりeます。 ここに画像の説明を入力してください

追加の読書

検索エンジンとこの拡張機能の詳細を読んで、完全な機能と特徴を明らかにしてください。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.