オフラインで使用するためにMediaWikiをダンプする方法は?


16

MediaWikiサイトのオフラインバージョンを毎週作成できるようにしたいと思います。

DumpHTMLのそれは、すべての記事やメディアファイルをダンプするよう拡張は実際に、私が欲しいものありませんが、私はダンプにナビゲートすることはできませんので、私は、それがダンプされているすべての記事のいずれかのインデックスを参照することはできません。

MediaWiki のXMLダンプ機能について読んで、プログラムを使用してこれらのファイルを表示するか、おそらくHTMLに変換することが可能かどうか疑問に思います。

または、MediaWikiサイトのオフラインバージョンを作成する他の方法はありますか?


本当にインデックスが必要ですか?開始してMain Page、そこからリンクをたどってください。
イルマリカロネン

ここにあるカム・ウェッブの指示 MediaWikiのサイトの静的なバージョンを作るために。彼らが誰かを助けるために、ここに私自身のものがあります。どちらも静的な結果へのリンクを提供します(ここの私のもの)。
マイケルアラン

回答:


8

サイトをHTMLファイルとして保存するwebcrawlerツールを使用できます。すべてのリンクが変換されるため、メインページを開いて、たとえば、リンクをクリックしてすべてのサイトにアクセスできます。

これらのツールは多数あります。私はwgetを使用します。これはコマンドラインベースであり、数千のオプションがあるため、あまりフレンドリーではありません。しかし、それは非常に強力です。

たとえば、ここに自分のmediawikiサイトをダンプするために使用したコマンドラインがあります。自分で使用する前に、各オプションを理解することをお勧めします。

"c:\program files\wget\wget" -k -p -r -R '*Special*' -R '*Help*' -E http://example.com/wiki

10

Wikimediaダンプサイト-pages-articles.xml.bz2からを取得し、WikiTaxiで処理できます(左上隅からダウンロード)。Wikitaxi Importツールは、ファイルから(Wikipediaの場合は約15Gb)ファイルを作成します。このファイルは、WikiTaxiプログラムが記事を検索するために使用します。エクスペリエンスは、ブラウザーエクスペリエンスに非常に似ています。.taxi.bz2

または、すでに処理されたダンプ(ファイル)も提供するため、Kiwixを使用してセットアップを高速化.zimできます。他のMediaWikiサイトをkiwix mwofflinerで使用するためにコメントが指定されているため、カスタムの違いがある可能性があるため、すべてで機能するわけではありませんが、私が遭遇した唯一のバリアントです。

ウィキメディアのものを wgetは良い習慣はありません。あまりにも多くの人がそれを行うと、サイトがリクエストであふれることがあります。


後で画像をオフラインにする場合のケースの編集:

XOWAプロジェクト

Wikipediaの完全なミラー(画像を含む)が必要な場合は、完全なHTML形式をそのまま使用し、約30時間でダウンロードしますで場合は、次を使用する必要があります。

英語版ウィキペディアには多くのデータがあります。20.0 GBを超えるテキストを含む1390万以上のページと、370万以上のサムネイルがあります。

XOWA

これをすべてコンピューターにセットアップするのは簡単なプロセスではありません...インポート自体には、80GBのディスクスペースとテキストバージョンの5時間の処理時間が必要です。画像も必要な場合、数値は100GBのディスク容量と30時間の処理時間に増加します。ただし、完了すると、最新の英語版ウィキペディアのコピーがあり、128GB SDカードに収まる画像が含まれています。

ただし、オフラインバージョンはオンラインバージョンと非常によく似ており、写真などが含まれています (以下の記事を完全にオフラインでテストしました)。 ここに画像の説明を入力してください


上記のいずれも当てはまらない場合は、後で編集します。

ウィキがウィキメディアの一部ではない場合、またはダンプがない場合は、githubにAPIを使用してそのウィキをダウンロードするプロジェクトがあります。

WikiTeam-ウィキペディアから最も小さなウィキまで、ウィキをアーカイブします


1
カスタムmediawikiインストールをダンプする場合、XOWAはそれを実行できます(いくつかの問題が存在する可能性があります)。次の記事xowa.org/home/wiki/App/Wiki_types/Wikia.comは非常に便利です。カスタムwikiでのKiwixの使用はまだテストされていません(最初にgithub.com/kiwix/mwofflinerまたは他のツールでwikiをダンプする必要があります)
エスカレーター
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.