68
ウェブアーカイブのアーカイブ解除

Tigerに搭載されているSafariバージョン2の(嬉しい)追加機能の一つは、Webページ全体(テキスト、画像などすべて)を保存してオフラインで閲覧できる機能です。この機能を使うには、目的のWebページを表示し、Safariの「ファイル」メニューから「別名で保存」を選択し、保存ダイアログの「フォーマット」ポップアップメニューから「Webアーカイブ」を選択します。保存された .webarchive ファイルをSafariで開くと、(おおよそ)インターネット経由で通常通りページを閲覧しているのと同じような見た目になります。

これは素晴らしい機能ですが、欠点が2つあります。1つ目は、これらのWebアーカイブはSafariでしか閲覧できず、他のブラウザでは開けないことです。(アーカイブの送信先がSafari以外のブラウザを使うことを好む場合は不便ですし、Tiger以外のブラウザ(Windowsを含む)を使っている人にアーカイブを送信する場合は致命的です。)2つ目は、アーカイブのコンテンツ(画像やテキストなど)にアクセスする必要がある場合、まずSafariでアーカイブを開き、そこからコンテンツを取得しなければならないことです。(欠点1を参照)。

これらの制限を簡単に解決できる方法として、Greg Weston 氏による無料の WebArchive Folderizer 1.2.2 (   ) があります(ただし、以下に挙げるいくつかの注意事項があります)。.webarchive ファイルを WebArchive Folderizer の一般的なウィンドウ(またはアプリケーションアイコン)にドラッグするだけで、わずか数秒で Web アーカイブのコンテンツがフォルダ(元の .webarchive ファイルと同じディレクトリ)に抽出されます。このフォルダ内では、アーカイブのコンテンツの元の階層構造が維持されるため、アーカイブの任意のコンテンツを簡単に取得したり、 元の Web ページのindex.html ファイルを見つけることで、アーカイブされたページを任意のブラウザで開いたりすることができます。

WebArchive Folderizer のメインウィンドウ

WebArchiveフォルダのメインウィンドウ

WebArchive Folderizer フォルダ

CNNホームページのウェブアーカイブの「フォルダ化」バージョン

残念ながら、WebArchive Folderizer は魔法のようなことはできません。一部のサイトのコーディング方法によっては、「フォルダ化された」アーカイブを 、その中に含まれるindex.html ファイルから開くことができません。また、開ける場合でも、元のアーカイブと全く同じにはならないことがあります。同様に、一部のウェブページでは、Safari が元のアーカイブにメディアを含めなかったため、フォルダ化されたアーカイブ内のメディアが利用できないことがあります。それでも、WebArchive Folderizer は私にとって既に何度か役立っています。

WebArchive Folderizer は Mac OS X 10.2 以降で動作します。( Web アーカイブ を作成する には Tiger バージョンの Safari が必要ですが、10.2 以降を実行している Mac であれば、WebArchive Folderizer を使用して Web アーカイブからコンテンツを抽出できます。)