あなたの郡に問題があると思いますか?カリフォルニア州アラメダ郡を例に挙げてみましょう。そこでは、裁判所の判決が手に負えないJavaアプレットや、長々と続くTIFF画像の列として閲覧できます。
私がこのことを知ったのは、カリフォルニア大学のスタジアム建設計画に関する判決に興味があったからです。この計画はバークレーの様々な団体から異議を唱えられています。(私はカリフォルニア大学のフットボールファンなので、メモリアル・スタジアムの問題は私にとって非常に身近な問題です。また、暇な時間にこのテーマについてブログを書いているので、判決について最新情報を知りたかったのです。)
どうやらアラメダ郡の裁判所は、判決文を作成するために使われていたコンピュータ文書システムからPDFを生成するどころか、コピーを印刷してスキャンし、スキャナから直接画像を投稿するという、あまりにも古い技術を使っているようだ。(そして、私のMacでは動作しなかったJavaアプレットを使って表示していた。)
馬鹿げている。そこで、判決文全体をPDF化し、オンラインでもオフラインでもAppleのプレビューを使って簡単に読めるようにした。スキャンしたページのテキストを検索可能にして、127ページにわたる判決文のうち、オークの木やアルキスト=プリオロ法といった難解なテーマがどのページに網羅されているかを正確に把握できるようにした。やり方は以下の通りだ。
生のTIFFファイルへのリンクが見つからなかったため(後で見つけました)、JavaアプレットのエラーメッセージからTIFFのファイル形式を調べました。そして、Interarchy(私のお気に入りのFTPクライアントですが、インターネットからファイルをダウンロードできるものなら何でも使えます)を使う簡単なAppleScriptスクリプトを作成しました。
URLを「http://apps.alameda.courts.ca.gov/fortecgi/fortecgi.exe/frte_DomainWebService101E1C7C1F2D1C2429242324177A24?servicename=DomainWebService&Pagename=Image&Action=21544273&parent=14539963&id="tell application "Interarchy"repeat with thePage from 1 to 130 set resultNumber to webfetch url (theURL & (thePage as string))end repeatend tell
それが終わると、TIFFファイルでいっぱいのフォルダができました。しかし、ファイル名が.tifで終わっていなかったため、Macはそれが何なのか認識できませんでした。簡単です。Automatorを起動しました。

このシンプルなAutomatorアクション(保存もせず、ただ実行して終了しただけ)は、ダウンロードしたすべてのファイルの末尾に「.tif」を追加しました。さあ、完成です!
次にAdobe Acrobat Professionalを起動しました(もちろんPreviewを使うこともできたのですが、せっかくAcrobat Proがあるので、こちらを使うことにしました)。「ファイル」→「PDFを作成」→「複数のファイルから」を選択し、すべての画像をドラッグ&ドロップで読み込みました。大きなPDFにまとめられたら、「文書」→「OCRテキスト認識」→「OCRを使用してテキストを認識」を選択すると、Acrobatがすべてのページを完璧に揃えて回転し(アラメダ郡の事務所の誰かがずさんなスキャンをしたのでしょう!)、各ページにコンピュータで読み取り可能なテキストを埋め込んで、スキャンした文書を検索可能にしました。
全てが終わった後、PDFをインターネットに投稿し、リンクを数人に伝えました。サンフランシスコ・クロニクルのウェブサイトで私のPDFが見つかると思います。カリフォルニア大学バークレー校のニュースページに掲載されているPDFは、私のPDFだと確信しています。
30分の作業にしては悪くない。アラメダ郡の人たちが自分でやってくれればよかったのに。