80
ついにMacが聞き耳を立てる

Macの偉大さへの回帰を象徴するソフトウェアがあるとすれば、それはIBMの新しいViaVoiceでしょう。長年、Windows信者たちはPC向けに3種類のディクテーションプログラムが用意されている(そして非常に人気がある)と強調してきました。よく言われるように、音声認識ソフトウェアはMacには絶対に搭載できないソフトウェアの典型でした。PCでは「PTA会議録」と言えば、ワープロソフトが「PTA会議録」と入力してくれます。Macでは、プログラムを起動したりメニューをプルダウンしたりすることしかできない、貧弱なPlainTalkしかありませんでした。

しかし、そんな時代は終わりました。Macは再び注目を集め、大手ソフトウェア企業はベストセラーソフトをこの2500万人規模の新しい市場に投入しています。IBMのViaVoiceは、今後数ヶ月以内にリリースされる3つのMac向け連続音声認識プログラムのうち、最初の1つにすぎません。(Dragon SystemsとMacSpeechもMac用ディクテーションソフトウェアを開発中です。)

ViaVoiceは90ドルという驚きの安さで、別売りだと40ドルもする優れたノイズキャンセリングヘッドセットマイクAndreaも付属しています。(たった3年前に、今は販売終了となったPowerSecretaryというMac用音声認識ソフトを購入しました。これは単語を区切る際に間を入れる必要がありました。価格は2,500ドル。泣きながら音声入力できるなんて、本当に可能なのでしょうか?)

このヘッドセットには快適なイヤースピーカーも搭載されており、Macがテキストを読み上げる音を、部屋の他の人に迷惑をかけずに聞くことができます。IBMが本物のMacintoshプログラムの開発に真剣に取り組んでいることに疑問を抱く人がいるなら、ヘッドセットにはiMac/iBookのフルーツカラーごとに1つずつ、半透明のプラスチック製アクセントパネルが5セット付属していることも見逃せません。

悪いニュースを先に

しかし、ソフトウェアの問題があります。一つ大きな制限があります。それは、SimpleTextタイプの小さなワードプロセッサにしか音声入力できないことです。そこから音声コマンドを使えば、America Online、Word 98、AppleWorks、Netscape Messenger、Outlook Expressの5つのプログラムに、音声入力した内容をほぼ瞬時に貼り付けることができます。

QuicKeysやOneClickなどのプログラムを使えば、約2分でマクロを作成し、口述テキストを任意のプログラムに転送できます。しかし、Windows版Dragon NaturallySpeakingなどのプログラムを使ってWordで直接音声編集する楽しさを味わったことがある人なら、Macでも同じような直接的な操作性を切望するはずです。

それ以外の点では、概ね良いニュースです。パッケージは美しくデザインされており、Macintosh特有の細部への配慮が隅々まで行き届いています。例えば、セットアップアシスタントは単にヘッドセットケーブルをMacのマイクジャックに差し込むように指示するだけでなく、 Macの 背面パネルの写真を表示し、巧妙な内部機構を使ってMacのモデルを判別します。(Griffin Technologyによると、Griffin iMicアダプタが1月下旬に出荷され次第、iBookラップトップでViaVoiceが使用できるようになります。)

次に、数画面分のテキストを音声で読み上げ、ソフトウェアに自分の声を認識させるように指示されます。Power Mac G3/300では、これらの抜粋のうち最も短い部分(例えば『宝島』)の読み上げに約15分、iMac/400では約10分かかります。その後、ソフトウェアは約30分間休止状態となり、録音した音声ファイルを分析します。

そして、楽しい時間が始まります。メニューバーに常駐しているViaVoiceアイコンから、SpeakPadアプリケーション(SimpleTextのViaVoice版)を起動します。ヘッドセットを装着し、話し始めても、全く何も起こりません。すると突然、話し始めの最初の間が空いた瞬間に、画面に書き起こされた言葉が表示されます。

それは動作します!

3年間Windowsのディクテーションソフトにどっぷり浸かってきた私(手首が不自由な私のようなMac使いでも、他に選択肢がない場合はWindowsを使わざるを得ない)は、ディクテーションソフトの精度という観点から見て、ViaVoiceの精度は素晴らしいと言える。最初の午後は95%程度の精度で、つまり20語に1語は訂正する必要がある。プログラムを使い続けて訂正していくうちに、精度は徐々に向上していく。オプション機能では、既に書き上げた文章をインポートできる。こうすることで、ViaVoiceは「twelvish」や「Clintonesque」といった、仕事でよく使われる変わった単語を検知し、精度をさらに高めることができる。

幸いなことに、音声だけで修正できます。例えば、「『モードインポート』を修正」と発声すると、番号付きの代替トランスクリプションリストがすぐに表示されます。次に、モデムポートなど、意図したトランスクリプションの番号(「7つ選んで」)を発声します。修正内容は、たとえ数文前であっても、ディクテーションしたテキストに瞬時に表示されます。

残念ながら、ViaVoice の本当に頭の悪い設計上の欠陥に遭遇してしまいます。修正後、テキスト内の修正箇所で挿入ポイントが点滅してしまいます。必然的に、数フレーズまたは数文前に戻ります。ディクテーションを再開するには、マウスを使って文書の末尾をクリックするしかありません。(Dragon NaturallySpeaking などの他のプログラムで修正を行った後、カーソルはディクテーションを中断した場所に移動するので、その方が千倍も理にかなっています。)

その他の不具合:このプログラムはピリオドの後に常に2つのスペースを入れます。これについてはユーザーが決定権を持ちません。ViaVoiceを使用するには、仮想メモリをオンにして、実際にインストールされているRAMより少なくとも10MB大きい値に設定する必要があります。単語を大文字にするのは非常に扱いにくく、単語の前に「Capitalize this(これを大文字にする)」と言わなければなりませんが、これは3音節ほど長すぎます。(Naturally Speakingでは「cap」と言うだけです。)また、新規ユーザーコマンドがうまく動作しませんでした。

思考のスピード

ViaVoiceのディクテーションはタイピングよりも速いのでしょうか?確かに、Windowsの最高のディクテーションソフトウェアほど速くはなく、233MHzのMac(推奨最低スペック)では動作が重くなります。iMacのDVでは、発話ごとにテキストが画面に表示されるまで約1秒かかります。1分間の単語数を評価する際には、修正にかかる時間も考慮する必要があります。修正時間は月日が経つにつれて短くなります。

では、質問への答えですが、このプログラムを使い始めた最初の日は、タッチタイピングをする人のほとんどは、平均するとタイピングと同じ速度になるでしょう。しかし、プログラムと使い慣れてくると、ディクテーションの速度の方が上回ってきます。しかし最終的には、ViaVoiceの速度はほとんど関係ないことに気づくでしょう。ディクテーションで入力する際のボトルネックは、コンピューターではなく、あなたの脳です。座って、話す前に頭の中で文章を一つ一つ作り上げていく間、ソフトウェアは あなたを待ってくれているのです。

幸いなことに、キーボードからマイクへの移行は、想像するほど時間がかかりません。キーボードが使えない、あるいは使いたくない人にとって、ViaVoiceはMacintoshにおける画期的な製品です。確かに、プロプライエタリなワードプロセッサでのディクテーションに限られるという点が、ViaVoiceを1.0製品と位置付けています。しかし、少なくともIBMは、正確性とMacintosh流への徹底的なこだわりという、正しい分野に重点を置いています。このプログラムは驚くほど安価で、30日間の保証が付いています。毎日URLよりも長いテキストを入力する人は、この素晴らしいプログラムを試してみる価値があります。春にViaVoiceの強力なライバルが登場した際に、本物のMacディクテーションソフトウェアの醍醐味を味わえるだけでも良いでしょう。

David Pogue 氏は、Adam Engst 氏と共著で 、双方向の Mac-Windows 辞書『 Crossing Platforms』 (O'Reilly、1999 年) を執筆しました。