73
レビュー: MacSpeech Dictate 1.2.1

MacSpeech Dictateは、NuanceのDragon NaturallySpeakingなどのWindows向け音声認識ソフトウェアと同等の認識性能を提供する、Mac向け初の音声認識プログラムです。MacSpeechは、Nuanceの定評あるNaturallySpeaking技術のライセンスを取得しています。このソフトウェアを移植したのではなく、Mac向けに根本から書き直した真のMac向けプログラムです。

プログラムをインストールし、付属のノイズキャンセリングUSBヘッドセットを接続したら、ユーザー固有のプロファイルを設定します。これは、声、マイク、コンピュータ、そして方言(アメリカ英語、イギリス英語、オーストラリア英語、シンガポール英語、そして「US Teens」と呼ばれるものから選択可能)に基づいて作成されます。次に、プログラムにマイクの音量を調整させ、簡単なトレーニングストーリーを読み上げます。これには約10分かかりますが、これでMacに話しかける準備が整います。あまり珍しい単語を使わなければ、プログラムの精度はすぐに驚くほどです。

ディクテーションを行う際は、はっきりと自然に話す必要があります。一貫性を保ち、「えー」や「あー」といった言葉は避けましょう。さらに、句読点はすべて発音する必要があり、文字を大文字にしたり段落区切りを挿入したりするための制御語も発音する必要があります。また、プログラムを制御したりテキストを編集したりするための一連のコマンドも覚える必要があります。これらのコマンドの一部はクイックリファレンスカードに記載されています。利用可能なすべてのコマンドをまとめた印刷可能なドキュメントがあると便利です。これらのコマンドはマニュアルの複数のページに分散して記載されています。

MacSpeech Dictate はよく使われる単語については驚くほど正確で、プログラムに新しい単語を教えられるトレーニング機能も備えていますが、珍しい単語を認識させるのはなかなか大変です。例えば、私は自分の名前をプログラムに認識させようと何十回もトレーニングしましたが、いつも失敗しました。MacSpeech のテクニカルサポートは、私の名前のテキストマクロを作成することを勧めてきました。これは確かに機能しますが、自分の名前を単独で言う必要があります(「私の名前は [間] カーク・マケルハーンです。」)。私が自分の名前を長い文の一部として間を置かずに言うと、プログラムは失敗します。これは、専門用語をディクテーションしたい人(例えば医者や弁護士)や、会社名、製品名、その他の独特な用語が認識されない人にとっては、深刻な欠点になる可能性があります。これらの単語のそれぞれについてテキストマクロを作成し、テキストマクロが機能するようにそれらを単独でディクテーションするのは難しい場合があります。さらに、語彙トレーニング機能を使って文書から単語をディクテーションプロファイルに入力することはできますが、プログラムがそれらの単語に慣れるために発音するオプションはありません。つまり、プログラムが認識できない特定の単語を追加したとしても、文章の中で発音した際にプログラムが認識できるようにトレーニングする必要があります。

プログラムがあなたの言ったことを誤って解釈した場合、正しい単語を学習するようにトレーニングすることができます。しかし、編集は面倒な場合があります。テキスト内を移動したり、単語を選択したり、編集したりするためのコマンドはほとんどの場合機能しますが、長時間ディクテーションを行うと、プログラムが混乱するようです。テキストの先頭に戻って編集しようとすると、問題が発生することがあります。場合によっては、単語をトレーニングしようとすると、プログラムが意図しない単語を選択してしまうことがあります。また、正しくトレーニングし、手動で入力したバージョンを認識パレットから選択した場合でも、プログラムは誤った大文字/小文字で単語を挿入します。ディクテーションを行う最も効率的な方法は、しばらく(1、2段落、または1ページ)話してから編集することですが、これは手間がかかるため、メリットにはなりません。間違いを修正する最良の方法であるため、フレーズごとに編集することにしました。しかし、この方法では断片的にディクテーションを行う必要があります。また、キーボードでディクテーションと編集を行うことはできません。これによりプログラムが混乱し、結果がクリンゴン語のようになります。

MacSpeech ディクテート
テキスト マクロの作成は簡単ですが、単独でしか認識できません。

スペルモードも搭載されており、非常に扱いにくい単語や略語、URLなどにも使用できます。しかし、これもまた使いにくく、動作が非常に遅く、精度も低いという難点があります。

Dictateは、私が試したどのプログラムでも問題なく動作しました。テキストエディタ、ワードプロセッサ、電子メールプログラム、iChatに音声入力してみましたが、結果はどれも同じでした。しかし、Dictateは情報提供とテキスト編集、そしてMacの操作に3つのフローティングパレットを使用しています。大画面であれば問題ありませんが、ラップトップで作業している場合は、これらのパレットが画面のスペースを占領してしまうことにイライラするかもしれません。もちろんパレットのサイズは変更できますが、最も狭い場合でもかなりのスペースを占有します。認識パレットは、発話したテキストを正しくトレーニング・編集するために、十分なフレーズが確認できる大きさである必要があります。

Dictate では、アプリケーションを制御することもできます。これはうまく機能しますが、私は Mail、Safari、BBEdit、Word などの最も一般的なアプリケーションでのみテストし、アプリケーションの起動とそれらの間の切り替えを行いました。言うまでもなく、他の方法で Mac を制御できない人にとっては、これは天の恵みです。多少の癖はあるものの、この機能は大部分で信頼できます。ただし、問題が発生することもあります。ワードプロセッサにディクテーションしているときに、作業中のファイルを保存するために「この書類を保存」コマンドを使用しようとしました。そのたびに、プログラムは「開く」ウィンドウを表示しました。問題はコマンドそのものではなく、私が使用している Dvorak キーボードレイアウトにあることに気付くまで、しばらく時間がかかりました。なぜか、Dictate が「この書類を保存」コマンドを送信して Mac OS X にSキーの押下を送信するように指示すると、システムはOを送信します。これは、OS の以前のバージョンではなく、Mac OS X 10.5.6 に影響するようです。 MacSpeech は本稿執筆時点ではこの問題の真相を解明しようとしていましたが、非標準のキーボード レイアウトを使用している場合、アプリケーションの制御に使用されるコマンドの一部に問題が発生する可能性があります。

テストは、2.66GHz Xeon 5100プロセッサ(合計4コア)と4GBのRAMを搭載したMac Proで行いました。テストは静かな自宅のオフィスで行いました。付属のヘッドセットはノイズキャンセリング機能付きですが、周囲の騒音が多い場所でアプリケーションを使用すると結果が異なる場合があります。ただし、コンピューターのスピーカーから音楽を静かに流しながらテストしたところ、認識精度は静音時と同等でした。

MacSpeech ディクテート
MacSpeech Dictate のパレット。

Macworldの購入アドバイス

タイピングが苦手な方、またはRSI(後頭回旋筋障害)をお持ちの方は、このプログラムは必須です。タイピングが遅い方は、生産性の向上にきっと役立つでしょう。私のようにタッチタイピングが比較的速い場合は、タイピングよりも速く音声入力できるようプログラムをトレーニングするにはかなりの労力が必要です。しかし、椅子に深く座りながら音声入力する方が、静止した姿勢でタイピングするよりもずっとリラックスできます。使い続けるうちにプログラムの精度が向上し、Macへのテキスト入力がよりリラックスして効率的に行えるようになるでしょう。

[上級寄稿者の Kirk McElhearn は、自身のブログ Kirkville で Mac 以外のことについても書いています。 ]