81
Dragon Dictate 4レビュー:音声認識機能の向上でより信頼性の高いアプリに

Nuanceの音声認識ソフトウェア「Dragon Dictate」の最新アップデートがリリースされてから、約1年半が経ちました。ここ数年、Nuanceはこのソフトウェアを改良し続け、優れた音声認識アプリから、今では信頼できるものへと進化させてきました。

NuanceはMacSpeechを買収して以来、Mac上での道筋を見つけるのに時間を要しました。MacSpeechの以前のMacSpeech Dictateは優れていたものの欠陥がありました。その間、同社は短命に終わったDragon Expressアプリを試しましたが、すぐに放棄しました。精度が十分でなかったためです。また、OS X(Mountain Lion以降)には、Dragon Expressの機能の多くを再現する基本的な音声認識機能が搭載されています。しかし、2012年にOS XのディクテーションとDragon Dictateを比較した際に書いたように、「ただし、短いテキストを時々書き込むだけでなく、定期的にディクテーションを行いたいのであれば、Dragon Dictateが最適です」。

Dragon Dictate 4がリリースされました。新機能のリストはそれほど目新しいものではありませんが、裏では何か新しいものが仕込まれています。長年にわたり、Nuanceが音声認識エンジンをどのように改良し、調整してきたかを見てきました。しかしバージョン4では、初めて、画面上の単語をあまり気にせずにディクテーションでき、話し終えた後に戻って編集できると実感しています。認識品質はDragon Dictate 3と比べて大幅に向上しています。SpeechWareのUSB 6-in-1 TableMikeを使用し、ブーム部分をThunderboltディスプレイの下から覗かせながら、記事やブログ投稿をディクテーションし、Webからいくつかの記事を読み上げました。Dragon Dictate 4の認識品質は、どのケースでも非常に優れていました。

ドラゴンディクテイト4

Dragon Dictate 4 は前作と見た目はまったく同じですが、内部には新しい機能が搭載されています。

Dragon Dictate 4 の新機能の中には、誰もが気に入るとは限らないものもありますが、電子メールに Web 上の Gmail を使用している場合は、新しいブラウザ拡張機能を使って音声コマンドで Gmail を管理できます。Dragon Dictate 4 ではまた、Pages 4.3 (これは最新バージョンではなく Pages '09 です) でディクテーションと編集を組み合わせることができます。通常どおり、ほとんどすべてのアプリケーションにディクテーションできますが、Dragon Dictate は専用の Note Pad にディクテーションすると最もよく機能します。また、Microsoft Word や Pages '09 とも非常にうまく連携します。これら 3 つのアプリケーションすべてで、ソフトウェアを混乱させることなくディクテーションと編集を行うことができます。他のアプリケーションを使用する場合に編集を行うと、状況が複雑になることがあります。

NuanceはDragon Dictate 4について、「レイテンシが大幅に減少し、編集速度が高速化された、より高いパフォーマンス」を提供すると謳っていますが、これはまさにその通りです。前回のレビューで使用したのと同じMac miniでこのアプリを実行していますが、明らかに高速化しています。Dragon Dictateが入力した単語を待つ間、入力が止まってからドキュメントに表示されるまでの遅延は全くありません。これはDragon Dictate 3と同じ設定です。(環境設定には「認識」タブがあり、スライダーで速度と精度を選択できます。私は前バージョンと同様に、認識精度を真ん中に設定しています。)

Dragon Dictate 3では、ディクタフォンで自分の声を録音し、アプリを使って音声を文字に変換できる文字起こし機能が追加されました。Dragon Dictate 4ではさらに進化し、簡単なトレーニングを経れば、どんな話者でも文字起こしできるようになりました。

私は2つのポッドキャストでこの方法を試しました。1つはニューヨーカー誌のフィクションで、ジェニファー・イーガンがメアリー・ガッツキルの作品を朗読するものです。もう1つはプレイリー・ホーム・コンパニオンで、ギャリソン・キーラーがレイク・ウォビゴンのニュースを独白するものです。全体的には期待通りの結果でした。最初の録音はスタジオ品質で、短編小説をゆっくりと丁寧に朗読する人物の音声です。Dragon Dictateはこの録音で非常に優れた認識率を示し、認識エラーはほとんどありませんでした。しかし、ギャリソン・キーラーの独白では結果は芳しくありませんでした。エラーが非常に多く、修正には全文を書き起こすのと同じくらいの時間がかかるかもしれません。しかし、これはライブ録音であり、時折聴衆の笑い声や即興のテキストもありました。

ドラゴンディクテイト4

文字起こし機能を使用するには、60 秒の音声をトレーニングするだけで済みます。

この機能の目的は、スピーチや講義を録音することです。ですから、話し手が即興ではなくゆっくりと読み上げているのであれば、「えー」「あー」といった繰り返しの多い即興で話す人よりも、間違いなく良い結果が得られます。この機能でインタビューの文字起こしもできれば素晴らしいでしょう。

ジャーナリストとして、複数の声、つまり自分の声と1人、あるいは複数のインタビュー対象者の声を書き起こせるソフトウェアがあれば非常に便利です。Dragon Dictate 4を使えば、例えばインタビュー対象者の音声を学習させることができます。質問内容は乱雑になるかもしれませんが、書き起こしにかかる時間はかなり短縮されるでしょう。ただし、これはあくまでハックであり、長時間のインタビューにしか役立ちません。Dragon Dictateの将来のバージョンでは、複数の声に対応できるようになるかもしれません。

結論

Dragon Dictate 4は、すでに優れた製品をさらに進化させた素晴らしいアップデートです。すでにDragon Dictateをお使いの方は、新バージョンで精度が向上したことでアップグレードする価値を実感していただけるでしょう。音声認識ソフトウェアをまだ使ったことがない方でも、Dragon Dictate 4は、あなたもタイピングなしで文書を作成できることを確信させるほどの優れたツールです。