39
Dragon 5.0.1レビュー:Macの音声認識精度が向上し、インターフェースも改善

私は音声認識ソフトウェアを20年近く使っています。最初はIBMのViaVoiceを使っていましたが、これは一度に単語を一つずつ話す必要がありました。長年にわたり、このソフトウェアが進化し、連続音声認識が可能になり、音声認識エンジンの精度が向上していく様子を見てきました。OS Xで唯一メジャーなのはNuanceのDragon(旧称Dragon Dictate)です。現在バージョン5のDragonは、内部的にも画面上でも、このソフトウェアが初めて登場して以来最大の変化を遂げています。

音声認識ソフトウェアは長年、特定の種類のマイクの使用を必須としてきました。2011年の購入ガイドや、最近ではワイヤレスマイクについても取り上げましたが、この種類のマイクについては既に取り上げています。Dragon 5の最大の変更点の一つは、Macの内蔵マイクに対応したことです。音声認識用に特別に設計されたマイクを使用すると認識精度は向上しますが、私のテストでは、静かな自宅/オフィスではRetina iMacの内蔵マイクでも非常に高い精度が得られました。

Dragon 5で最も目立った変更点は、インターフェースのスリム化です。Dragonはヘッドレスアプリケーションとなり、メニューバーのアイコンをクリックしてアクセスできます。小さなステータスウィンドウが表示され、マイクの操作、修正時の複数のオプションの選択、そして話せる内容の確認などに利用できます。これにより、Dragonが邪魔にならず、音声入力中のテキストに集中できます。

ドラゴンステータスウィンドウ

画面に表示されるのはDragonのステータスウィンドウだけです。ここでは、Dragonに単語の修正を指示しました。

Nuance社によると、Dragonの精度が向上したとのことです。ソフトウェアのバージョンアップごとに精度が向上していると言っても過言ではありませんが、バージョン5ではより精度が高まったように感じます。Nuance社によると、音声認識エンジンを書き換えたとのことで、その最大の違いの一つは、初期設定から高い精度を実現していることです。Dragonは、マイクの音量調整(マイクの音量設定には約30~40秒かけて音声を読み上げる)を行うと、ユーザーの音声を学習します。アプリの音声トレーニング機能を使うことで認識精度は向上しますが、Dragonがユーザーの音声を即座に、しかも効率的​​に正しく書き起こせるようになったのは、大きな進歩と言えるでしょう。

ドラゴンマイクのセットアップ

ディクテーションを始めるのに必要なのは、Dragon のマイクのセットアップだけかもしれません。

新しいヘッドレスDragonのもう一つの特徴は、アプリケーション内から利用できたメモ帳に入力する必要がなくなったことです。Dragonはどんなアプリでも快適に入力できます。私はワープロソフトやテキストエディタ、Apple Mail、メッセージ、Twitterクライアントなど、様々なアプリで使っています。Dragonはどのアプリでも同じレベルの精度を提供します。

当然のことながら、認識力は時間の経過とともに向上します。特に、独特な語彙を使う場合はその効果が顕著です。Dragonの音声トレーニング機能は、簡単な物語を読み上げることで、ソフトウェアがあなたの声を学習するのに役立ちます。しかし、認識力をさらに向上させるには、語彙トレーニング機能を使うことです。この機能では、あなたが書いた文書をDragonに読み上げさせます。Dragonはあなたが話す言葉を聞き取るだけでなく、言葉が使われる文脈も考慮します。あなたの特定の語彙や言葉の並び方に習熟するほど、認識精度は向上します。

Dragon を使って録音内容を書き起こすこともできます。この機能については、Dragon Dictate 3 のレビューで解説しました。音声コマンドを使って Mac を操作することもできます。Dragon 5 では、カナダ英語、東南アジア英語、インド英語、オーストラリア英語など、より多くのアクセントに対応しています。Full Text Control を使えば、Microsoft Word 2001 および 2016、そして TextEdit で音声入力やコマンド入力が可能です。(キーボードから変更を加えるたびに「Cache document」コマンドを発行すれば、どのアプリケーションでも音声入力やコマンド入力が可能です。)

「メニューウォーキング」を使えば、Dragonにメニューをクリックするように指示して、任意のアプリケーションを操作できます。例えば「ウィンドウメニューをクリック」「最小化をクリック」など、任意のメニュー内のコマンドを発声するだけで、Dragonがハンズフリーで実行します。

まもなく利用可能になる機能の一つですが、まだテストしていません。Dragon Anywhere は「iOS または Android デバイス上で継続的なディクテーション機能を提供するクラウドベースのアプリ」と説明されています。Dragon Anywhere については、利用可能になった時点で詳細をお伝えします。

Dragon 5は、私のテストでは信じられないほど安定していることが証明されました。ソフトウェアの初期リリースではいくつかの不具合がありましたが、メンテナンスアップデートにより、私が遭遇した問題はすべて修正されたようです。

結論

この新バージョンでは、精度が向上しただけでなく、操作の邪魔にならないインターフェースも大幅に改善されています。ディクテーションに慣れている方は、Dragon 5へのアップデートを強くお勧めします。このソフトウェアを初めてお使いになる方は、ぜひこの機会にお試しください。専用のマイクを購入しなくても優れた結果が得られるため、より手頃な価格で使いやすくなっています。