23
レビュー:Dragon Dictate 3は音声認識を向上し、文字起こしを学習する

ちょうど1年ほど前、Dragon Dictate 2.5 をレビューしました。これは、同プログラムのバージョン 2.0 からの段階的なアップグレードでした。Nuance は今回、Dictate のオリジナル開発元である MacSpeech を買収して以来、数年間かけて開発してきた基盤の上に構築された Dragon Dictate 3 をリリースしました(MacSpeech の Dictate は Dragon 音声認識エンジンを採用していました)。

Dragon Dictate 3には、改良点と新機能の両方が含まれています。プログラムへの小さなながらも価値のある追加機能の一つは、Dragon Dictateを初めて使用する際、または新しいプロファイルを作成するたびに再生される、シンプルでインタラクティブなチュートリアルです。(プロファイルは、特定のマイクを使ってプログラムで音声トレーニングを開始すると作成されます。プロファイルには、Dragon Dictateの認識精度を向上させるために役立つ、発声スタイルに関する情報も含まれています。)

チュートリアルは、句読点の読み上げ方、間違いの修正方法、テキストの編集方法など、ディクテーションの基本を初心者が習得するのに役立ちます。マニュアルを読むことももちろんお勧めしますが、チュートリアルを読めば数分でDragon Dictate 3を使いこなせるようになります。また、よく使うコマンドをまとめたMac版Dragon Dictateコマンドチートシートのダウンロードもおすすめします。

Dragon Dictate 3は、ディクテーションをメモ帳の文書に取り込みます(左上)。また、新しいスマート書式ルール機能(左下)も搭載されています。この例では、ディクテーションウィンドウにソフトウェアがよくある間違いが表示されています。「12」の修正候補が「Twelve」としか表示されておらず、「twelve」と表示されていません。

Nuance は Dragon Dictate 3 の認識エンジンを改良し、私のテストでは、そのままの精度が以前のバージョンよりも明らかに向上しました (私のテストは、プロファイル作成後、必須の 5 分間の音声トレーニング セッションを実行した後に実施しました)。修正も少しスムーズになっており、注目すべき追加機能の 1 つが Nuance が「スマート フォーマット ルール」と呼んでいる機能です。特定の種類のテキスト (数字、略語、挨拶など) を言うと、「スマート フォーマット ルール」パレットが表示され、たとえば、常に数字を使用するか、常に数字をスペルアウトするかを尋ねられます。[ツール] -> [自動フォーマット] ウィンドウで、いくつかの自動フォーマット設定を調整できますが、特定の種類のテキストを初めて言うときに「スマート フォーマット ルール」パレットが表示されるため、大幅に時間を節約できます。

Dragon Dictate 3のもう一つの目玉機能は、文字起こし機能です。デジタルボイスレコーダーに音声を入力するか、iPhone、iPad、iPod touch、AndroidスマートフォンでNuanceの無料アプリDragon Recorderを使用することができます。これらの音声ファイルをMacに転送すれば、Dragon Dictate 3で文字起こしが可能です。

Dragon Dictate 3を初めてご利用になる際、録音内容を分析して話し方を認識するまで数分かかります。その後、Dragon Dictateはテキストを解釈し、新しいメモ帳ドキュメントに保存します。その後、テキストを書き起こす際には、初期トレーニングやキャリブレーションは不要です。

文字起こし機能にはいくつか注意点があります。文字起こし機能を使用する場合、途中で修正することはできないため、テキストに多少の編集作業が必要になります。しかし、外出先でメモを取り、デスクに戻ってから文字起こしをするには、この方法が最適です。句読点や段落区切りには、Dragon Dictateの標準コマンドを使用する必要があります。そうしないと、文章が途切れ途切れになってしまいます。

保管に関する考慮事項

iOS デバイスでディクテーションを行う場合は、十分な空きストレージ容量があることを確認してください。Dragon Recorder はオーディオ ファイルを .wav 形式で保存し、これらのファイルは 1 分あたり約 2.7 MB を占有します。デジタル レコーダーを使用する場合、Dragon Dictate 3 は、.mov、.wav、.aiff、.m4v、.m4a など、さまざまなオーディオ ファイル形式を認識できます。ただし、.mp3 ファイルはサポートされておらず、多くのデジタル レコーダーは .wav と .mp3 しか提供していないため、最も多くのスペースを占有する非圧縮 .wav 形式を使用する必要があります。レコーダーによっては .wma と .mp3 しかサポートしていないものがあり、その場合はオーディオ ファイルを Dragon Dictate 3 に直接取り込むことはできません。ほとんどの人はデジタル レコーダーの容量制限に達することはありませんが、ディクテーションを頻繁に行う場合は、この点を考慮して、より容量の大きいレコーダーを入手する必要があります。 (標準の 2GB デジタル レコーダーでは、.wav 形式で約 3 時間の録音が保存できます。)

大きな変更ではありませんが、Dragon Dictate 3のインストール方法が以前のバージョンとは異なります。以前は、約2GBのサポートファイルがユーザーのApplication Supportフォルダにインストールされていました。現在、これらのファイルはシステムレベルでインストールされるため、複数のユーザーが同じMacでDragon Dictateを使用する場合、サポートファイルが重複することがなくなり、ディスク容量を節約できます。これは大容量ハードドライブを搭載したMacではそれほど問題にはなりませんが、ストレージ容量がそれほど大きくないソリッドステートドライブを搭載したMacでは役立ちます。

なお、OS X 10.8 を実行している場合、Dragon Dictate の以前のバージョン (2.5) はあまり正常に動作しないため、定期的にディクテーションを行う場合は更新する必要があります。

結論

Dragon Dictateは完璧ではなく、おそらくこれからも完璧になることはないだろう。編集や修正の際にはまだ不具合があり、特に編集したテキストに意図しない単語が大文字で表示されることがある。単語やフレーズを修正する際に、プログラムが修正したい単語とは異なる単語を選択することがある(例えば、最後に口述した文の単語を修正したいのに、プログラムが3段落上の単語を選択するなど)。Dragon Dictateのバージョン3では、認識機能が最初から向上しており、新規ユーザーでもすぐにプログラムの威力を実感できるだろう。また、書き起こし機能は、Dragon Dictateの最初のMac版以来、多くのユーザーが待ち望んでいた機能である。