概要
専門家の評価
長所
- 特定のアプリケーションでは音声入力と入力を混在させることができます
- 全体的なパフォーマンスの向上
- 精度の向上
短所
- 高価
私たちの評決
Dragon の音声認識は非常に強力かつ正確なので、Mac の使い方が変わります。
Nuanceの音声認識ソリューションであるDragon(300ドル、アップグレードは150ドル)が、今年もアップグレードされました。昨年、バージョン5をレビューし、「Dragonは、このソフトウェアが初めて導入されて以来、内部的にも画面上でも、最も大きな変化をもたらしている」と指摘しました。
NuanceはDragon 5の音声認識エンジンに加えられた変更を基に、Dragonのパフォーマンスを全面的に向上させました。Nuanceは15%または24%(同社は両方の数値を挙げています)の精度向上を誇り、Dragonは「最大99%の認識精度」を実現していると主張しています。当然ながら「最大」には幅広い範囲が含まれますが、このバージョンのDragonはバージョン5よりも精度が向上しているように見えます。
Nuance社は、このバージョンのDragonは「ディープラーニング」を活用して精度を向上させていると主張しています。この技術について読んでみると、Dragonが既にユーザーごとに音声モデルを作成する方法をさらに強力に拡張したもののように思えます。新しいプロファイルを作成してテストしたところ、Dragonは以前のバージョンよりも、音声トレーニングが最も短時間で、すぐに使える状態でより効率的に動作しているように感じました。完璧ではありませんし、おそらくこれからも完璧になることはないでしょうが、年々進化しているようです。
Dragon は基本的な設定のみでも非常に正確ですが、より高度な音声トレーニングを行うと、プロファイルの改善に役立ちます。
Dragon 6を数週間使っていますが、この精度には驚かされています。2桁以上の改善はなかなか見られないかもしれませんが、前置詞、副詞、冠詞といった短い単語の修正が減っていることに気づきました。大したことではないように思えるかもしれませんが、頻繁にディクテーションを行う方なら、こうした短い単語の修正にも他の修正と同じくらい時間がかかることをご存知でしょう。
NuanceはDragonインターフェースを視覚的に簡素化しました。ステータスバーが小さくなり、修正ウィンドウが独立しているため、これら2つの項目を画面上に簡単に配置できます。
この新しいバージョンでは、Dragon のインターフェースは最小限に抑えられています。
同社は数字、時間、金額の書式設定を改善し、時間の節約に役立てています。また、Dragonを使って録音からテキストを作成する際の書き起こしプロセスも簡素化されています。
タイピングとディクテーションの併用
Dragon 6の最大の変更点は、特定のアプリケーションで音声入力と入力を混在させることができるようになったことです。Mac版Dragonは、同じ文書内で音声入力と入力を混在させると、いくつかのアプリケーションを除いて、うまく動作しませんでした。以前は、数文を音声入力した後に何かを入力または貼り付けると、Dragonは文書内のテキストとカーソルの位置を把握できなくなり、テキスト編集が困難になっていました。この問題は、変更を加えるたびに「文書をキャッシュ」と言うことで回避できます。Dragonは文書全体を素早く読み上げ、すべての単語の位置を把握します。
新バージョンのDragonは、Appleのアクセシビリティフレームワークを活用して、文書へのテキスト挿入速度を向上させ、文書内の単語とその位置を把握できるようになりました。バージョン5では、何かを発話した後に一時停止するたびに、テキストが1文字ずつ、1単語ずつ、非常に高速に画面に表示されていました。しかし、アクセシビリティフレームワークを正しく使用するアプリでは、Dragonは実際にテキストを貼り付け、発話全体を一度に処理します。これにより、テキストエディット、Pages、Numbers、Keynoteの最新バージョン、Scrivener、メッセージ、Microsoft Word、Outlookなど、この機能をサポートするアプリケーションを使用している限り、ディクテーションが大幅に高速化されます。これらのアプリケーションのリストは、こちらでご覧いただけます。
Dragon 6は、新しいアプリケーションがアクセシビリティフレームワークをサポートしている場合、自動的に音声入力や入力、テキストの挿入が行えるように設計されています。この機能を利用するためにDragonをアップデートする必要はありません。
Nuanceは以前から音声認識用に設計されたマイクの使用を推奨しており、私も以前はそうしていました。しかし、Dragon 6のテストでは、ポッドキャスト用に購入したRode NT-USBマイクを使用しました。このマイクの結果は、音声認識専用に設計されたマイクで過去に見たものとほぼ同等でした。Macの内蔵マイクも使用できます。結果はそれほど良くはありませんが、予想よりはるかに優れています。
このバージョンのDragonに対する唯一の批判は価格です。Dragonと同じ機能を持つアプリであれば300ドルは妥当な価格ですが、アップグレードとして150ドルは高すぎると感じます。特に昨年、あるいは数ヶ月前にバージョン5を購入したばかりであればなおさらです。当時はアプリの価格はわずか200ドルでした。プロフェッショナルユーザー以外の人にとっては、これはかなり高額で、おそらくMacで最も高価なアプリになるでしょう。
結論
値段は高いですが、Dragonなしでは生きていけません。全ての仕事を口述筆記しているわけではありません。ましてや全く違います。でも、Dragonの力を借りて、週に何度か仕事のやり方を変えています。キーボードに手を伸ばして作業する代わりに、ゆったりとくつろぎながらMacに話しかけるんです。すると、自分の言葉が画面に現れるんです。まるで魔法のようです。