17
購入ガイド: 音声認識用マイク

NuanceのDragon Dictate( )や新しいDragon Expressなどの音声認識プログラムを使って Macに音声入力する場合、ソフトウェアに付属のデフォルトのヘッドセットを使用しているか、あるいは音声入力用に別の種類のマイクを購入しているかもしれません。NuanceのDragon Dictateに付属のヘッドセットでも十分ですが、音声認識の精度を高め、快適なマイクを使いたい場合は、様々な種類のマイクを検討してみる価値があります。

ここでは、音声認識ソフトウェアで使用できるさまざまな種類のマイクの概要、それらの動作方法、作業方法に最適なマイクについて説明します。

3種類のマイク

音声認識ソフトウェアで使用できるマイクには3種類あります。最も一般的なマイクはUSBヘッドセットです。NuanceのDragon Dictateのパッケージ版には、このヘッドセットが付属しています。Nuanceが付属するヘッドセットは十分な性能ですが、より優れたヘッドセットも数多く存在します。

2つ目のタイプのマイクはワイヤレスです。ワイヤレスにはBluetoothとDECTの2つの技術があり、それぞれに長所と短所があります。

最後に、デスクトップマイクを使う方法もあります。これなら、コードやマイクを装着することなく作業できます。(技術的には、Macの内蔵マイク、またはAppleディスプレイを使用している場合はモニターのマイクを使うこともできますが、音声認識ソフトウェアでは最良の結果は得られません。)

高性能のヘッドセットは、実際に使用する音声認識ソフトウェアよりも高価になる場合がありますが、ディクテーションに多くの時間を費やす予定であれば、音声認識ソフトウェアを使用することで節約できる時間の量によって、この投資はすぐに回収できます。

有線ヘッドセット:コンピューターと会話するための基本ツール

ヘッドセットは、コンピューターと会話する際に最も一般的に使用されるマイクです。iChatやSkypeで友人や家族と話す際にヘッドセットを使っている方も多いでしょう。ですから、ディクテーションにヘッドセットを使うのもそれほど違いは感じられないかもしれません。しかし、インターネットチャットに使うタイプのヘッドセットは、音声認識ソフトウェアには全く適していません。

まず、ヘッドセットを使うメリットとデメリットを考えてみましょう。メリットとしては、ヘッドセットは非常に高い精度を誇ります。ヘッドセットに接続されたマイクの位置が一般的に良好なため、音声認識ソフトウェアはより多くの単語を正しく認識します。一方で、ヘッドセットは装着時に煩わしさを感じることがあります。髪が乱れたり、メガネをかけている場合はメガネが頭に押し付けられたり、コンピューターに繋がるケーブルのせいで動きが制限されたりすることがあります。

梅ボイス ザブーム C

音声認識ソフトウェアは、マイクからコンピュータに送られる音声の品質に非常に敏感です。この音質は、音声入力を行う環境の周囲のノイズに左右されます。そのため、音声認識用に設計されたヘッドセットには、同僚の声、開いた窓から聞こえる車の音、近くのオフィスの電話の呼び出し音など、周囲のノイズを除去するノイズキャンセリング機能が搭載されています。

そのため、音声認識にはどんなヘッドセットでも使えるわけではありません。Dragon Dictateは安価なヘッドセットでも高い精度を実現できるかもしれませんが、間違いの修正に多くの時間を費やすことになるため、音声入力よりも入力する方が効率的でしょう。

本格的なディクテーションを行う予定がある場合は、音声認識用に特別に設計されたヘッドセットを探す必要があります。100 ドルの Plantronics Blackwire 435 は興味深い有線 USB ヘッドセットで、2 つの独立したイヤピースが有線で接続されていますが、耳かけ型アダプタを使用してのみ装着できます。ステレオ サウンドが必要な場合は両方を使用するか、基本的なディクテーションや VoIP 通話を行う場合はマイク ブーム付きのものだけを使用できます。このマイクは非常に軽量で、耳の上に装着する必要があるにもかかわらず、かなり快適です。インライン コントロール デバイスも含まれているため、いつでも音量を変更したり、マイクをミュートしたりできます。ただし、精度は非常に優れている一方で、イヤピースからわずかにヒス ノイズが聞こえ、声がイヤピースから出てくるときにわずかにエコーが聞こえます。

音声認識と騒音環境での使用に特化したヘッドセットを製造している会社に、UmeVoice の theBoom C があります。この 150 ドルのヘッドセットは優れた精度を提供しますが、その理由の 1 つは、非常に長いブーム (ヘッドセットから口の前に突き出ている部分で、先端に実際のマイクが付いています) を備えていることです。多くのヘッドセットはマイクを口の端近くに配置するためのブームを備えていますが、theBoom のヘッドセットはブームが非常に長く、マイクが口のほぼ正面にあります。このヘッドセットは優れた精度を提供しますが、これまで装着したヘッドセットの中で最も快適ではないと感じました。硬いプラスチック製で、形状が頭によくフィットしません。このタイプのヘッドセットを使用する場合は、最初に試着して、長時間装着できるかどうかを確認する必要があります。

音声認識用に設計されたヘッドセットは他にもたくさんあります。有線ヘッドセットを使用したい場合は、どのようなモデルが利用可能か調べてみる価値があります。

ワイヤレスヘッドセット:束縛から解放される

有線ヘッドセットは優れた精度を提供しますが、コンピューターに縛られてしまいます。長く曲がりくねったケーブルは、机の隅にあるものを取ろうとしたり、コーヒーカップを倒したりするたびに絡まってしまい、煩わしいものです。また、ディクテーション中に動き回る人もいますが、私は立ち上がってオフィス内を歩き回り、机に座り続けることを強いられることはありません。結局のところ、ディクテーションソフトウェアを使う理由の一つは、キーボードから手を離さなくて済むことです。

プラントロニクス Savi 440

先ほども述べたように、無線技術にはBluetoothとDECTの2種類があります。前者は、携帯電話で使う小さなイヤホンによく使われています。Bluetoothの仕組みとイヤホンの設計上、音声認識ソフトウェアとの相性は良くありません。Bluetoothの周波数範囲はある程度限られており、イヤホンは非常に短く、ブームが口元に届きません。NuanceがDragon Dictateに以前同梱していたBluetoothイヤホン、Plantronics Voyager(現在はPlantronics Calistoを販売)を試したところ、音質が悪く、耳に干渉音が入り込んできました。

一方、DECT 技術は音声認識ソフトウェアと併用する場合に明らかな利点があります。Plantronics の 280 ドルの DECT ヘッドセット Savi 440 は、広帯域オーディオ、拡張周波数範囲、ノイズキャンセリング マイクを備え、Bluetooth デバイスよりもはるかに高品質のオーディオを提供します。さらに、DECT 技術は Bluetooth よりも優れた通信範囲を提供します。Mac から 100 フィート離れたところから音声入力することはおそらくないでしょうが、このヘッドセットであれば可能です。ただし、Bluetooth は約 30 フィートに制限されており、その場合でも受信状態は理想的ではありません。このヘッドセットには 3 種類の装着方法があります。標準的な頭上ヘッドバンドでイヤーピースにクッションが付いています。首の後ろでかけるヘッドバンド、耳かけ式のイヤーピースです。耳かけ式は私にとって快適ではなく、首の後ろでかけるヘッドバンドがメガネに押し付けられて刺激を感じました。最終的には、標準的な頭上ヘッドバンドが最も快適であることがわかりました。また、このマイクは非常に軽いのでほとんど気になりません。

このマイクの精度は非常に優れていますが、ブームが口元に近い標準的な有線ヘッドセットと比べると若干劣ります。しかし、Savi 440は優れた設計で、ワイヤレスイヤホンでよく見られるものよりもブームが長く、私の場合はブームが口の端にほぼ届きます。マイク自体の品質が非常に優れているため、静かな環境での音声認識に最適なマイクです。

デスクトップマイク:快適さと自由

マイクを装着したくない場合は、デスクトップマイクが適しているかもしれません。デスクトップマイクの大きなデメリットは、マイクを口のほぼ正面に配置する必要があることと、頭を動かしたり立ち上がったりすると認識が悪くなることです。しかし、髪の毛が乱れたり、メガネに押し付けられたり、耳に刺激を与えたりする煩わしいケーブルや機器から解放されます。

SpeechWare USB 3-in-1 テーブルマイク

いくつかのデスクトップマイクを試してみましたが、特に目立ったモデルが2つありました。Blue Microphonesの150ドルのYetiは、非常に大きくて昔ながらのタイプのマイクで、コンピューターでの録音用に設計されています。音声認識専用に設計されたものではありませんが、Yetiは優れた音質を提供し、Dragon Dictateとの相性も抜群です。カーディオイド設定を選択すると、マイクは周囲全体ではなく前方の音を拾うため、マイクの背後からのバックグラウンドノイズが拾われません。私のテストでは、Yetiは非常に優れた精度を示しましたが、マイクのサイズを考えると、邪魔になることもあります。ディクテーションに加えて他の種類の録音(ポッドキャストなど)を行う予定がある場合、これは両方を実行できる優れたマイクです。

正確で邪魔にならないデスクトップ マイクをお探しなら、SpeechWare の 279 ドルの USB 3-in-1 TableMike が間違いなく最良の製品の一つです。広帯域オーディオとノイズ キャンセリング機能を備えたこのマイクは音声認識用に特別に設計されており、机の上に置いてマイクの先端を口から 30 cm 以上離しても優れた精度が得られます。このマイクの標準バージョンには 15 インチのフレキシブル ブームが付属していますが、私には少し短すぎると感じました。マイクのベースがキーボードに近すぎるからです。同社はオプションで 19 インチまで伸びる伸縮式ブームも提供しています。私はこの長さが理想的で、机の上で実用的に使える程度にベースを離すことができます。

デスクトップマイクの欠点は、認識精度に一定の基準がある点です。頭を少し動かしても問題なく動作しますが、机の横に寄ったり、例えば机の横のテーブルにあるものを見るために横を向いたりする場合は、マイクを動かすか、後ろに回してディクテーションする必要があります。

あなたに最適なマイク

この概要では、音声認識ソフトウェアに適した3種類のマイクについて説明しました。ユーザーごとにニーズや要件は異なるため、高価なマイクを購入する前に、これらを慎重に検討する必要があります。理想的には、万が一自分に合わなかった場合に返品できるかどうかを確認しましょう。

私にとって、ヘッドセットの装着は煩わしいものです。Macに音声入力するために音声認識ソフトウェアを使う場合、コンピューターにワイヤーで縛られるのはまさに避けたいものです。しかし、私は周囲の騒音がほとんどない自宅オフィスで働いています。もし、周囲でたくさんの人がおしゃべりしたり電話が鳴ったりする賑やかなオフィスで働いている場合は、マイクブームが口の前にあるため、ノイズキャンセリング機能によって周囲の音がすべて遮断されるため、ヘッドセットが必要になるかもしれません。

ワイヤレスマイクは素晴らしい製品で、特に私がテストしたPlantronics Savi 440は素晴らしいのですが、電池で動くので、常に充電しておく必要があります。(Savi 440には充電ベースが付属しており、必要に応じて予備の電池を購入して交換できます。)耳にかけるだけのタイプは、特に装着感が悪く、長時間装着していると不快感を感じることがあります。

これらすべてのマイクをテストしたときにひらめいたのは、TableMike のような優れたデスクトップ マイクには数多くの利点があることを発見したことです。このマイクの精度は、口から約 12 インチの距離でも、どのヘッドセットにも劣りません。静かな環境であれば、18 インチでも問題ありません。また、このマイクをデスクに置いておけば、メールの返信など、1 つか 2 つの段落をディクテーションするだけであれば、ヘッドセットを取り出して頭に装着する必要がありません。フレキシブル ブームを垂直にした状態でマイクを手元に置いておけば、何かをディクテーションしたいときは、ブームを曲げて Dragon Dictate でマイクをオンにし、話し始めることができます。このマイクは、椅子にもたれかかって楽な姿勢でディクテーションできるほど優れています。他のデスクトップ マイクのように、硬い姿勢に縛られることはありません。

音声認識に使用できるマイクは文字通り何百種類もあります。ここで紹介した3つのファミリーに分類され、価格は50ドルから数百ドルまでと幅があります。これらのマイクの品質には差があるため、価格に見合った性能が確実に得られます。ディクテーションソフトウェアを頻繁に使用する予定がある場合は、高性能なマイクへの投資を真剣に検討すべきです。

[シニア寄稿者の Kirk McElhearn 氏は、自身のブログ Kirkville で Mac 以外のことについても書いています。Twitter: @mcelhearn Kirk 氏は、Take Control of Scrivener 2 の著者です。]