28
私のオフィスは宇宙船ではない、あるいは音声認識が私には向いていない理由

人生の大半を、私は『スタートレック』のエンタープライズ号の乗組員のようにコンピューターと対話することを夢見てきました。キーボードもマウスも使わず、必要な情報や実行してほしいタスクをコンピューターに伝えるだけで、必要な処理が実行されるのです。20年前、AppleがMacintosh Quadra 840AV(音声認識を容易にするための信号プロセッサを追加搭載)を発売したとき、私は自分の夢が実現に向かっていると思いました。

 

しかし、過去 20 年間、Apple の長年の Speakable Items (現在はシステム環境設定のアクセシビリティ パネルにあります)、Mountain Lion で導入されたディクテーション機能 (ディクテーションとスピーチ環境設定パネルをご覧ください)、または Nuance の Dragon Dictate (評価 4/5) などのサードパーティ ツールなど、音声ベースのインターフェースを操作しようとするたびに、どうしても乗り越えられない問題に遭遇しました。それは、同僚の問題です。

彼らの会話が音声認識の精度に影響を与えるかどうかは心配していませんでした。その問題には技術的な解決策があります。問題は、一日中コンピューターに話しかけていると、自分の仕事に集中しようとしている近くの人たちの気を必ず散らしてしまうことでした。(妻と共有しているホームオフィスで仕事をしているときほど、このことが顕著でした。)そして私自身も、自分が口述した内容をすべて他人に簡単に盗聴されてしまうのが嫌でした。

AppleのSpeakableアイテム

今では、ちゃんとしたドアも完備した自分専用のホームオフィスができたので、ついにコンピューターに話しかけて自由に仕事ができると夢見ていました。ところが、驚くべき発見で計画は頓挫しました。ホームオフィスは宇宙船ではないのです。音声操作は、特にOS Xの設計を考えると、地球上で私が行っている仕事には不向きであることが分かりました。さらに、テキストの口述という、技術的には実現可能な、孤立した作業(作家には最適のはず)でさえ、私の性格や仕事スタイルには合わないのです。

「あの歯車みたいなのをカチッって。いや、あれだ!」

Apple TVは7ボタンのリモコンで操作するように設計されました。iPadは指のタップとジェスチャーで操作するように設計されました。そしてMacは、すべてのユーザーがポインティングデバイス(マウスやトラックパッドなど)とキーボードを持っていることを前提に設計されました。Apple TVやiOSデバイスではマウスは役に立ちません。一方、Macは(ある程度)タッチスクリーンで操作できますが、指はマウスポインタほどの精度がないため、操作がぎこちなくなります。オペレーティングシステムは、設計された入出力システムで最も効率的に動作します。

確かに、 Macの一部の機能は音声で操作できますが、問題はこの機能が後付けであり、根本的な設計上の選択ではないことです。多くの操作は音声では全く制御できず、中にはタスクに見合わないほどの労力を必要とするものもあります。例えば、Macに「ボタンをクリックして」や「キーを押して」と指示しなければならない場合、音声制御は明らかに無理な操作に思えます。

でもちょっと待って!Siriはどうなの?iOSデバイスでは素晴らしいし、Speakable Itemsよりもはるかにパワフルで柔軟性が高い。AppleがOS XにSiriを追加するのが、根本的な解決策ではないだろうか?

いや、そうではありません。誤解しないでください。Siriと私は素晴らしい時間を共に過ごしてきましたし、OS X版Siriは確かに私の生産性を向上させるでしょう。しかし、より高度なMac版Siriがあったとしても、それは私がキーボードとマウスで既にできることのほんの一部をショートカットするに過ぎません。Siriは、本のアウトライン作成、スプレッドシートのデザイン、図表の描画、オーディオトラックの編集、その他私が毎日Macで行っている数百ものタスクのどれにも役立ちません。私のMacの根本的な性質を変えることも、既存の入力デバイスの必要性をなくすこともありません。私はオフィスでの活動の大部分をSiriで使い続けるでしょう。

話す(または入力する)前に考えましょう

音声コントロールは私には役に立たないだろうと覚悟していましたが、それでも私の職業を考えるとディクテーションの方が優れていると考えていました。案の定、その仕組みはなかなかうまくいきました。Macに話しかけた内容を驚くほど正確に入力させられますし、Nuanceの160ドルのDragon Dictateは音声によるテキスト編集機能も備えています。技術的には問題なく、同僚が同じ部屋にいなくても誰にも邪魔されずにディクテーションできます。ただ、驚いたことに、ディクテーションで文章を書くのがどうしても苦手なのです。

試行錯誤を通して気づいたのは、私にとって、読むことで伝えるための言葉をまとめるプロセスと、口頭で伝えるための言葉をまとめるプロセスは異なるということです。実際のプレゼンテーションの準備をするときは、声に出して話しながら、伝えたいことを整理します。(そんな時、オフィスのドアが本当に役立ちます。)どういうわけか、書いたりタイピングしたりしても、思うような結果が得られないのです。

一方、本や記事を書いている時、タイピングや手書きではなく、音声で文章を書くのは、私にとって非常にストレスフルです。書き始める前にまとまった文章が思い浮かぶことはほとんどなく、タイピングしながら何度も修正しなければなりません。ですから、ディクテーションは本当にフラストレーションがたまる作業です。それに、私はタイピングが好きなんです。素早く、正確に、そして静かに書けるし、キーボードショートカット、マクロ、テキスト拡張スニペットなど、豊富なツールを使って作業を効率化できます。私の思考回路には、ディクテーションのほうが合っているんです。

理性の声に耳を傾ける

ニュアンスのドラゴンディクテート

音声コントロールやディクテーションを使う人の多くは、必要に迫られて使っています。例えば、怪我でタイピングが痛かったり、不可能になったりするなどです。もし私がそのような状況に陥ったとしても、テクノロジーのおかげで、たとえ快適とまではいかなくても、仕事をこなせるようになると分かって安心しています。また、心から楽しんでいて、ディクテーションを好むという理由で、自ら進んで定期的に使っている人も知っています。彼らの活躍を心から願っています!

音声制御のコンピューターが欲しかったのは、面白そうだと思ったからです。でも、私の場合は、現実はそうではありませんでした。音声制御やディクテーションがどの程度自分にとって最適な選択かは、脳の働き、オフィス環境、そしてこなすべきタスクによって異なります。私としては、その選択肢があるのは嬉しいのですが、それに頼らなくて済むのも嬉しいです。それに、オフィスのワープドライブをまだ調整中なので、隣人に聞かれたら困ります。誤解されるかもしれませんから。