
音声をテキストに変換できるソフトウェアについて書くときによくある決まり文句は、そのソフトウェアを使って実際に書いてみることです。私は決まり文句が大の苦手なので、まさにここでVocalを使ってそれをやってみようと思います。Vocalは、開発者Matthew Robertsによる新しいアプリで、iPhone 4Sの音声文字変換機能を活用してMacを操作します。Vocalは、音声入力して文字変換したものをMacに送信するだけでなく、音声コマンドに基づいて様々な操作を実行できます。
Vocal の魔法が効くようにするには、Mac に無料の付属アプリをインストールする必要があります。そしてもちろん、App Store から 2 ドルのアプリも入手する必要があります。Mac アプリを起動し、iPhone で Vocal アプリを起動します。iPhone は、Mac が使用しているのと同じ Wi-Fi ネットワーク上で動作している必要があります。理論上は、接続されている Mac の名前がアプリに表示されるはずです。アプリと Mac は Bonjour 経由で互いを認識します。しかし、私自身のテストでは、アプリを終了し、ホームボタンをダブルタップしてマルチタスク バーを表示し、そこに表示されているアプリのアイコンを長押ししてからマイナス記号をタップすることで、iPhone 上の Vocal を強制的に再起動する必要がありました。この操作を行った後アプリを再起動すると、Mac とアプリが互いを認識するようになりました。
すると、アプリ内でMacの名前をタップすると、VocalがMacの画面に表示したパスコードの入力を求められました。入力が完了すると、Vocalは音声を聞き、そして行動する準備が整いました。

VocalはiPhone 4Sに内蔵されたシステムワイドの音声入力機能を使用しているため、Siriの通常のタイムアウトは使用しません。メールやテキストの音声入力中に長時間停止すると、Siriは自動的に音声入力を中断します。一方、音声入力オプション(仮想キーボードのマイクをタップすることで起動)は、Siriの音声入力をはるかに長く待機します。これはVocalにとって非常に有益で、文章を作成する際に考えをまとめる時間を増やすことができます。(しばらくするとVocalは音声入力を停止しますが、これはiPhone 4Sの音声入力オプション使用時に、データやメモリの使用量に基づいてシステム全体に実装されている強制タイムアウトが発生した場合にのみ発生すると思われます。)
Vocalでは、アプリに入力する必要はまずないにもかかわらず、画面上に仮想キーボードが表示されます。マイクキーにアクセスするだけで大丈夫です。マイクキーをタップして話し始め、話し終わったら「完了」ボタンをタップします。Vocalは音声指示に即座に反応するため、テキストを送信するために再度タップする必要はありません。
話し終えると自動的に送信されるので、処理がかなり速く感じられます。これらの文章を話し終えたらすぐに「完了」ボタンをタップすると、Vocalが即座にテキストエディタに貼り付けてくれます。(カーソルがテキスト入力フィールドや文書内にない場合でも、Vocalは書き起こされたテキストをMacのクリップボードにコピーしてくれるので、手動で貼り付けることができます。)ほとんどの場合はそうです。でも、時々、理由はよく分かりませんが、Vocalアプリ内で手動で「送信」ボタンを押さなければならないこともあります。
さて、Vocalが謳う機能セットのほんの一部に過ぎません。このアプリでは、iTunesの操作、メールやツイートの送信、定義の検索、テキストの選択・コピー・ペースト、AmazonやGoogleでの検索、印刷、新規文書の作成といった機能も利用できます。これらの機能の中には、実に素晴らしいものもあります。例えば、「Apple Storeのスタッフは概してとても親切です」とツイートすると、Vocalは公式Twitterクライアント内に新規ツイートウィンドウを開き、私のテキストを貼り付けてくれました。
その他のコントロールは機能が充実していません。例えば、iTunesのコントロールは、Siriが処理できるよりも少しぎこちない話し方をする必要があります。「『Artificial Heart』を再生して」と言ったところ、Vocalは私の具体的なリクエストを無視して、iTunesの再生中の曲から再生を始めました。「『Artificial Heart』を再生して」と聞いてみると、Vocalは「『Artificial Heart』という曲はiTunesで見つかりません」と表示しました。「『Artificial Heart』を再生して」はより機械的な感じでしたが、目的は達成できました。
デフォルトでは、Vocalは、文字起こしするテキストを話しているのか、それともMacに指示を送っているのかを自動的に判別しようとします。実際には、うまく機能しますが、「ツイート」や「一時停止」といった単語で文章を始めようとするとうまく機能しません。ただし、その時点でうまく機能しない場合は、この機能をオフにできるので、簡単に回避できます。
他にうまく機能した指示としては、「pugnacious の定義」といった音声指示(辞書アプリを起動して適切な単語を表示)、「Amazon で The City and The City を検索」、あるいは「Google で「chocolate baskets」を検索」といった指示があります。一方で、一部のアクションは正当化しにくいように思えました。Mac の画面が見えるほど近くにいる場合、「このページを印刷」や「新しいドキュメントを開く」といった指示では、それほど時間を節約できるとは思えません。
Vocalに「アメリカの名作小説を検索」と指示するだけで、Spotlight検索を試みます。しかし、私のMacでは、LaunchbarにCommand+スペースキーのキーボードショートカットを割り当てており、どうやらこれがVocalの裏側の動作に影響しているようで、ユーティリティはSpotlightではなくLaunchbarを使って検索していました。
Vocalには、Siriのような情報ボタン、つまり対応可能なコマンドをすべて表示するボタンが切実に必要です。現時点では、開発者ウェブサイトのサポートタブが、利用可能な説明を見つける最も簡単な方法です。
一言で言えば、Vocalは間違いなくクールです。Macで音声入力をもっと手軽に行える方法を見つけるのは難しいでしょう。その他の機能のサポート状況は玉石混交で、うまく動作するものもあれば、そうでないものもあります。少なくとも、VocalはMacネイティブのSiriが驚異的であることを証明しています。