Apple Booksを愛用している方にとって、興味深い、あるいは衝撃的な新機能が登場しました。Appleは、AIを用いてオーディオブックを作成するための新たなデジタルナレーションプロジェクトの開始を発表しました。オーディオブック市場の人気は爆発的に高まっているものの、実際に音声化されている書籍はごく一部に過ぎません。そこで、Appleの新技術は、人間の音声録音に伴う「コストと複雑さ」を解消する方法を提供します。
このプロジェクトの最初の公開成果は、すでにApple Book Storeで公開されています。ブックアプリを開いて「AIナレーション」を検索すると、「Apple Booksによるナレーション」というラベルが付いたフィクションやロマンス小説が数十冊見つかります。そのラベルをタップすると、これらのジャンルで使用されているデジタルソプラノの「マディソン」が朗読するのか、それともバリトンの「ジャクソン」が朗読するのかが表示されます。どちらも実際の人間のナレーターに基づいていると言われていますが、音声はAIによって生成されています。
Appleのウェブサイトでは、ノンフィクションや自己啓発のジャンルのデジタル音声を担当する「ヘレナ」と「ミッチェル」のサンプルも聞くことができるが、これらは一般公開されているオーディオブックにはまだ使用されていない。
Appleは、これらの音声は「言語学者、品質管理専門家、そしてオーディオエンジニアからなるチームによる重要な作業を伴う高度な音声合成技術」の成果であると保証していますが、マディソンとジャクソンの最大の魅力はその効率性にあることは明らかです。人間のナレーションを録音するには数週間かかり、場合によっては数千ドルの費用がかかり、経験豊富な声優や著名人(あるいは、ますます増えている著者自身)の存在も必要です。だからこそ、多くの書籍はテキストのみのままなのです。AIによるアプローチは、このプロセスの費用対効果を大幅に向上させます。
しかし、本当に効果があるのだろうか?クリステン・エスリッジ著『Shelter From The Storm』の最初の数ページを聴いて、その非人間的な響きに衝撃を受けた。「マディソン」は人間らしく聞こえず、彼女の話し方を文章の内容にうまく合わせることもできない。また、聴き手を惹きつける、目に見えない人間的な感情表現も欠けている。私は何度も読み進めてしまい、音声を雑音としてかき消してしまった。
この技術は間違いなく進歩しており、数年以内に人間の声優に取って代わる可能性もあるが、まだそこまでには至っていない。ナレーションの自動化は、短期間で制作され読者数の少ない書籍のロングテール市場において大きなコスト削減につながることは明らかだが、Appleが注目度の高い書籍への展開や、この取り組み全般の宣伝に慎重な姿勢を見せる理由も明らかだ。私たちの知る限り、このプロジェクトに関する標準的なプレスリリースはまだ発表されておらず、Appleはメディアサイトや一般読者よりも、著者や出版社に広報活動の焦点を当てているようだ。
そして、そうした作家たちはこのアイデアにあまり乗り気ではないかもしれない。ガーディアン紙が指摘するように、これは読者以外の多くの利害関係者からの批判に対処しなければならない戦略だ。同紙が連絡を取ったオーディオブック制作者と文芸エージェントは、それぞれ高品質のナレーションがもたらす価値について語り、このプロジェクトにある程度懐疑的な見方を示したが、より深刻な懸念は政治団体や法人から寄せられる可能性がある。この新サービスによって、Appleはオーディオブックの販売だけでなく、制作にも進出しようとしているように思われ、反競争行為の非難の新たな戦場となるだろう。
著者: David Price、Macworld編集者
デビッドは20年以上テクノロジーについて執筆しており、2007年の最初のiPhoneの発売を取材した際にAppleの熱狂に乗った。彼は熱心なApple Watchの伝道師であり、HomePodは誤解されていると感じている。