74
Hey Siri、AppleはまたAIのチャンスを逃しているのか?

これらのツールは一時的な流行ではありません。まだ初期段階にあり、急速に進化しています。GoogleやMicrosoftといった大手テクノロジー企業は、この新しい生成AIを私たちの未来にとって非常に重要なものと捉えています。彼らにとって、90年代にウェブを席巻したのと同じくらい、確固たる地位を築き、リーダーシップを確立することは重要なのです。

しかし、このゲームに参加していない企業が一つある。Appleだ。地球上で最も価値のあるテクノロジー企業は、コンピューティングにおける完全な革命の機会を完全に逃しているようだ。AppleはAIに精通しており、Siriでアシスタント革命を巻き起こした。しかし、競合他社に対抗するための十分な投資を怠ったことで、既にその優位性は失われている。

生成AIによって歴史は繰り返されるのでしょうか?それとも、Appleはいつものように、何か驚くべきものを秘めていて、ただ極秘にしているだけなのでしょうか?

分析するAIは古い、AIを作るのは新しい

大手テクノロジー企業は長年、AIの隆盛を謳歌してきました。ディクテーションや音声アシスタント向けに音声を分離・解析し、それぞれの声を聞き分けてパーソナライズされた結果を提供するAI。録音した音声をつなぎ合わせて「話しかける」AI。画像の一部を分離して簡単に編集できるAI。物体や人物を識別して検索機能を強化するAI。あらゆる画像内のテキストを選択できるAI。

Appleはこれらすべてを実現しています。同社にとってこれは非常に重要なことであり、すべてのチップにニューラルエンジン(機械学習タスクを高速化する専用ハードウェア)を組み込んでいます。AppleはAIにおける最大の課題である自動運転車にも取り組んでいます。

しかし、生成AIは別のものです。これは、ほとんどテキスト入力を必要とせずに全く新しいものを作り出す、比較的新しい種類のAIです。確かに、モデルの学習には膨大な時間と膨大なデータが必要ですが、ユーザーが実行するモデルは比較的小規模で、無限の数の新しいものを作り出すことができるようです。写真ライブラリにあるジャガイモをすべて見つけることができるAIと、様々な芸術的なスタイルでジャガイモを一から描くAIは全く別物です。

Bing.comホームページ
Microsoft は Bing チャットで生成 AI ゲームに参入しました。

マーク・ハッハマン / IDG

ChatGPT、Bard、Bing

現在、注目を集めている生成AI技術は、OpenAIのChatGPTです。この高度なチャットボットと、それを基盤としたツールは、既にビジネス界で記事、メール、テンプレートなどを生成するために活用されていますが、議論も巻き起こっています。学生たちはChatGPTを使って、短いプロンプトから論文を執筆しており、その成果は非常に優れているため、教師がChatGPTで作成された課題を識別できる優れたツールの開発競争が繰り広げられています。

膨大なウェブデータで学習されたこのAIは、時代遅れではあるものの、多くの用途で依然として有用なため、まるで会話型の検索エンジンのようです。この結果にGoogleは激怒し、ライバルとなる独自の会話型AI製品「Bard」を発表しました。Bardはまだ一般公開には至っていませんが、近日中にリリース予定です。公開デモではジェイムズ・ウェッブ宇宙望遠鏡に関する誤った情報が提供されたため、Googleには改善の余地があることは明らかです。

Microsoftはまた、BingとEdgeブラウザで今すぐ使える新しい会話型検索機能を発表しました。これはChatGPTをベースに、いくつかの機能強化と改良が加えられています。

これらは単なるおもちゃや珍品ではありません。人々が実際に仕事に取り組んだり、創造的なプロジェクトを推進したりするために使われている、本物のツールです。まだ初期段階であり、世の中に普及するまでには至っていないと感じることもありますが、改善と革新のペースは驚異的です。AIモデルの複雑さと洗練度は6ヶ月ごとに倍増しています。

安定拡散、中間段階、DALL-E

文字だけではありません。昨年、DALL-E 2を使って面白いプロンプトを作って大笑いしましたが、さらなるトレーニングと機能強化により、これらの生成AIアートツールは、頭上に金魚鉢を乗せてスキューバダイビングをするアニメ風の猫の画像を作成するだけでなく、様々な用途に使えるようになりました。

Midjourney と Stable Diffusion は非常に優れた作品を生み出しており、雑誌の表紙を簡単に飾れるほどのアートを、数分間で数十点も生み出すことができます。

これらのツールは、様々なスタイルの全く新しい画像を作成するだけでなく、入力画像を変更することも可能です。App Storeにはすでに、このソフトウェアを使って顔写真を数枚撮影し、誰にも気づかれずに身体的特徴を変更することで、驚くほど美しく加工できるアバターやプロフィール作成アプリが溢れています。例えば、まるで本物のように見えるサングラスをかけたり。

昨年は単なるギミックでしたが、この技術は急速に発展しており、既にツールとして定着しています。Adobeは既に多くのアプリにAIを活用した画像生成ツールを導入し、ワンクリックでの写真修復やオブジェクト削除機能の大幅な向上を実現しています。そして同社は近々、ツールセットに重要な生成AI機能を追加する予定で、既存の写真やアートワークに、まるでそこにぴったりと収まるかのように画像を挿入できるようになります。

DALL-E 2 アート

Dall-E 2 は、奇抜な画像を作成して時間をつぶすだけの楽しいツールではありません。

Dalle2.アプリ

行動を起こすための狭い窓

では、Appleはこの中でどこにいるのでしょうか?同社は、特にクリエイティブ分野において、テクノロジーリーダーとしての地位を確立しています。しかし、機械学習研究サイトからのいくつかのブログ記事と、Apple Silicon向けライブラリへの比較的手間のかからない最適化を除けば、Appleはこの件には手をこまねいているようです。Divam Gupta氏のDiffusionBeeは非常にクールだと思いますが、これは独立した小さなサードパーティ製アプリで、かなり長い間アップデートされておらず、AI画像生成の分野では既に最先端技術に遅れをとっています。

この技術は、まさに革命的な変革をもたらすでしょう。信じられない?OpenAIの音楽生成研究を見てみてください。歌声など、様々なスタイルの新しい音楽が、全くの偶然から生み出されます。MicrosoftのVALL-Eは、人の声のほんの一部を入力するだけで、驚くほどリアルな声を生成できます。しかも、実在の人物に非常に近い音声です。様々な感情状態を模倣することさえ可能です。

これらのプロジェクトの多くは、そしてさらに数十ものプロジェクトはまだ研究段階にあります。いずれのプロジェクトにも欠陥を見つけることは難しくありません。しかし、研究から実世界への移行は短期間で、欠陥を見つけるのは極めて困難になるでしょう。

Appleは確かに、独自の生成型AIチャットボットを構築するためのツールを保有しています。すべての新型MacとiPhoneには、毎秒最大15.8兆回の演算処理が可能なNeural Engineに加え、強力なCore MLと機械学習APIが搭載されています。しかし、クパチーノ内部からの動きは見られません。AIチャットボットでは精度と速度が最も重要です。Googleの株価と信頼性は、今週、Bardチャットボットのエラーを受けて急落しました。そのため、AppleはSiriの裏で開発を進めており、Appleらしく完成するまでは何もリリースしない可能性があります。しかし、豊富なツールを利用できるにもかかわらず、疑問が残ります。Appleは本当にこの状況に気付いているのでしょうか?

AI分野を注意深く見守っていなければ、AppleはAIの進化の速さに気づかないかもしれない。生成AIが「くだらないオンライン調査プロジェクトのおもちゃ」から「MicrosoftとGoogleの発表の対決」へと発展するのに1年かかった。あと2年もすれば、これらのツールは10倍も進化し、数もはるかに増えるだろう。どれが本物で、どれがAIによって空から生成されたものかを見分けるのは難しくなるだろう。壮大なアイデアはあっても、芸術的なスキルが限られている人にとって、生成AIは夢の実現をはるかに容易にしてくれるだろう。

m1チップとm2チップ

AppleのM1およびM2 Macチップには専用のニューラルエンジンが搭載されており、

毎秒何兆もの操作が行われます。

りんご

Siriによって、AppleはAI音声アシスタントを大衆に提供する最前線に立っていました。しかし、技術の進化に伴いAppleは大きく後れを取り、今ではSiriはGoogleアシスタントやAlexaとは比べものにならないほど期待外れだと思われがちです。生成型AIに関しては、AppleはSiriの時のような先行者利益さえも得ていません。大手から中小企業まで、多くのテクノロジー企業が既に強力なツールを出荷しています。行動を起こさなければ、Appleは生成型AI主導の未来を支えるハードウェアの一部を製造するだけになってしまいます。

Appleは、自社のソフトウェアとサービスにおけるこの新技術の威力に気づかないまま、コンピューティングにおける数十年ぶりの最も重要な変革となる可能性のある最先端技術の定義を他社に委ねてしまうだろう。おそらくAppleはそれで構わないと思っているかもしれないが、ハードウェアの売上が横ばいになり、ソフトウェアとサービスの分野が成長する中で、生成型AI革命のリーダーであり続けないわけにはいかないだろう。

もちろん、Appleはテクノロジー業界、特にソフトウェアに関しては最も秘密主義的な企業の一つです。Appleは、iMovie、Final Cut Pro、Logic Pro、写真、メール、メッセージ、そしてiWorkスイート全体に生成AI機能を搭載するために、大規模なチームを編成している可能性があります。これらすべてが、強力な生成AIツールによって完全に変革される可能性があります。Appleが約1年前に少なくとも1つの生成AI企業、AI Musicを買収したことは周知の事実です。今年のApple製品に、少なくとも「ビデオ用のオリジナルサウンドトラックを即座に生成」できるツールが搭載されても不思議ではありません。

Apple からは生成 AI について何も聞かないかもしれないが、WWDC でいきなり、Apple 製品全体に世界クラスの生成 AI が採用されることになる。

私はそうであることを願っている。なぜなら、もし Apple がこのような変革をもたらす技術の導入に遅れをとると、今後何年にもわたり、同社のソフトウェアは競合他社より何年も遅れをとることになるからだ。