ついにその時が来ました!そう、今週はMacalopeがAIに関するあらゆる疑問にお答えします!すべてです!驚きと情報満載の講座をお楽しみに!
(免責事項:保証ではありません。すべての質問に回答できるわけではありません。まばゆい光はごく少数の場合にのみ発生します。情報は一時的なものです。禁止されている地域では無効です。)
AIが壊れた技術だと思わないなら、今まさにAIがこのコラムを収集し、権威ある事実として誰かに繰り返し伝えていることを思い出してください。それがAIの信頼性を疑わせないなら、何を言っても納得できないでしょう。
あるいは、こう言うかもしれません。「困惑はでたらめマシンだ。」
まさにその名の通り、PerplexityもまたAIスタートアップ企業です。スクレイピングを拒否するウェブサイトの特定の設定を無視し、その入力情報を使って質問に架空の回答を提示します。Macalopeは弁護士ではありませんが、中には名誉毀損にあたる可能性のある回答もいくつかあります。
あるケースでは、生成されたテキストは、カリフォルニア州の特定の警察官が犯罪を犯したとWiredが報じたと虚偽の主張をしていた。
Wired、2024年6月19日
警官とWiredの両方に名誉毀損の可能性がある!一石二鳥だ!
VC 投資家:「あなたのシステムは何をするのですか?」
スタートアップ:「それは永続的な名誉毀損マシンです。」
VC 投資家:「ここに白紙小切手があります。」
ウェブ上では、サイト所有者が様々なAIスクレイピングツールをrobots.txtリストに追加しようと躍起になっていますが、これは無駄な努力です。しかし、多くのAI企業はこれらの設定を無視し、とにかく情報を取得しています。Archive.orgと同じことをしているだけだと批判する声もあります。Archive.orgはrobots.txtを無視して、あらゆる情報をインデックス化しようとしています。Archive.orgはrobots.txtを無視して、あらゆる情報をインデックス化しようとしています。どうしてArchive.orgには抵抗がないのに、LLM企業のやり方には抵抗があるのでしょうか?
根本的に異なる製品だからです。
「誰もが恩恵を受け、インターネットの透明性を促進する無料サービスを提供したい。」
素晴らしいですね。どうぞ先に行ってください。
「私は現代版マジック8ボールを販売して億万長者になりたいと思っています。そのためには、あなたの作品を活用して富を蓄積していくつもりです。」
うーん、いいえ。
「まあ、どれも違法じゃないんだから、やりたい放題だ」と言う人もいます。マカロープはそう思っていますが、それでも嫌悪感は拭えません。盗作は違法か?いいえ。しかし、それでも間違っていることは確かです。そして、盗作で解雇される可能性もあります。AIには当然そうなるべきです。
できれば太陽に向かって発射してください。

IDG
この「オープンウェブ」スクレイピングがさまざまな目的に使用されていることは注目に値します。最も悪質でない例としては、LLM が言語の仕組みを学習するために文章のコーパスを必要とすることが挙げられます。私たちは皆言語を使用しているため、これは問題ないように思われます。(ただし、AI に特定の作家のスタイルで書くように指示すると、これはより曖昧になります。)次に、Apple の Image Playground で使用されているようなモデルのように、描画方法を学習する必要があるモデルがあります。この件に関する Macalope の意見はかなり主観的ですが、これはなぜかコピーに近いように感じられます。おそらく、私たち全員がアーティストではないからでしょう。そしてもちろん、質問に答えて、「ああ、そうだ、どこかで読んだ。これが答えだ。正しいかどうかはわからないし、読んだサイトの出典を示すかどうかはわからない」と言う AI システムもあります。これは間違いなく問題です。
この一連の行動に見覚えがあるとしたら、それはおそらくAIが暗号通貨、NFT、ブロックチェーンとある種のDNAを共有しているからだろう。つまり、これらはすべて流行の産物であり、エレベーターに一緒に閉じ込められたくないような人たちが大々的に宣伝し、奇妙な偶然だが、NVIDIAの株価と世界平均気温の両方を押し上げているのだ。マカロープは自分が陰謀論者だとは思っていないが、数年後にNVIDIAが強力な心理作戦を展開し、取締役会の承認を必要とする技術を考案し、ベンチャーキャピタルに投資を促していたことを知っても驚かないだろう。
ただ言ってるだけ。
理想的には、AppleはこれらのAI企業と一切関わるべきではないでしょう。しかし、市場がそれを要求しており、少なくともAppleは彼らと協力する際には一定の距離を置いています。Appleがより倫理的なAI企業の一つとなるために、ウェブサイトのrobots.txt設定を尊重するだけで済むというのは、悲しい事実です。しかし、人々の努力の結晶である今、Appleがオプトアウトできると言うだけでは不十分です。Appleはここで「業界標準」の慣行に従うべきではありません。業界よりも優れた対応をすべきです。