出典: シリコンスターマン (ID: guixingren123)
著者: 李和子
Reddit があんな人格だとは思わなかった
今年 4 月に Reddit が API インターフェースの有料化を発表したことを覚えている人がどれだけいるかわかりません。
ストリーム保存バージョンのレビューは、OpenAI や Google などの企業が大規模モデルをトレーニングするための独自のプラットフォームのデータに満足していないため、Reddit がその API を呼び出す企業に課金し始めるというものです。
最近、この事件の影響で、Reddit 上の 3 つの大規模グループ r/aww、r/pics、r/gifs (それぞれ登録者数 3,410 万人、3,000 万人、2,160 万人) がジョン・オリバーによってストーキングされていることが判明しました。写真は「爆発」しました。
Redditのグループに表示される投稿は「いいね!」の数でソートされているため、この3つのグループに入ると画面には喜びに満ちたジョン・オリバーの顔がいっぱい……。
spez は Reddit CEO の Steve Huffman の Reddit ユーザー名です
r/gifs と r/aww もグループ名を「GIFs of John Oliver」と「可愛くて抱きしめたくなるような John Oliver 写真のサブレディット」に変更しました。
ジョン オリバーは、有名なトーク番組「ラスト ウィーク トゥナイト」の司会者です。この番組は、時事ニュースを風刺することで有名です。ネチズンの集団パフォーマンス アートが、明らかに彼のミームを使って Reddit への不満を表現したいと考えています。
たとえば、222,000件の「いいね!」が付いた写真がありますが、画面の内容はジョン・オリバーと「セサミストリート」の主要登場人物3人の集合写真で、添えられたテキストは「ジョン・オリバーとレディットのCEOと幹部」です。
さらに印象的なのは、これらのミームで使用されている素材の多くがジョン・オリバー自身によってネチズンに提供されたものであるということです。
それで、ここで一体何が起こっているのでしょうか?
Redditは今年4月18日、そのAPIを呼び出す企業にデータ使用料を請求するとメディアを通じて発表したが、その際、RedditのCEOスティーブ・ハフマン氏は「Redditのデータコーパスは非常に価値があるが、その必要はない」と明言した。貴重なデータは世界最大手の企業の一部に無料で利用可能です。」
一見すると、この決定は OpenAI や Google などの大規模なモデルを開発する企業を対象としたものでしたが、すぐに他の分野の開発者の中には、自分たちが最も虐げられるのではないかと思い出した人もいます。
最も問題となったのは今月8日、iOSプラットフォーム上のサードパーティ製Redditクライアント「Apollo」が6月30日に正式に閉鎖されると発表したことだった。
Reddit のモバイル端末は長い間不振だったため、多くのサードパーティ アプリの開発が生まれてきたことはわかっています。 Reddit が提供する無料の API インターフェースを使用して、ユーザーが Reddit 上のコンテンツをより便利に閲覧できるようにします。Apollo は、最も人気のあるサードパーティ Reddit クライアントの 1 つです。
Apollo 開発者の Christian Selig 氏は、Apollo を閉鎖する理由について語り、新しい API ポリシーの下で、Reddit は 5,000 万の API リクエストごとに 12,000 ドルを前払いで請求する予定であると述べ、月額 168 万ドル (70 億 API リクエスト) を前払いで請求し、最大 2,000 万ドルに達する可能性があると述べました。毎年 Reddit に投稿します。
問題は、Christian Selig や無料と位置づけられている Apollo のような個人開発者にとって、この高額な料金はまったく手が届かないということです。
クリスチャン・セリグ氏はレディットと何度もやり取りをしたが無駄で、最終的にサイトを閉鎖する決断を下した。 Reddit が API に料金を請求するのは合理的ですが、ユーザーを本当に怒らせるのは、次の Reddit の一連の操作です。
クリスチャン・セリグがまだレディットと交渉していたとき、ある日突然、「アポロは紛争を鎮めるためにレディットを1000万ドルで脅そうとした」というレディット内部の主張についてどうコメントするかを尋ねるメッセージを受け取った。
しかし、レディットが予期していなかったのは、クリスチャン・セリグが彼らとのコミュニケーションを記録していたことだ。その後、彼は通話のこの部分のトランスクリプトと音声をオンラインに投稿し、レディットは「あからさまに嘘をついている」とコメントした。
この後、Reddit は価格設定を再考するだろうと思っていましたが、それでも新しい API ポリシーを推進すると主張しただけでなく、Christian Selig を批判し続けました。外の世界…私的な通話が録音され、漏洩されたため、彼とどのように取引をすればよいのかわかりません。」
このお粗末な対応により、最終的に Reddit 上の 7,000 以上のグループが Reddit に対する抗議活動に参加することになり、一部のグループはコンテンツの大部分を黒化し、一部は非公開にし、その他は閉鎖を選択しました。
ある時点では、Reddit で最大のグループである r/funny さえ見つけることができませんでした。
この抗議の波でレディットはほぼ麻痺したが、レディットのCEOスティーブ・ハフマンは依然として、レディット・グループに無報酬で寄付したグループリーダーを「家主の紳士」と呼ぶなど、驚くべき発言をしており、多くのグループメンバーはその発言に耳を傾けなければならなかった。抗議活動があまりにも長く続き、残りの町民が自分たちの生活を続けたいと願うこの都市…彼らがコメントできたら、きっとそのグループは『迷惑だから電源を切って』と言うだろう。」
次に、この記事の冒頭にあるユーザーのパフォーマンス アートが登場しました。
スティーブ・ハフマン氏の発言を覆すため、これらのグループのリーダーらは、グループの将来を決定するための投票を実施するようそれぞれのチームメンバーに呼び掛け、選択肢は「A-通常に戻る」、「B-ジョン・オリバーのミームのみを許可する」の3つだ。
その結果、選択肢Bの票数が圧倒的に勝った。
実は、大規模なモデル呼び出しデータの問題を理由に API 料金ルールを変更したプラットフォームは Reddit が初めてではありません。今年2月、マスク氏はTwitterのAPIアクセスにより将来的にペイウォールが設定されると発表した。
Twitter の顧客担当者が 3 月初旬に公開した文書によると、同社は開発者に次の 3 つのレベルのエンタープライズ パッケージを提供する予定です。
最も安価な Small Package は月額 42,000 ドルで、5,000 万件のツイートにアクセスできます。より高い階層では、研究者や企業はそれぞれ 1 億ツイートと 2 億ツイートというより多くのデータにアクセスできますが、費用はそれぞれ月額 12 万 5,000 ドルと 21 万ドルです。
言い換えれば、開発者は Twitter に年間少なくとも 50 万ドルを支払わなければなりません (ただし、50 万 5,000 ツイートのデータ量は大規模なモデルをトレーニングするには十分ではありません)。
4月19日(RedditがAPI使用料を有料にすることを発表した翌日)、Microsoftは、将来的にTwitterデータに無料でアクセスできないことへの不満を理由に、Twitter向けのユーザー指向の広告データ管理サービスの提供を終了すると発表した。 。
そしてマスク氏は翌日、AIを訓練するためにTwitterデータを「違法」に使用したとしてMicrosoftを告訴する可能性があるとツイートした。
さらに、ゲッティイメージズは今年2月にも、ゲッティイメージズの写真の著作権を侵害しているとしてStability AIを提訴した。
しかし、同様の事件が Reddit に発展したとき、状況は異なっていたようです。第一に、レディットは大手モデル会社を告訴することを選択しませんでした。第二に、Reddit の API 課金基準が暴露された後、大手モデル会社 (特に OpenAI) は沈黙を守りました。
多くの人には知られていませんが、現在 OpenAI の CEO であるサム・アルトマンは Reddit の初期投資家でした。
Altman 氏が初期の事業で開発したモバイル アプリケーション Loopt は、かつて Reddit として有名な古いインキュベーターである Y Combinator が投資した同じスタートアップ グループでした。その後、この事業は失敗しました。2012 年に Loopt を売却した後、Altman 氏は Y Combinator の一員として加わりました-タイムパートナーの人たち。
2014年、Y Combinatorの創設者であるPaul Graham氏は、自身より20歳年下のAltman氏をY Combinatorの社長に選出し、その後、Altman氏率いるY Combinatorが2014年9月にRedditのBラウンド資金調達を主導したとのこと。
同氏はレディットのCEOイーシャン・ウォン氏が2014年に辞任した後、8日間レディットの暫定CEOを務めたこともある。
それ以来7年以上、アルトマン氏は2022年1月に辞任を発表するまでレディットの取締役会のメンバーを務めてきた。退社する際、同氏はこう語った。「私はユーザーとしてRedditが大好きで、取締役会で過ごした数年間も大好きです。スティーブが率いるチームと取締役会の他のメンバーは素晴らしく、会社全体が非常に有能な人々です。」
そのため、7年間の「友情」を背景に、RedditのAPI使用料の課金決定はOpenAIと話し合われたのではないかと推測する人もいる。
データは、特に Meta のオープンソース大規模言語モデル LLaMA のリリースにより、将来の大規模モデルの競争の重要な要素の 1 つであると考えられています。スケール モデルのオープン ソースについても広く議論されました。結論の 1 つは、大規模モデルのトレーニングに使用されるデータの品質がデータのサイズよりも優れているということです。
データの品質やデータサイズに関係なく、Reddit には利点があります。まず第一に、この Web サイトは世界で 11 番目にアクセス数が多い Web サイト (米国では 6 位) であり、第二に、現時点で最もホットなイベントに関する実際のディスカッションを常に更新し続けています。どのように見ても、最も理想的な Web サイトです。大規模なモデルのデータベースをトレーニングするため。
Redditが今年後半にIPOを計画していると以前に報じられていたが、これは収益が依然として広告によって占められており、まだ利益を上げていないRedditは、より多くの収益を上げる方法を早急に見つける必要があることを意味する。個人開発者よりも明らかに収益性が高く、魅力的です。
アルトマン氏は以前、OpenAIがコンテンツ企業と積極的に協力し、認可を取得していると述べ、特定分野の高品質データには高額の対価を支払う用意があることを表明した。
1 つはデータ用、もう 1 つはお金のため、完璧な組み合わせのように思えます。将来的には Reddit が大規模なモデルにアクセスする可能性があると推測する人もいます。
現在の Reddit の厳しい姿勢を見ると、個人の開発者をあまり大事にしたくないようで、ユーザーと商業的利益を考慮すると後者を選択しているようです。しかし、矛盾した問題は、Steve Huffman氏が述べたRedditプラットフォームは、大規模なモデルをトレーニングして最良の結果を生み出すことができ、同時に「新規性と関連性」を備えたデータがRedditユーザーによって次々と作成されるということです。
しかし、スティーブ・ハフマン氏がよく言うように、「抗議活動があまりにも長く続いているため、他の市民が生活を続けたいと考えている都市」では、ユーザーは離れないと彼はかなり確信しているようだ。
237k 投稿
220k 投稿
152k 投稿
80k 投稿
67k 投稿
65k 投稿
61k 投稿
59k 投稿
53k 投稿
51k 投稿
OpenAIの「白人売春」に抵抗したが、Redditが先に自社ユーザーによって「爆発」した?
出典: シリコンスターマン (ID: guixingren123)
著者: 李和子
今年 4 月に Reddit が API インターフェースの有料化を発表したことを覚えている人がどれだけいるかわかりません。
ストリーム保存バージョンのレビューは、OpenAI や Google などの企業が大規模モデルをトレーニングするための独自のプラットフォームのデータに満足していないため、Reddit がその API を呼び出す企業に課金し始めるというものです。
最近、この事件の影響で、Reddit 上の 3 つの大規模グループ r/aww、r/pics、r/gifs (それぞれ登録者数 3,410 万人、3,000 万人、2,160 万人) がジョン・オリバーによってストーキングされていることが判明しました。写真は「爆発」しました。
Redditのグループに表示される投稿は「いいね!」の数でソートされているため、この3つのグループに入ると画面には喜びに満ちたジョン・オリバーの顔がいっぱい……。
r/gifs と r/aww もグループ名を「GIFs of John Oliver」と「可愛くて抱きしめたくなるような John Oliver 写真のサブレディット」に変更しました。
たとえば、222,000件の「いいね!」が付いた写真がありますが、画面の内容はジョン・オリバーと「セサミストリート」の主要登場人物3人の集合写真で、添えられたテキストは「ジョン・オリバーとレディットのCEOと幹部」です。
Reddit は不和をまき散らしますか?
Redditは今年4月18日、そのAPIを呼び出す企業にデータ使用料を請求するとメディアを通じて発表したが、その際、RedditのCEOスティーブ・ハフマン氏は「Redditのデータコーパスは非常に価値があるが、その必要はない」と明言した。貴重なデータは世界最大手の企業の一部に無料で利用可能です。」
一見すると、この決定は OpenAI や Google などの大規模なモデルを開発する企業を対象としたものでしたが、すぐに他の分野の開発者の中には、自分たちが最も虐げられるのではないかと思い出した人もいます。
最も問題となったのは今月8日、iOSプラットフォーム上のサードパーティ製Redditクライアント「Apollo」が6月30日に正式に閉鎖されると発表したことだった。
Apollo 開発者の Christian Selig 氏は、Apollo を閉鎖する理由について語り、新しい API ポリシーの下で、Reddit は 5,000 万の API リクエストごとに 12,000 ドルを前払いで請求する予定であると述べ、月額 168 万ドル (70 億 API リクエスト) を前払いで請求し、最大 2,000 万ドルに達する可能性があると述べました。毎年 Reddit に投稿します。
問題は、Christian Selig や無料と位置づけられている Apollo のような個人開発者にとって、この高額な料金はまったく手が届かないということです。
クリスチャン・セリグ氏はレディットと何度もやり取りをしたが無駄で、最終的にサイトを閉鎖する決断を下した。 Reddit が API に料金を請求するのは合理的ですが、ユーザーを本当に怒らせるのは、次の Reddit の一連の操作です。
クリスチャン・セリグがまだレディットと交渉していたとき、ある日突然、「アポロは紛争を鎮めるためにレディットを1000万ドルで脅そうとした」というレディット内部の主張についてどうコメントするかを尋ねるメッセージを受け取った。
しかし、レディットが予期していなかったのは、クリスチャン・セリグが彼らとのコミュニケーションを記録していたことだ。その後、彼は通話のこの部分のトランスクリプトと音声をオンラインに投稿し、レディットは「あからさまに嘘をついている」とコメントした。
このお粗末な対応により、最終的に Reddit 上の 7,000 以上のグループが Reddit に対する抗議活動に参加することになり、一部のグループはコンテンツの大部分を黒化し、一部は非公開にし、その他は閉鎖を選択しました。
この抗議の波でレディットはほぼ麻痺したが、レディットのCEOスティーブ・ハフマンは依然として、レディット・グループに無報酬で寄付したグループリーダーを「家主の紳士」と呼ぶなど、驚くべき発言をしており、多くのグループメンバーはその発言に耳を傾けなければならなかった。抗議活動があまりにも長く続き、残りの町民が自分たちの生活を続けたいと願うこの都市…彼らがコメントできたら、きっとそのグループは『迷惑だから電源を切って』と言うだろう。」
次に、この記事の冒頭にあるユーザーのパフォーマンス アートが登場しました。
スティーブ・ハフマン氏の発言を覆すため、これらのグループのリーダーらは、グループの将来を決定するための投票を実施するようそれぞれのチームメンバーに呼び掛け、選択肢は「A-通常に戻る」、「B-ジョン・オリバーのミームのみを許可する」の3つだ。
すべては大きなモデルから始まります
実は、大規模なモデル呼び出しデータの問題を理由に API 料金ルールを変更したプラットフォームは Reddit が初めてではありません。今年2月、マスク氏はTwitterのAPIアクセスにより将来的にペイウォールが設定されると発表した。
Twitter の顧客担当者が 3 月初旬に公開した文書によると、同社は開発者に次の 3 つのレベルのエンタープライズ パッケージを提供する予定です。
言い換えれば、開発者は Twitter に年間少なくとも 50 万ドルを支払わなければなりません (ただし、50 万 5,000 ツイートのデータ量は大規模なモデルをトレーニングするには十分ではありません)。
4月19日(RedditがAPI使用料を有料にすることを発表した翌日)、Microsoftは、将来的にTwitterデータに無料でアクセスできないことへの不満を理由に、Twitter向けのユーザー指向の広告データ管理サービスの提供を終了すると発表した。 。
しかし、同様の事件が Reddit に発展したとき、状況は異なっていたようです。第一に、レディットは大手モデル会社を告訴することを選択しませんでした。第二に、Reddit の API 課金基準が暴露された後、大手モデル会社 (特に OpenAI) は沈黙を守りました。
多くの人には知られていませんが、現在 OpenAI の CEO であるサム・アルトマンは Reddit の初期投資家でした。
Altman 氏が初期の事業で開発したモバイル アプリケーション Loopt は、かつて Reddit として有名な古いインキュベーターである Y Combinator が投資した同じスタートアップ グループでした。その後、この事業は失敗しました。2012 年に Loopt を売却した後、Altman 氏は Y Combinator の一員として加わりました-タイムパートナーの人たち。
2014年、Y Combinatorの創設者であるPaul Graham氏は、自身より20歳年下のAltman氏をY Combinatorの社長に選出し、その後、Altman氏率いるY Combinatorが2014年9月にRedditのBラウンド資金調達を主導したとのこと。
同氏はレディットのCEOイーシャン・ウォン氏が2014年に辞任した後、8日間レディットの暫定CEOを務めたこともある。
それ以来7年以上、アルトマン氏は2022年1月に辞任を発表するまでレディットの取締役会のメンバーを務めてきた。退社する際、同氏はこう語った。「私はユーザーとしてRedditが大好きで、取締役会で過ごした数年間も大好きです。スティーブが率いるチームと取締役会の他のメンバーは素晴らしく、会社全体が非常に有能な人々です。」
データは、特に Meta のオープンソース大規模言語モデル LLaMA のリリースにより、将来の大規模モデルの競争の重要な要素の 1 つであると考えられています。スケール モデルのオープン ソースについても広く議論されました。結論の 1 つは、大規模モデルのトレーニングに使用されるデータの品質がデータのサイズよりも優れているということです。
データの品質やデータサイズに関係なく、Reddit には利点があります。まず第一に、この Web サイトは世界で 11 番目にアクセス数が多い Web サイト (米国では 6 位) であり、第二に、現時点で最もホットなイベントに関する実際のディスカッションを常に更新し続けています。どのように見ても、最も理想的な Web サイトです。大規模なモデルのデータベースをトレーニングするため。
アルトマン氏は以前、OpenAIがコンテンツ企業と積極的に協力し、認可を取得していると述べ、特定分野の高品質データには高額の対価を支払う用意があることを表明した。
1 つはデータ用、もう 1 つはお金のため、完璧な組み合わせのように思えます。将来的には Reddit が大規模なモデルにアクセスする可能性があると推測する人もいます。
現在の Reddit の厳しい姿勢を見ると、個人の開発者をあまり大事にしたくないようで、ユーザーと商業的利益を考慮すると後者を選択しているようです。しかし、矛盾した問題は、Steve Huffman氏が述べたRedditプラットフォームは、大規模なモデルをトレーニングして最良の結果を生み出すことができ、同時に「新規性と関連性」を備えたデータがRedditユーザーによって次々と作成されるということです。
しかし、スティーブ・ハフマン氏がよく言うように、「抗議活動があまりにも長く続いているため、他の市民が生活を続けたいと考えている都市」では、ユーザーは離れないと彼はかなり確信しているようだ。