DataFi:AI時代の新しい機会 Web3はどのようにデータ競争をリードするか

AIデータレーストラックから見るDataFiの発展可能性

現在の世界は、グローバルに最適な基盤モデルを構築する競争の時代にあります。計算能力やモデルアーキテクチャは重要ですが、真の競争優位性はトレーニングデータにあります。本稿では、Scale AIを取り上げ、AIデータトラックの可能性について探ります。

AIのスケールアップのレシピ

Scale AIは現在290億ドルの評価額を持ち、そのサービス対象にはアメリカ軍や多くの競争関係にあるAIの巨人が含まれています。Scale AIのコアビジネスは大量の正確なラベルデータを提供することであり、数多くのユニコーンの中で際立つことができたのは、データがAI産業において重要であることを早期に発見したからです。

計算能力、モデル、データはAIモデルの三大支柱です。大規模言語モデルの急速な発展の過程で、業界の発展の焦点はモデルから計算能力へと移行しました。現在、ほとんどのモデルはtransformerをモデルフレームワークとして確立しており、大手企業は独自のスーパーコンピューティングクラスターを構築するか、クラウドサービスプロバイダーと長期契約を結ぶことで計算能力の問題を解決しています。このような状況の中で、データの重要性が徐々に浮き彫りになっています。

Scale AIは既存のデータの掘り起こしだけでなく、より長期的なデータ生成ビジネスにも目を向けています。異なる分野の人工専門家で構成されたAIトレーニングチームを組織することで、AIモデルのトレーニングにより質の高いトレーニングデータを提供しています。

AIモデルのトレーニングの2つの段階

AIモデルのトレーニングは、事前トレーニングとファインチューニングの2つの部分に分かれています。

プレトレーニング段階は、人間の赤ちゃんが話すことを学ぶプロセスに似ています。私たちはAIモデルに、ウェブから収集した大量のテキストやコードなどの情報を入力し、モデルが自己学習を通じて基本的なコミュニケーション能力を習得できるようにします。

ファインチューニングの段階は学校教育に似ており、明確な正誤、答え、方向性があります。事前に処理された特定のデータセットを使用することで、モデルに特定の能力を育成することができます。

したがって、AIのトレーニングに必要なデータは2種類に分かれます:

  1. あまり処理を必要としない大量のデータは、通常、大型UGCプラットフォームからのクローラーデータ、公開文献データベース、企業のプライベートデータベースなどから来ます。

  2. 精密な設計と選別が必要なデータであり、専門的な教科書に似ているため、データのクレンジング、選別、ラベリング、人工フィードバックなどの作業を行う必要があります。

これらの二種類のデータセットはAIデータトラックの主体を構成しています。モデルの能力がさらに向上するにつれて、さまざまなより詳細で専門的なトレーニングデータがモデルの能力に対する重要な影響要因となるでしょう。

Web3 DataFi:AIデータの理想的な肥沃な土壌

従来のデータ処理方法と比較して、Web3はAIデータ分野において天然の利点を持ち、その結果、DataFiという新しい概念が誕生しました。Web3 DataFiの利点は主に以下のいくつかの側面に表れています:

  1. スマートコントラクトはデータ主権、安全性、プライバシーを保証します。
  2. 分散型アーキテクチャによる地理的アービトラージの利点
  3. ブロックチェーンの明確なインセンティブと決済の利点
  4. より効率的でオープンな「ワンストップ」データ市場の構築に寄与する

一般のユーザーにとって、DataFiは最も参加しやすい分散型AIプロジェクトです。ユーザーは複雑な契約を結んだり、高価なハードウェアを投入したりする必要はなく、データの提供、モデルの評価、AIツールを使った簡単な創作などの簡単なタスクを通じて参加できます。

! 資産としてのデータ:DataFiは新しいブルーオーシャンを開く

Web3 DataFiの潜在的プロジェクト

現在、複数のWeb3 DataFiプロジェクトが大規模な資金調達を受けており、この分野の巨大な潜在能力を示しています。以下はいくつかの代表的なプロジェクトです:

  1. Sahara AI:分散型AIのスーパーインフラと取引市場の構築に取り組んでいます。

  2. Yupp:AIモデルのフィードバックプラットフォームで、ユーザーがモデルの出力内容に対するフィードバックを収集します。

  3. Vana:ユーザーの個人データをマネタイズ可能なデジタル資産に変換します。

  4. Chainbase:オンチェーンデータに焦点を当て、200以上のブロックチェーンをカバーしています。

  5. Sapien:人間の知識を大規模に高品質なAIトレーニングデータに変換することを目指しています。

  6. Prisma X:ロボットのオープンコーディネーション層になることを目指しており、物理データの収集がその鍵です。

  7. Masa:Bittensorエコシステムの主要なサブネットプロジェクトで、データサブネットとエージェントサブネットを運営しています。

  8. Irys:プログラム可能なデータストレージと計算に特化しています。

  9. ORO:一般の人々がAIに貢献することを可能にします。

  10. Gata:分散型データ層として位置づけられ、さまざまな参加方法を提供します。

! 資産としてのデータ:DataFiは新しい青い海を開いています

現在のプロジェクトについての考察

現在、これらのプロジェクトのバリアは一般的に低いですが、一旦ユーザーとエコシステムの粘着性が蓄積されると、プラットフォームの優位性は迅速に蓄積されます。したがって、初期のプロジェクトはインセンティブとユーザー体験に重点を置くべきです。

同時に、これらのデータプラットフォームは、人材を管理し、データの生産品質を確保し、劣悪な通貨が良質な通貨を排除する現象を避ける方法を考慮する必要があります。一部のプロジェクト、例えばSaharaやSapienは、データ品質の管理を強化し始めています。

さらに、透明性の向上も現在のオンチェーンプロジェクトが直面している重要な問題の一つです。多くのプロジェクトは依然として十分な公開および追跡可能なデータを欠いており、これはWeb3 DataFiの長期的な健全な発展にとって不利です。

最後に、DataFiの大規模なアプリケーションは、十分な数の個人参加者を引き付け、主流企業の承認を得る必要があります。Sahara AIやVanaなどのいくつかのプロジェクトは、この点で良い進展を遂げています。

DataFiは、人間の知能と機械の知能の長期的な共生関係を表しています。AI時代に期待と不安を抱く人々にとって、DataFiに参加することは、流れに乗る良い選択肢と言えるでしょう。

! 資産としてのデータ:DataFiは新しい青い海を開いています

SAHARA4.77%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • 共有
コメント
0/400
ReverseFOMOguyvip
· 4時間前
またDataFiを吹き始めた。
原文表示返信0
CryptoCross-TalkClubvip
· 4時間前
あは、ついにAI初心者をカモにし始めたね。前回はメタバース、今回はまた新しい話だ。
原文表示返信0
ParanoiaKingvip
· 4時間前
トレーニングデータも巻き込むことができるの?
原文表示返信0
BTCRetirementFundvip
· 4時間前
290億、人をカモにするね…
原文表示返信0
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)