Opportunités dans le contexte des défis de l'IA Web3 : attendre que les dividendes s'épuisent et saisir les scénarios de niche.

robot
Création du résumé en cours

Les dilemmes et opportunités du développement de l'IA Web3

Récemment, le prix de l'action Nvidia a atteint un nouveau sommet, et les progrès des modèles multimodaux ont approfondi les barrières technologiques de l'IA Web2. De l'alignement sémantique à la compréhension visuelle, de l'embedding haute dimension à la fusion des caractéristiques, des modèles complexes intègrent à une vitesse incroyable diverses modalités d'expression, construisant un haut lieu IA de plus en plus fermé. Le marché boursier américain a également montré par des actions concrètes son optimisme pour le domaine de l'IA, que ce soit pour les actions liées aux crypto-monnaies ou aux actions d'IA, tous présentent une petite tendance haussière.

Cependant, cette frénésie semble n'avoir aucun lien avec le domaine des cryptomonnaies. Les tentatives de Web3 AI que nous avons observées, en particulier les explorations dans la direction des Agents au cours des derniers mois, présentent un écart directionnel majeur : l'idée idéaliste de vouloir assembler un système modulaire multimodal à la manière de Web2 avec une structure décentralisée est en réalité un double décalage technique et de pensée. Dans un contexte où la couplage des modules est extrêmement fort, la distribution des caractéristiques est hautement instable et les besoins en puissance de calcul se concentrent de plus en plus, il est difficile pour le modulaire multimodal de s'ancrer dans un environnement Web3.

L'avenir de l'IA Web3 ne réside pas dans une simple imitation, mais dans un détour stratégique. Des alignements sémantiques dans des espaces de haute dimension, aux goulots d'étranglement d'information dans les mécanismes d'attention, en passant par l'alignement des caractéristiques sous des puissances de calcul hétérogènes, chaque étape présente de grands défis.

Le dilemme de l'alignement sémantique de l'IA Web3

Dans les systèmes multimodaux de l'IA Web2 moderne, l'alignement sémantique est une technologie clé pour mapper les informations de différentes modalités dans un même espace sémantique. Cela permet au modèle de comprendre et de comparer les significations sous-jacentes de signaux très différents. Ce n'est que dans le cadre de la réalisation d'un espace d'insertion de haute dimension que diviser le flux de travail en différents modules a un sens en termes de réduction des coûts et d'augmentation de l'efficacité.

Cependant, le protocole Web3 Agent a du mal à réaliser des embeddings de haute dimension, car la modularité elle-même est une illusion. La plupart des Web3 Agents ne sont que des "Agents" indépendants, chacun encapsulant des API prêtes à l'emploi, manquant d'un espace d'embedding centralisé unifié et d'un mécanisme d'attention inter-module, ce qui empêche l'information d'interagir de manière multi-angle et multi-niveau entre les modules, ne pouvant suivre qu'un pipeline linéaire, affichant une fonctionnalité unique et incapables de former une optimisation de boucle fermée globale.

Pour réaliser un agent intelligent à chaîne complète avec des barrières sectorielles, il est nécessaire de passer par une modélisation conjointe de bout en bout, un embedding unifié entre les modules, ainsi qu'un ingénierie systématique de formation et de déploiement collaboratif. Cependant, le marché actuel ne présente pas de tel point de douleur, et il manque donc naturellement de demande sur le marché.

Limitations du mécanisme d'attention

Des modèles multimodaux de haut niveau nécessitent des mécanismes d'attention conçus de manière précise. Le mécanisme d'attention est essentiellement un moyen de répartir dynamiquement les ressources de calcul, permettant au modèle de "se concentrer" sélectivement sur les parties les plus pertinentes lors du traitement d'une entrée d'une certaine modalité.

Cependant, il est difficile de réaliser une planification d'attention unifiée dans le Web3 AI basé sur des modules. Tout d'abord, le mécanisme d'attention repose sur un espace Query-Key-Value unifié, tandis que les API indépendantes renvoient chacune des données dans des formats et des distributions différents, sans couche d'incorporation unifiée, ce qui empêche la formation de Q/K/V interactifs. Deuxièmement, le Web3 AI implique souvent des appels API linéaires, manquant de capacités parallèles et de pondération dynamique multiple, ce qui empêche la simulation du planning précis dans le mécanisme d'attention. Enfin, un véritable mécanisme d'attention attribue dynamiquement des poids à chaque élément en fonction du contexte global, tandis que dans le modèle API, un module ne peut voir que le "contexte indépendant" dans lequel il est appelé, ce qui empêche la création de relations et de focalisations globales entre les modules.

Les dilemmes superficiels de la fusion des caractéristiques

Web3 AI en est encore au stade de la simple concaténation en ce qui concerne la fusion des caractéristiques, car la fusion dynamique des caractéristiques nécessite un espace de haute dimension et un mécanisme d'attention précis. Lorsque ces conditions ne sont pas remplies, la fusion des caractéristiques ne peut naturellement pas atteindre le niveau de performance idéal.

L'IA Web2 a tendance à s'entraîner de manière conjointe de bout en bout, en traitant simultanément des caractéristiques multimodales dans le même espace de haute dimension, en optimisant de manière collaborative avec les couches d'attention, de fusion et de tâche en aval. En revanche, l'IA Web3 adopte davantage une approche de collage de modules discrets, manquant d'un objectif d'entraînement unifié et d'un flux de gradient inter-modules.

Barrières de l'industrie de l'IA et opportunités de Web3

Les barrières dans l'industrie de l'IA se renforcent, mais les opportunités d'entrée de l'IA Web3 ne se sont pas encore vraiment manifestées. L'IA Web3 devrait adopter une stratégie de développement de type "encercler les villes depuis les campagnes", en testant à petite échelle dans des scénarios périphériques, puis en attendant l'apparition de scénarios centraux après avoir assuré une base solide.

Les principaux avantages de l'IA Web3 résident dans sa décentralisation, dont le chemin d'évolution se traduit par une haute parallélisation, un faible couplage et la compatibilité avec des capacités de calcul hétérogènes. Cela confère à l'IA Web3 un avantage dans des scénarios tels que le calcul en périphérie, adaptée aux structures légères, aux tâches facilement parallèles et incitatives, telles que le réglage fin LoRA, les tâches d'entraînement post-alignement comportemental, l'entraînement et l'annotation de données en crowdsourcing, l'entraînement de petits modèles de base, ainsi que l'entraînement collaboratif sur des dispositifs périphériques.

Cependant, les barrières actuelles de l'IA Web2 ne font que commencer à se former, et nous devons attendre que les bénéfices de l'IA Web2 s'estompent, les points de douleur qu'elle laisse derrière elle étant la véritable opportunité pour l'IA Web3. Avant cela, les projets d'IA Web3 doivent soigneusement évaluer s'ils ont le potentiel de "encercler les villes depuis les campagnes", s'ils peuvent itérer et mettre à jour continuellement leurs produits dans de petits scénarios, et s'ils disposent de suffisamment de flexibilité pour répondre à l'évolution des demandes du marché. Ce n'est qu'en satisfaisant ces conditions que les projets d'IA Web3 pourront se démarquer dans la compétition future.

AGENT-6.2%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Reposter
  • Partager
Commentaire
0/400
FallingLeafvip
· 08-09 08:54
NVIDIA a encore fait une hausse. Quand aura-t-il un pullback ?
Voir l'originalRépondre0
gas_fee_therapistvip
· 08-08 19:39
Haha, NVIDIA est le véritable gagnant.
Voir l'originalRépondre0
NestedFoxvip
· 08-06 09:48
Je sais juste parler de BTC, où est l'opportunité ?
Voir l'originalRépondre0
MultiSigFailMastervip
· 08-06 09:37
All in NVIDIA et c'est tout.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)