La nouvelle ère des navigateurs AI : de la recherche à l'agent
La troisième guerre des navigateurs est en cours. De Netscape à IE, puis à Firefox et Chrome, la bataille des navigateurs reflète toujours le changement de contrôle des plateformes et des paradigmes technologiques. Chrome est devenu le maître grâce à ses mises à jour rapides et à ses avantages écologiques, Google a formé un cycle fermé d'accès à l'information avec sa double structure d'oligopole de recherche et de navigateur.
Cependant, ce schéma est en train d'être ébranlé. L'émergence des grands modèles de langage (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches directement sur la page de résultats de recherche, réduisant ainsi le comportement de clic sur les pages web traditionnelles. Les rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent encore plus les bases de profits d'Alphabet, suscitant un malaise sur le marché concernant la "orthodoxie de la recherche".
Le navigateur lui-même est également confronté à une redéfinition de son rôle. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur d'une multitude de capacités telles que l'entrée de données, le comportement des utilisateurs, et l'identité privée. Bien que l'Agent IA soit puissant, pour réaliser des interactions complexes sur les pages, appeler des données d'identité locales, et contrôler les éléments de la page, il doit encore s'appuyer sur les frontières de confiance et les sandboxes fonctionnelles du navigateur. Le navigateur évolue d'une interface humaine vers une plateforme d'appel système pour les agents.
Ce qui pourrait réellement briser le paysage actuel du marché des navigateurs n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : du affichage d'informations à l'appel de tâches. Les navigateurs de demain devront être conçus pour les agents IA, capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par LLM, réalisant ainsi la cartographie de la page aux instructions et réduisant considérablement le coût d'interaction.
Les projets grand public ont commencé à essayer : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine la protection de la vie privée et le raisonnement local, utilisant LLM pour améliorer les fonctions de recherche et de blocage ; des projets natifs Crypto comme Donut visent une nouvelle entrée pour l'interaction entre l'IA et les actifs en chaîne. La caractéristique commune de ces projets est : essayer de reconstruire le côté entrée du navigateur, plutôt que d'embellir son côté sortie.
Pour les entrepreneurs, l'opportunité réside dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour le futur Agent, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance, peuvent devenir une partie intégrante de la nouvelle génération de plateformes. De l'SEO à l'AEO(Agent Engine Optimization), du trafic de page à l'appel de chaînes de tâches, la forme et la pensée de conception des produits sont en reconstruction. La troisième guerre des navigateurs se déroule sur l'"entrée" plutôt que sur la "présentation" ; ce qui détermine le gagnant n'est plus qui attire le regard des utilisateurs, mais qui obtient la confiance de l'Agent et accède à l'entrée d'appel.
Conseils aux entrepreneurs
Normalisation de la structure des interfaces : assurez-vous que votre produit est "appelable". Envisagez si la structure des informations du produit peut être normalisée et abstraite en un schéma clair, si les opérations clés peuvent être décrites par une structure DOM sémantique ou un mappage JSON, si un automate d'état est proposé pour reproduire le flux de comportement de l'utilisateur par l'Agent, si l'interaction supporte la restauration scriptée, et s'il existe un WebHook ou une API Endpoint stable.
Identité et passage : aider l'Agent à "franchir les barrières de confiance". Cela est particulièrement important dans les scénarios Web3, en considérant de devenir "MCP(Multi Capability Platform) dans le monde de la blockchain", qui peut être une couche d'instructions universelles, un ensemble d'interfaces de contrats standardisées, ou un portefeuille léger + une plateforme d'identité fonctionnant localement.
Compréhension du mécanisme de trafic : de SEO à AEO/ATF. Les produits doivent avoir une granularité de tâche claire, devenant des "unités de capacité appelables" plutôt que de simples "pages". Commencer à optimiser l'Agent (AEO) ou à adapter la planification des tâches (ATF), simplifier le processus d'inscription en étapes structurées, récupérer les prix via l'interface, interroger les stocks en temps réel, etc. Adapter la syntaxe d'appel aux différents cadres LLM.
Les futurs projets d'entrepreneuriat ne consistent pas à recréer des navigateurs, mais à faire en sorte que les navigateurs existants servent les Agents, établissant des ponts pour la nouvelle génération de "flux d'instructions". Construire la "syntaxe d'interface" qui appelle votre monde par les Agents, devenant un maillon de la chaîne de confiance des intelligences artificielles, et ériger un "château API" dans le prochain mode de recherche. À l'ère de Web3 + AI Agent, il s'agit de saisir l'intention d'exécution de l'Agent par la chaîne d'appels, plutôt que de capter l'attention des utilisateurs par l'interface utilisateur.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
23 J'aime
Récompense
23
4
Partager
Commentaire
0/400
LiquiditySurfer
· 07-30 20:01
Il suffit de me donner tout le navigateur pour appeler directement l'API.
Voir l'originalRépondre0
GasWaster
· 07-30 00:26
Les navigateurs sont également en train de se renforcer.
Voir l'originalRépondre0
Lonely_Validator
· 07-27 20:40
l'agent a explosé, c'est à dire
Voir l'originalRépondre0
StopLossMaster
· 07-27 20:40
Prendre une position agent essayez prendre les gens pour des idiots une vague puis prendre les gens pour des idiots
L'IA propulse la révolution des navigateurs : de l'engin de recherche à la plateforme d'appel d'Agent
La nouvelle ère des navigateurs AI : de la recherche à l'agent
La troisième guerre des navigateurs est en cours. De Netscape à IE, puis à Firefox et Chrome, la bataille des navigateurs reflète toujours le changement de contrôle des plateformes et des paradigmes technologiques. Chrome est devenu le maître grâce à ses mises à jour rapides et à ses avantages écologiques, Google a formé un cycle fermé d'accès à l'information avec sa double structure d'oligopole de recherche et de navigateur.
Cependant, ce schéma est en train d'être ébranlé. L'émergence des grands modèles de langage (LLM) permet à de plus en plus d'utilisateurs d'accomplir des tâches directement sur la page de résultats de recherche, réduisant ainsi le comportement de clic sur les pages web traditionnelles. Les rumeurs selon lesquelles Apple pourrait remplacer le moteur de recherche par défaut dans Safari menacent encore plus les bases de profits d'Alphabet, suscitant un malaise sur le marché concernant la "orthodoxie de la recherche".
Le navigateur lui-même est également confronté à une redéfinition de son rôle. Il n'est pas seulement un outil pour afficher des pages web, mais aussi un conteneur d'une multitude de capacités telles que l'entrée de données, le comportement des utilisateurs, et l'identité privée. Bien que l'Agent IA soit puissant, pour réaliser des interactions complexes sur les pages, appeler des données d'identité locales, et contrôler les éléments de la page, il doit encore s'appuyer sur les frontières de confiance et les sandboxes fonctionnelles du navigateur. Le navigateur évolue d'une interface humaine vers une plateforme d'appel système pour les agents.
Ce qui pourrait réellement briser le paysage actuel du marché des navigateurs n'est pas un autre "meilleur Chrome", mais une nouvelle structure d'interaction : du affichage d'informations à l'appel de tâches. Les navigateurs de demain devront être conçus pour les agents IA, capables non seulement de lire, mais aussi d'écrire et d'exécuter. Des projets comme Browser Use tentent de sémantiser la structure des pages, transformant l'interface visuelle en texte structuré appelable par LLM, réalisant ainsi la cartographie de la page aux instructions et réduisant considérablement le coût d'interaction.
Les projets grand public ont commencé à essayer : Perplexity construit un navigateur natif Comet, remplaçant les résultats de recherche traditionnels par de l'IA ; Brave combine la protection de la vie privée et le raisonnement local, utilisant LLM pour améliorer les fonctions de recherche et de blocage ; des projets natifs Crypto comme Donut visent une nouvelle entrée pour l'interaction entre l'IA et les actifs en chaîne. La caractéristique commune de ces projets est : essayer de reconstruire le côté entrée du navigateur, plutôt que d'embellir son côté sortie.
Pour les entrepreneurs, l'opportunité réside dans la relation triangulaire entre l'entrée, la structure et l'agent. Le navigateur, en tant qu'interface d'appel du monde pour le futur Agent, signifie que ceux qui peuvent fournir des "blocs de capacité" structurés, appelables et dignes de confiance, peuvent devenir une partie intégrante de la nouvelle génération de plateformes. De l'SEO à l'AEO(Agent Engine Optimization), du trafic de page à l'appel de chaînes de tâches, la forme et la pensée de conception des produits sont en reconstruction. La troisième guerre des navigateurs se déroule sur l'"entrée" plutôt que sur la "présentation" ; ce qui détermine le gagnant n'est plus qui attire le regard des utilisateurs, mais qui obtient la confiance de l'Agent et accède à l'entrée d'appel.
Conseils aux entrepreneurs
Normalisation de la structure des interfaces : assurez-vous que votre produit est "appelable". Envisagez si la structure des informations du produit peut être normalisée et abstraite en un schéma clair, si les opérations clés peuvent être décrites par une structure DOM sémantique ou un mappage JSON, si un automate d'état est proposé pour reproduire le flux de comportement de l'utilisateur par l'Agent, si l'interaction supporte la restauration scriptée, et s'il existe un WebHook ou une API Endpoint stable.
Identité et passage : aider l'Agent à "franchir les barrières de confiance". Cela est particulièrement important dans les scénarios Web3, en considérant de devenir "MCP(Multi Capability Platform) dans le monde de la blockchain", qui peut être une couche d'instructions universelles, un ensemble d'interfaces de contrats standardisées, ou un portefeuille léger + une plateforme d'identité fonctionnant localement.
Compréhension du mécanisme de trafic : de SEO à AEO/ATF. Les produits doivent avoir une granularité de tâche claire, devenant des "unités de capacité appelables" plutôt que de simples "pages". Commencer à optimiser l'Agent (AEO) ou à adapter la planification des tâches (ATF), simplifier le processus d'inscription en étapes structurées, récupérer les prix via l'interface, interroger les stocks en temps réel, etc. Adapter la syntaxe d'appel aux différents cadres LLM.
Les futurs projets d'entrepreneuriat ne consistent pas à recréer des navigateurs, mais à faire en sorte que les navigateurs existants servent les Agents, établissant des ponts pour la nouvelle génération de "flux d'instructions". Construire la "syntaxe d'interface" qui appelle votre monde par les Agents, devenant un maillon de la chaîne de confiance des intelligences artificielles, et ériger un "château API" dans le prochain mode de recherche. À l'ère de Web3 + AI Agent, il s'agit de saisir l'intention d'exécution de l'Agent par la chaîne d'appels, plutôt que de capter l'attention des utilisateurs par l'interface utilisateur.