AI hỗ trợ cách mạng trình duyệt: Từ công cụ tìm kiếm đến nền tảng gọi Agent

robot
Đang tạo bản tóm tắt

Kỷ nguyên mới của trình duyệt AI: Từ tìm kiếm đến đại lý

Cuộc chiến trình duyệt lần thứ ba đang diễn ra. Từ Netscape đến IE, rồi đến Firefox và Chrome, cuộc tranh giành trình duyệt luôn phản ánh sự thay đổi quyền kiểm soát nền tảng và các mô hình công nghệ. Chrome đã trở thành kẻ thống trị nhờ vào việc cập nhật nhanh chóng và lợi thế hệ sinh thái, Google thông qua cấu trúc hai độc quyền của tìm kiếm và trình duyệt, đã hình thành nên vòng khép kín cho cổng thông tin.

Tuy nhiên, cấu trúc này đang bị rung chuyển. Sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM) khiến ngày càng nhiều người dùng hoàn thành nhiệm vụ ngay trên trang kết quả tìm kiếm, hành vi nhấp chuột vào trang web truyền thống giảm. Rumor về việc Apple có thể thay thế công cụ tìm kiếm mặc định trên Safari càng đe dọa nền tảng lợi nhuận của Alphabet, thị trường đang lo lắng về "chính thống tìm kiếm".

Trình duyệt cũng đang phải đối mặt với việc tái định hình vai trò. Nó không chỉ là công cụ hiển thị trang web, mà còn là một container tập hợp nhiều khả năng như nhập dữ liệu, hành vi người dùng, danh tính riêng tư, v.v. Mặc dù AI Agent rất mạnh mẽ, nhưng để thực hiện tương tác trang phức tạp, gọi dữ liệu danh tính cục bộ, và kiểm soát các yếu tố trang web, vẫn cần phải dựa vào ranh giới tin cậy và sandbox chức năng của trình duyệt. Trình duyệt đang chuyển từ giao diện con người thành nền tảng gọi hệ thống cho Agent.

Điều có thể thực sự phá vỡ thế giới trình duyệt hiện tại không phải là một "Chrome tốt hơn", mà là một cấu trúc tương tác mới: từ việc hiển thị thông tin đến việc gọi nhiệm vụ. Trình duyệt trong tương lai cần được thiết kế cho AI Agent, không chỉ có thể đọc mà còn có thể viết và thực thi. Các dự án như Browser Use đang cố gắng để cấu trúc ngữ nghĩa trang, biến giao diện trực quan thành văn bản có cấu trúc có thể được LLM gọi, tạo ra ánh xạ từ trang đến lệnh, giảm đáng kể chi phí tương tác.

Các dự án chính đã bắt đầu thử nghiệm: Perplexity xây dựng trình duyệt gốc Comet, sử dụng AI thay thế cho kết quả tìm kiếm truyền thống; Brave kết hợp bảo vệ quyền riêng tư với suy luận cục bộ, tăng cường chức năng tìm kiếm và chặn bằng LLM; các dự án gốc Crypto như Donut nhắm đến một cổng mới cho tương tác giữa AI và tài sản trên chuỗi. Những đặc điểm chung của các dự án này là: cố gắng tái cấu trúc đầu vào của trình duyệt, thay vì chỉ làm đẹp lớp đầu ra.

Đối với các doanh nhân, cơ hội nằm ở mối quan hệ tam giác giữa đầu vào, cấu trúc và đại lý. Trình duyệt như một giao diện gọi Agent trong tương lai có nghĩa là ai có thể cung cấp các "khối khả năng" có thể cấu trúc, có thể gọi và đáng tin cậy, thì người đó sẽ trở thành một phần của nền tảng thế hệ mới. Từ SEO đến AEO(Agent Engine Optimization), từ lưu lượng truy cập trang đến gọi chuỗi tác vụ, hình thức sản phẩm và tư duy thiết kế đang được tái cấu trúc. Cuộc chiến trình duyệt lần thứ ba diễn ra ở "đầu vào" chứ không phải "trình bày"; điều quyết định thắng bại không còn là ai thu hút được ánh mắt của người dùng, mà là ai giành được sự tin tưởng của Agent, có được lối vào để gọi.

Lời khuyên cho các doanh nhân

  1. Chuẩn hóa cấu trúc giao diện: Đảm bảo sản phẩm của bạn "có thể gọi". Cân nhắc xem cấu trúc thông tin sản phẩm có thể chuẩn hóa và trừu tượng hóa thành một schema rõ ràng hay không, các thao tác chính có thể được mô tả thông qua cấu trúc DOM có ngữ nghĩa hoặc ánh xạ JSON không, có cung cấp trạng thái máy để Agent tái hiện quy trình hành vi của người dùng không, tương tác có hỗ trợ phục hồi kịch bản không, có WebHook hoặc API Endpoint ổn định không.

  2. Danh tính và quyền truy cập: Giúp Agent "vượt qua rào cản tin cậy". Điều này đặc biệt quan trọng trong bối cảnh Web3, xem xét việc trở thành "MCP(Multi Capability Platform)" của thế giới blockchain, có thể là lớp lệnh chung, bộ giao thức hợp đồng tiêu chuẩn hóa, hoặc ví nhẹ chạy cục bộ + nền tảng danh tính.

  3. Hiểu lại cơ chế lưu lượng: Từ SEO đến AEO/ATF. Sản phẩm cần có độ phân giải nhiệm vụ rõ ràng, trở thành "đơn vị khả năng có thể gọi" thay vì chỉ là "trang" đơn giản. Bắt đầu tối ưu Agent ( AEO ) hoặc thích ứng lịch trình nhiệm vụ ( ATF ), đơn giản hóa quy trình đăng ký thành các bước có cấu trúc, thông qua giao diện kéo giá cả, truy vấn tồn kho theo thời gian thực, v.v. Thích ứng cú pháp gọi của các khung LLM khác nhau.

Dự án khởi nghiệp trong tương lai không phải là tái tạo trình duyệt, mà là làm cho trình duyệt hiện có phục vụ cho Agent, xây dựng cầu nối cho thế hệ mới của "dòng lệnh". Xây dựng "cú pháp giao diện" để Agent gọi đến thế giới của bạn, trở thành một phần trong chuỗi niềm tin của các thực thể thông minh, xây dựng "thành phố API" trong mô hình tìm kiếm tiếp theo. Thời đại Web3 + AI Agent, nắm bắt ý định thực thi của Agent thông qua chuỗi gọi, thay vì thu hút sự chú ý của người dùng thông qua UI.

AGENT1.42%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • Chia sẻ
Bình luận
0/400
LiquiditySurfervip
· 07-30 20:01
Chỉ cần cho tôi toàn bộ trình duyệt để gọi api là xong.
Xem bản gốcTrả lời0
GasWastervip
· 07-30 00:26
Trình duyệt cũng đã dần trở nên phổ biến.
Xem bản gốcTrả lời0
Lonely_Validatorvip
· 07-27 20:40
đại lý đã tăng tốc thuộc về
Xem bản gốcTrả lời0
StopLossMastervip
· 07-27 20:40
Nhập vị thế个agent试试 chơi đùa với mọi người一波接着 chơi đùa với mọi người
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)