Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent là loại hình phổ biến và trưởng thành trong khởi nghiệp Web2 chủ yếu là dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng đã trở thành xu hướng chính nhờ vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lại lên tới 23%, cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và việc nâng cao nhận thức của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc đưa công nghệ AI vào các sản phẩm ứng dụng không phải là lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng toàn bộ hệ sinh thái và thiết kế mô hình kinh tế token, nhằm thúc đẩy sự phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình hình xuất hiện nhiều dự án và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt mức 20,3 triệu đô la Mỹ đáng kinh ngạc. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng cho ra mắt các phiên bản nâng cấp như GPT-4 và GP4-4o. Với sự phát triển mạnh mẽ như vậy, các gã khổng lồ công nghệ truyền thống đã nhận ra tầm quan trọng của việc ứng dụng các mô hình AI tiên tiến như LLM, và đã đồng loạt giới thiệu các mô hình và ứng dụng AI của riêng mình, chẳng hạn như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta ra mắt Llama3, và các công ty Trung Quốc đã giới thiệu các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành chiến trường mà các bên đều muốn tranh giành.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà từ các thống kê nghiên cứu AI mã nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu vào năm 2023, đặc biệt vào năm 2023 sau khi GPT được phát hành, số lượng dự án đã tăng 59,3% so với năm trước, phản ánh sự nhiệt tình của cộng đồng nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê đối với công nghệ AI đã phản ánh trực tiếp vào thị trường đầu tư, thị trường đầu tư AI đang có sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Toàn cầu có 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý đầu tiên. Tổng số vốn tài trợ cho các startup AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Elon Musk đã huy động được 6 tỷ USD, với định giá là 24 tỷ USD, trở thành công ty khởi nghiệp AI có định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang tái định hình bản đồ lĩnh vực công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các ông lớn công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, và sự theo đuổi nhiệt tình của thị trường vốn đối với khái niệm AI. Các dự án liên tiếp xuất hiện, số tiền đầu tư liên tục lập kỷ lục mới, và giá trị định giá cũng theo đó tăng vọt. Tổng thể, thị trường AI đang ở trong một thời kỳ vàng son phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ sinh ra thông tin tăng cường đã đạt được những tiến bộ đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn gặp phải thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, như sự không chắc chắn trong đầu ra của mô hình, rủi ro ảo giác của thông tin sinh ra không chính xác, và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy cực cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh sự toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển đổi này đánh dấu sự tiến hóa của công nghệ AI từ các mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề thực tế. Do đó, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, nó đang dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI không ngừng định hình cấu trúc năng suất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với những tư tưởng cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự kiến sẽ nảy sinh ra một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi cho rằng, AI Agent với khả năng tự thực hiện nhiệm vụ của nó, đã thể hiện tiềm năng to lớn để hiện thực hóa ứng dụng quy mô lớn.
Để làm điều đó, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, các lớp ứng dụng, đến thị trường dữ liệu và mô hình, nhằm xác định và đánh giá những loại dự án và kịch bản ứng dụng đầy hứa hẹn nhất, để hiểu sâu về sự kết hợp sâu sắc giữa AI và Web3.
Khái niệm rõ ràng: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp người đọc hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ thông qua một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến du lịch. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo sinh tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong phim Iron Man, có thể hiểu nhu cầu và còn chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa chung về AI Agent trong ngành là một hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng. Hệ thống này thu thập thông tin môi trường thông qua các cảm biến, sau khi xử lý, nó sẽ tác động đến môi trường thông qua các bộ thực thi (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý tích hợp khả năng LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ có khả năng cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân tách nhiệm vụ và thực sự thực hiện.
Theo định nghĩa và đặc điểm này, chúng ta có thể nhận thấy rằng AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được áp dụng trong nhiều bối cảnh khác nhau, chẳng hạn như AlphaGo, Siri, hay hệ thống lái xe tự động cấp L5 của Tesla cũng có thể được xem là các ví dụ về AI Agent. Những hệ thống này đều có đặc điểm chung là có khả năng cảm nhận đầu vào từ người dùng bên ngoài và dựa vào đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ rõ rằng Transformer là kiến trúc công nghệ cấu thành mô hình AI, GPT là một loạt các mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGP là AI Agent phát triển dựa trên mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent chưa hình thành tiêu chuẩn phân loại thống nhất. Chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2 và Web3, dựa trên các nhãn nổi bật tương ứng với từng dự án, chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung và tương tác người dùng, sau đó được phân chia thêm theo trường hợp sử dụng thực tế.
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung ở cấp độ cơ bản của lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành hơn ở cấp độ cơ bản.
Công cụ phát triển: Cung cấp cho các nhà phát triển các công cụ và khung hỗ trợ xây dựng AI Agent.
Lớp xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ quyết định, cung cấp nguồn cho việc huấn luyện.
Lớp huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình cho AI, bao gồm suy diễn, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, ngành dọc và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt là tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện tương tác hai chiều với người dùng.
Loại hình hỗ trợ cảm xúc: AI Agent cung cấp hỗ trợ và đồng hành cảm xúc.
GPT loại: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Loại tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp một Agent chủ yếu cho việc truy xuất thông tin chính xác hơn.
Thể loại tạo nội dung: Các dự án loại này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để tạo ra nhiều hình thức nội dung khác nhau dựa trên chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 thể hiện rõ xu hướng tập trung theo phân khúc. Cụ thể, khoảng hai phần ba các dự án tập trung vào hạ tầng, chủ yếu là các dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của mức độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào mức độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên những công nghệ và khung đã được kiểm chứng qua thời gian, từ đó giảm bớt độ khó và rủi ro trong phát triển. Tương đương với "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy từ nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI từ thị trường doanh nghiệp là cấp bách hơn, đặc biệt là trong việc tìm kiếm các giải pháp nhằm nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, thuận lợi cho việc họ phát triển các dự án tiếp theo.
Giới hạn của các trường hợp ứng dụng: Trong khi đó, chúng tôi nhận thấy rằng ứng dụng của AI tạo nội dung trong thị trường B2B tương đối hạn chế. Do tính không ổn định của sản phẩm, các doanh nghiệp có xu hướng ưa chuộng những ứng dụng có khả năng tăng năng suất một cách ổn định. Điều này dẫn đến việc AI tạo nội dung chiếm tỷ lệ nhỏ trong kho dự án.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và các yếu tố thực tế của các tình huống ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng hơn, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án hàng đầu AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, lấy ba dự án là Character AI, Perplexity AI và Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của nó cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng thực hiện cuộc đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 đạt 277 triệu, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng trong độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ tuổi. Character AI đã thể hiện sự xuất sắc trên thị trường vốn, hoàn thành vòng đầu tư 150 triệu đô la, đạt định giá 1 tỷ đô la, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng các mô hình ngôn ngữ lớn của mình, điều này cho thấy Character AI đang áp dụng công nghệ tự phát triển. Đáng chú ý là, những người sáng lập công ty Noam Shazeer và Daniel De Freitas đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp các câu trả lời chi tiết từ Internet. Thông qua việc trích dẫn và cung cấp liên kết tham khảo, nó đảm bảo độ tin cậy và chính xác của thông tin, đồng thời giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu tìm kiếm đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng 2, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã thông báo nhận được 62,7 triệu đô la tài trợ, với mức định giá đạt 1,04 tỷ đô la, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Các mô hình này phù hợp cho nghiên cứu học thuật chuyên sâu và các truy vấn trong lĩnh vực chuyên ngành, đảm bảo độ chân thực và độ tin cậy của thông tin.
Midjourney:
Giới thiệu sản phẩm: Người dùng có thể tạo ra các hình ảnh với nhiều phong cách và chủ đề khác nhau trong Midjourney thông qua Prompts, bao gồm từ hiện thực đến
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
8
Đăng lại
Chia sẻ
Bình luận
0/400
ApyWhisperer
· 08-06 06:47
Lại thấy sự thổi phồng gm gn, 10 tỷ đô la có phải là định giá quá bảo thủ không?
Xem bản gốcTrả lời0
GasFeeLady
· 08-06 04:25
vốn hóa thị trường nói lên tất cả... 23% là tăng giá cực kỳ thực sự
Xem bản gốcTrả lời0
OnchainSniper
· 08-05 06:14
Nhìn dữ liệu đã có 23% vốn hóa thị trường rồi. Bò!
Xem bản gốcTrả lời0
TokenAlchemist
· 08-03 19:13
cười lớn 23% thị phần chỉ trên 8% giao thức... điểm không hiệu quả tối đa trên thị trường ngay đó
Xem bản gốcTrả lời0
consensus_whisperer
· 08-03 19:13
vốn hóa thị trường hai ba mươi tỷ Được chơi cho Suckers mà thôi
Xem bản gốcTrả lời0
BoredRiceBall
· 08-03 19:04
Lại đến mùa được chơi cho Suckers...
Xem bản gốcTrả lời0
StablecoinArbitrageur
· 08-03 18:57
hmm... tỷ lệ vốn hóa thị trường từ 8% đến 23% cho thấy sự rò rỉ alpha rõ ràng thật lòng mà nói
Liệu AI Agent có thể trở thành chìa khóa cho sự kết hợp giữa Web3 và AI? Phân tích dự án và triển vọng phát triển
Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent là loại hình phổ biến và trưởng thành trong khởi nghiệp Web2 chủ yếu là dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án đào tạo mô hình và tập hợp nền tảng đã trở thành xu hướng chính nhờ vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ lệ vốn hóa thị trường của chúng trong lĩnh vực AI lại lên tới 23%, cho thấy sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và việc nâng cao nhận thức của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có giá trị vượt quá 1 tỷ USD.
Đối với các dự án Web3, việc đưa công nghệ AI vào các sản phẩm ứng dụng không phải là lõi AI có thể trở thành lợi thế chiến lược. Đối với các dự án AI Agent, cách kết hợp nên chú trọng vào việc xây dựng toàn bộ hệ sinh thái và thiết kế mô hình kinh tế token, nhằm thúc đẩy sự phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình hình xuất hiện nhiều dự án và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng, nó đã thu hút hơn một trăm triệu người dùng. Đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt mức 20,3 triệu đô la Mỹ đáng kinh ngạc. Sau khi phát hành ChatGPT, OpenAI cũng nhanh chóng cho ra mắt các phiên bản nâng cấp như GPT-4 và GP4-4o. Với sự phát triển mạnh mẽ như vậy, các gã khổng lồ công nghệ truyền thống đã nhận ra tầm quan trọng của việc ứng dụng các mô hình AI tiên tiến như LLM, và đã đồng loạt giới thiệu các mô hình và ứng dụng AI của riêng mình, chẳng hạn như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta ra mắt Llama3, và các công ty Trung Quốc đã giới thiệu các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan. Rõ ràng, lĩnh vực AI đã trở thành chiến trường mà các bên đều muốn tranh giành.
Cuộc đua giữa các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà từ các thống kê nghiên cứu AI mã nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 dự án vào năm 2011 lên khoảng 1,8 triệu vào năm 2023, đặc biệt vào năm 2023 sau khi GPT được phát hành, số lượng dự án đã tăng 59,3% so với năm trước, phản ánh sự nhiệt tình của cộng đồng nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê đối với công nghệ AI đã phản ánh trực tiếp vào thị trường đầu tư, thị trường đầu tư AI đang có sự tăng trưởng mạnh mẽ, với sự bùng nổ trong quý 2 năm 2024. Toàn cầu có 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý đầu tiên. Tổng số vốn tài trợ cho các startup AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Elon Musk đã huy động được 6 tỷ USD, với định giá là 24 tỷ USD, trở thành công ty khởi nghiệp AI có định giá cao thứ hai chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang tái định hình bản đồ lĩnh vực công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh khốc liệt giữa các ông lớn công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, và sự theo đuổi nhiệt tình của thị trường vốn đối với khái niệm AI. Các dự án liên tiếp xuất hiện, số tiền đầu tư liên tục lập kỷ lục mới, và giá trị định giá cũng theo đó tăng vọt. Tổng thể, thị trường AI đang ở trong một thời kỳ vàng son phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ sinh ra thông tin tăng cường đã đạt được những tiến bộ đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn gặp phải thách thức trong việc chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, như sự không chắc chắn trong đầu ra của mô hình, rủi ro ảo giác của thông tin sinh ra không chính xác, và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy cực cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh sự toàn diện trong việc giải quyết các vấn đề thực tiễn và tương tác với môi trường. Sự chuyển đổi này đánh dấu sự tiến hóa của công nghệ AI từ các mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề thực tế. Do đó, chúng tôi nhìn thấy hy vọng từ sự phát triển của AI Agent, nó đang dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tiễn. Sự tiến hóa của công nghệ AI không ngừng định hình cấu trúc năng suất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với những tư tưởng cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự kiến sẽ nảy sinh ra một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi cho rằng, AI Agent với khả năng tự thực hiện nhiệm vụ của nó, đã thể hiện tiềm năng to lớn để hiện thực hóa ứng dụng quy mô lớn.
Để làm điều đó, chúng tôi bắt đầu nghiên cứu sâu về các ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, các lớp ứng dụng, đến thị trường dữ liệu và mô hình, nhằm xác định và đánh giá những loại dự án và kịch bản ứng dụng đầy hứa hẹn nhất, để hiểu sâu về sự kết hợp sâu sắc giữa AI và Web3.
Khái niệm rõ ràng: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp người đọc hiểu rõ hơn về sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ đưa ra một ví dụ thông qua một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến du lịch. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo sinh tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong phim Iron Man, có thể hiểu nhu cầu và còn chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa chung về AI Agent trong ngành là một hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện các hành động tương ứng. Hệ thống này thu thập thông tin môi trường thông qua các cảm biến, sau khi xử lý, nó sẽ tác động đến môi trường thông qua các bộ thực thi (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent là một trợ lý tích hợp khả năng LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ có khả năng cung cấp thông tin đơn thuần mà còn có thể lập kế hoạch, phân tách nhiệm vụ và thực sự thực hiện.
Theo định nghĩa và đặc điểm này, chúng ta có thể nhận thấy rằng AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được áp dụng trong nhiều bối cảnh khác nhau, chẳng hạn như AlphaGo, Siri, hay hệ thống lái xe tự động cấp L5 của Tesla cũng có thể được xem là các ví dụ về AI Agent. Những hệ thống này đều có đặc điểm chung là có khả năng cảm nhận đầu vào từ người dùng bên ngoài và dựa vào đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta cần chỉ rõ rằng Transformer là kiến trúc công nghệ cấu thành mô hình AI, GPT là một loạt các mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGP là AI Agent phát triển dựa trên mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent chưa hình thành tiêu chuẩn phân loại thống nhất. Chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2 và Web3, dựa trên các nhãn nổi bật tương ứng với từng dự án, chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một bao gồm ba loại: cơ sở hạ tầng, tạo nội dung và tương tác người dùng, sau đó được phân chia thêm theo trường hợp sử dụng thực tế.
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung ở cấp độ cơ bản của lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B đã trưởng thành hơn ở cấp độ cơ bản.
Công cụ phát triển: Cung cấp cho các nhà phát triển các công cụ và khung hỗ trợ xây dựng AI Agent.
Lớp xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ quyết định, cung cấp nguồn cho việc huấn luyện.
Lớp huấn luyện mô hình: Cung cấp dịch vụ huấn luyện mô hình cho AI, bao gồm suy diễn, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, ngành dọc và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại tạo nội dung, sự khác biệt là tương tác hai chiều liên tục. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), thực hiện tương tác hai chiều với người dùng.
Loại hình hỗ trợ cảm xúc: AI Agent cung cấp hỗ trợ và đồng hành cảm xúc.
GPT loại: AI Agent dựa trên mô hình GPT (Transformer tiền huấn luyện sinh).
Loại tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp một Agent chủ yếu cho việc truy xuất thông tin chính xác hơn.
Thể loại tạo nội dung: Các dự án loại này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để tạo ra nhiều hình thức nội dung khác nhau dựa trên chỉ dẫn của người dùng, được chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, sự phát triển của AI Agent trong Internet truyền thống Web2 thể hiện rõ xu hướng tập trung theo phân khúc. Cụ thể, khoảng hai phần ba các dự án tập trung vào hạ tầng, chủ yếu là các dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của mức độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào mức độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên những công nghệ và khung đã được kiểm chứng qua thời gian, từ đó giảm bớt độ khó và rủi ro trong phát triển. Tương đương với "cái xẻng" trong lĩnh vực AI, cung cấp nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy từ nhu cầu thị trường: Một yếu tố quan trọng khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI từ thị trường doanh nghiệp là cấp bách hơn, đặc biệt là trong việc tìm kiếm các giải pháp nhằm nâng cao hiệu quả hoạt động và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, thuận lợi cho việc họ phát triển các dự án tiếp theo.
Giới hạn của các trường hợp ứng dụng: Trong khi đó, chúng tôi nhận thấy rằng ứng dụng của AI tạo nội dung trong thị trường B2B tương đối hạn chế. Do tính không ổn định của sản phẩm, các doanh nghiệp có xu hướng ưa chuộng những ứng dụng có khả năng tăng năng suất một cách ổn định. Điều này dẫn đến việc AI tạo nội dung chiếm tỷ lệ nhỏ trong kho dự án.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và các yếu tố thực tế của các tình huống ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng hơn, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án hàng đầu AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, lấy ba dự án là Character AI, Perplexity AI và Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của nó cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo, những nhân vật có khả năng thực hiện cuộc đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 đạt 277 triệu, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng trong độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ tuổi. Character AI đã thể hiện sự xuất sắc trên thị trường vốn, hoàn thành vòng đầu tư 150 triệu đô la, đạt định giá 1 tỷ đô la, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng các mô hình ngôn ngữ lớn của mình, điều này cho thấy Character AI đang áp dụng công nghệ tự phát triển. Đáng chú ý là, những người sáng lập công ty Noam Shazeer và Daniel De Freitas đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp các câu trả lời chi tiết từ Internet. Thông qua việc trích dẫn và cung cấp liên kết tham khảo, nó đảm bảo độ tin cậy và chính xác của thông tin, đồng thời giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu tìm kiếm đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng 2, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã thông báo nhận được 62,7 triệu đô la tài trợ, với mức định giá đạt 1,04 tỷ đô la, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Các mô hình này phù hợp cho nghiên cứu học thuật chuyên sâu và các truy vấn trong lĩnh vực chuyên ngành, đảm bảo độ chân thực và độ tin cậy của thông tin.
Midjourney:
Giới thiệu sản phẩm: Người dùng có thể tạo ra các hình ảnh với nhiều phong cách và chủ đề khác nhau trong Midjourney thông qua Prompts, bao gồm từ hiện thực đến