Bong bóng AI vỡ do DeepSeek gây ra là một phước lành hay một lời nguyền cho Crypto AI?

区块律动BlockBeats

特邀专栏作者

2025-02-08 01:59

Bài viết này có khoảng 3373 từ, đọc toàn bộ bài viết mất khoảng 5 phút

DeepSeek: Xin chào Crypto, búa lớn là 80 và búa nhỏ là 40. Bạn muốn búa nào?

Tóm tắt AI

Mở rộng

DeepSeek: Xin chào Crypto, búa lớn là 80 và búa nhỏ là 40. Bạn muốn búa nào?

Tác giả gốc: BUBBLE

Vào tháng 1 năm 2025, sự ra mắt của DeepSeek R 1 đã gây chấn động thế giới AI và nó cũng thực sự thay đổi hệ sinh thái Crypto AI. Trong chu kỳ trước, Crypto AI chủ yếu xoay quanh AI Agent, nhưng DeepSeek R 1 và chiến lược nguồn mở của nó đã thay đổi hoàn toàn luật chơi: chi phí đào tạo cực thấp và các phương pháp đào tạo thích ứng mang tính đột phá đã khiến tầm nhìn phi tập trung hóa ngành công nghiệp AI không còn chỉ là lời nói suông mà trở thành hiện thực trong tầm tay. Sự thay đổi này có tác động sâu rộng. Tổng giá trị thị trường của thị trường Crypto AI đã giảm đáng kể và nhiều token AI đã trải qua đợt điều chỉnh 70%, nhưng liệu đây có thực sự là một cuộc khủng hoảng? Hay nó có nghĩa là một sự xáo trộn hoàn toàn của Crypto AI? Liệu DeepSeek có phải là "Kẻ hủy diệt" phá vỡ câu chuyện về AI tiền mã hóa hay là "Kẻ thay đổi cuộc chơi" giúp đẩy nhanh quá trình tiến vào kỷ nguyên ứng dụng thực tế?

Sự phát triển mạnh mẽ của DeepSeek

Quá trình phát triển DeepSeek bắt đầu từ năm 2021. Vào thời điểm đó, Huanfang, một quỹ đầu cơ tập trung vào giao dịch định lượng, đã bắt đầu tuyển dụng nhân tài AI trên quy mô lớn. Rất hiếm khi các công ty định lượng chuyển sang AI và hầu hết những người được tuyển dụng là các nhà nghiên cứu AI đã khám phá các hướng tiên tiến, bao gồm các mô hình lớn (LLM) và các mô hình đồ thị văn học. Mặc dù có tin đồn rằng Huanfang đã thực hiện chuyển đổi để sử dụng tốt hơn các nguồn tài nguyên GPU nhàn rỗi của công ty, nhưng lý do chính là quyết định này được đưa ra để nắm bắt các đỉnh cao chỉ huy của các công nghệ AI tiên tiến như các mô hình lớn.

Đến cuối năm 2022, Huanfang đã thu hút ngày càng nhiều nhân tài AI hàng đầu, chủ yếu là sinh viên từ Đại học Thanh Hoa và Đại học Bắc Kinh. Lấy cảm hứng từ ChatGPT, Tổng giám đốc điều hành Huanfang Liang Wenfeng đã quyết định bước vào lĩnh vực trí tuệ nhân tạo tổng quát và thành lập DeepSeek vào đầu năm 2023. Tuy nhiên, với sự phát triển nhanh chóng của các công ty AI như Zhipu, Dark Side of the Moon và Baichuan Intelligence, DeepSeek, với tư cách là một tổ chức nghiên cứu thuần túy thiếu một nhà sáng lập xuất sắc, đang phải đối mặt với khó khăn rất lớn về tài chính độc lập. Do đó, Huanfang đã chọn tách DeepSeek và tài trợ toàn bộ cho quá trình phát triển của mình. Mặc dù quyết định này cực kỳ rủi ro, nhưng DeepSeek không cần phải chịu cam kết lợi nhuận hoặc áp lực định giá từ các nhà tài trợ. Đồng thời, nó có nguồn dự trữ tài nguyên GPU tương đối đầy đủ, cho phép nhóm tập trung vào những đột phá công nghệ. Một nhóm người trẻ tuổi tràn đầy tinh thần đổi mới có thể chạy tràn lan trong thiên đường. Vào thời điểm này, DeepSeek giống một viện nghiên cứu hơn là một công ty.

Giống như những ngày đầu của OpenAI, không ai có thể nghĩ rằng một công ty nghiên cứu về bàn tay robot chơi Rubik's Cube cuối cùng lại có thể phát triển ChatGPT. Không ai có thể tưởng tượng được Magic Cube, một công ty định lượng, sẽ sử dụng DeepSeek để phá vỡ bong bóng AI hiện tại như thế nào. Cái trước mất 7 năm, trong khi cái sau chỉ mất 2 năm. Vào tháng 11 năm 2023, DeepSeek LLM đã được ra mắt với 67 tỷ tham số và hiệu suất gần bằng GPT-4. Vào tháng 5 năm 2024, DeepSeek-V2 đã được ra mắt. Vào tháng 12 cùng năm, DeepSeek-V3 đã được phát hành và hiệu suất của nó trong các bài kiểm tra chuẩn ngang bằng với GPT-4 o và Claude 3.5 Sonnet. Bước nhảy vọt về công nghệ nhanh chóng của DeepSeek không phải do nguồn lực tài chính hay trình độ học vấn cao của công ty, mà là kết quả của một điểm kỳ dị về công nghệ: "ChatGPT tác động đến ngành công nghiệp AI của thế giới". Các điểm kỳ dị ở mọi quy mô đều tăng tốc trên bất kỳ vùng đất nào có thể thỏa mãn trí tưởng tượng cho đến khi điểm kỳ dị quan trọng tiếp theo xuất hiện.

Cuối cùng, vào tháng 1 năm 2025, DeepSeek đã tăng tốc vượt qua điểm kỳ dị và mở ra cánh cửa đó với thế hệ đầu tiên của mô hình lớn có khả năng suy luận, DeepSeek-R 1, với chi phí đào tạo thấp hơn nhiều so với ChatGPT-O 1 và hiệu suất tuyệt vời.

Phân phối chìa khóa Stargate cho thế giới bằng mã nguồn mở

Chỉ một ngày sau khi DeepSeek R 1 được phát hành và mô hình mã nguồn mở được công bố, Tổng thống Hoa Kỳ Trump đã chính thức tuyên bố khởi động kế hoạch "Stargate" trị giá 500 tỷ đô la tại một cuộc họp báo tại Nhà Trắng. OpenAI, SoftBank, Oracle và công ty đầu tư MGX đã cùng nhau thành lập một liên doanh mang tên Stargate để xây dựng cơ sở hạ tầng trí tuệ nhân tạo mới cho OpenAI tại Hoa Kỳ.

Mức đầu tư này thậm chí còn có thể so sánh với "Dự án Manhattan", dường như cả nước sẽ sử dụng thuật toán xếp chồng để đẩy AI nguồn đóng lên đến đỉnh điểm và độc quyền thị trường AI để đảm bảo vị trí dẫn đầu của ngành AI trong nước Hoa Kỳ. Nhưng khi kế hoạch được công bố, không ai có thể nghĩ rằng chỉ vài ngày sau, mô hình nguồn mở này ở bên kia đại dương sẽ đơn giản ngừng mở cửa, không chỉ mang búa đến phá tường ở cửa mà còn tặng búa cho người khác.

Là một mô hình nguồn mở có thể cạnh tranh với các mô hình nguồn đóng hàng đầu, kiến trúc đào tạo hoàn toàn mới của DeepSeek đã gây ra phản ứng dây chuyền, khiến AI nguồn đóng khó có thể tiến triển. Các mô hình nguồn đóng không thể vượt trội hơn DeepSeek R 1 sẽ bị thị trường vốn loại bỏ trực tiếp. Ngay cả Marc Andreessen, người sáng lập A16z (nhà đầu tư của OpenAI), cũng đã tuyên bố công khai rằng cần chú ý nhiều hơn đến AI nguồn mở thay vì AI nguồn đóng. Trong ngành, có thể là hỗ trợ sự xuất hiện có thể có của AGI hoặc chỉ hỗ trợ AI như một phiên bản nâng cấp của ngành SaaS. Mọi người đều tin rằng tác hại của mã nguồn đóng lớn hơn nhiều so với mã nguồn mở. Cho dù là hộp đen, độc quyền công nghiệp, bảo mật thông tin hay thao túng vốn chú ý, bất kỳ cái nào trong số chúng đều là hướng phát triển rất nguy hiểm.

Mặc dù một số người trong ngành lo ngại rằng công nghệ chuyên gia hỗn hợp "MoE" của V3 đòi hỏi một bộ dữ liệu khổng lồ và bị nghi ngờ sử dụng mô hình của OpenAI để chưng cất. Đối với phương pháp học tăng cường "RL" của R1, các phương pháp dựa trên học tăng cường đòi hỏi rất nhiều tài nguyên phần cứng và người ta nghi ngờ rằng số lượng chip đào tạo được sử dụng là giả mạo. Nhưng nó không ảnh hưởng đến cải cách cơ cấu công nghiệp mà nó mang lại.

Mã nguồn mở của DeepSeek R 1 phá vỡ logic kinh doanh mô hình lớn mã nguồn đóng của OpenAI về mặt kiến trúc đào tạo và sử dụng logic cho phép mô hình tự phát triển để tránh đầu tư lớn vào sức mạnh tính toán và gắn nhãn dữ liệu của mô hình truyền thống. Mặc dù mô hình đào tạo vẫn là một hộp mù, nhưng chi phí của hộp mù thấp hơn nhiều.

Ở cấp độ phần cứng AI, mã nguồn mở V3 của DeepSeek trực tiếp thách thức sự thống trị thị trường của NVIDIA. GPU moat của NVIDIA phần lớn dựa trên nền tảng điện toán song song cơ bản và mô hình lập trình CUDA. Hệ sinh thái rộng lớn và đủ nhà phát triển của nó khiến chi phí học tập khi sử dụng chip không phải của NVIDIA để đào tạo quá cao. Các điều kiện mua ngưỡng cao và các hạn chế về chính trị đã gây ra sự chia rẽ trong quá trình phát triển AI toàn cầu.

Đối với chúng tôi, trong ngắn hạn, thị trường chứng khoán AI của Hoa Kỳ đã thu hẹp đáng kể, tổng giá trị thị trường của Crypto AI gần như bị phá vỡ và thị trường đã bước vào thị trường giá xuống. Nhưng về lâu dài, ngành công nghiệp AI được công nhận nhất đang hướng tới con đường phát triển nguồn mở, minh bạch và phi tập trung. Theo mọi góc độ, sự kết hợp giữa tiền mã hóa và AI sẽ diễn ra một cách thầm lặng hơn.

Sự cứu chuộc của AI tiền điện tử, tiến lên! cứ tiếp tục đi! Tiến lên bằng mọi cách cần thiết

Trong đợt bong bóng Crypto AI này, nhiều token khái niệm AI đã nhận được 70% hồi đáp và thị trường Crypto AI đã thu hẹp đáng kể. Một số người nói đùa rằng "5,5 triệu đô la Mỹ có thể đào tạo một mô hình lớn. Giá trị thị trường của những AI này vượt quá 500 tỷ đô la Mỹ, vậy tại sao lại mua Crypto AI?" Trên thực tế, tiền điện tử là thị trường được thúc đẩy bởi vốn hơn là sản phẩm và 90% token AI không có ý nghĩa thực tế.

Nhưng trên thực tế, với sự cải thiện của hệ thống quản lý thị trường tiền điện tử, thị trường tiền điện tử vẫn là mảnh đất thích hợp nhất để các công ty AI vừa và nhỏ khởi nghiệp. Chi phí mô hình lớn của DeepSeek chỉ bằng 1/100 ChatGPT O 1, cũng như phương pháp đào tạo mô hình của nó sẽ mang lại sự tăng trưởng sinh thái gấp hơn 10.000 lần so với thị trường hiện tại.

Nói một cách thẳng thắn, những gì DeepSeek mang lại cho tiền điện tử là một mô hình đào tạo phi tập trung, giúp các dự án kiểu Depin trở nên hợp lý hơn, giúp quá trình đào tạo và cung cấp thông tin minh bạch hơn, đồng thời giúp cơ chế thưởng giá trị cho những người đóng góp bộ dữ liệu hợp lý hơn, giúp cả phía cung và cầu của mô hình đào tạo dễ dàng thanh toán các khoản nợ. Sự phát triển của hệ sinh thái xung quanh ngành công nghiệp AI, lớn hơn mười nghìn lần, đã cải thiện thêm sự phong phú của ngành công nghiệp Crypto AI hạ nguồn. Khi đủ các câu chuyện sản phẩm cạnh tranh và sáng tạo xuất hiện trên thị trường, và miễn là một trong số chúng thực sự phá vỡ vòng tròn, các nguồn vốn bên ngoài sẽ tự nhiên chảy ngược vào Crypto. Thị trường PVP đã chịu đựng trong một thời gian dài. Một loạt các vụ thu hoạch tiền xu của người nổi tiếng sau TrumpCoin đã phá vỡ sự cân bằng thanh khoản dồi dào ban đầu và phản hồi tích cực trong thị trường AI. Do đó, bong bóng vỡ của DeepSeek thực sự là một điều tích cực lớn hơn.

Hiện nay, có nhiều Crypto AI đã nhanh chóng tích hợp DeepSeek hoặc cập nhật kiến trúc của nó, bao gồm ElizaOS, Argo, Myshell, Build, Hyperbolic, Nillion Network, infraX, v.v. Một số dự án này đã được tối ưu hóa trực tiếp trên khía cạnh sản phẩm thông qua DeepSeek.

Vỏ sò của tôi

V3, R1 và thậm chí cả mô hình tạo hình ảnh Janus-Pro đã được thêm vào quy trình sản xuất chatbot và plug-in ứng dụng. Các kỹ thuật viên của Myshell đã hoàn thành việc tích hợp mô hình trong gần nửa ngày. Là một trong số ít dự án trong blockchain luôn nhấn mạnh vào việc đánh bóng sản phẩm của mình và thậm chí còn tạo dựng được tên tuổi trong các sản phẩm AI Web2 nhưng lại không muốn phát hành tiền, mã nguồn mở DeepSeek sẽ mang đến tin tốt cho người dùng Myshell về mặt chi phí. Chi phí thấp hơn sẽ thu hút nhiều nhà phát triển Agent hơn đến với Myshell, nơi có các sản phẩm đã hoàn hảo.

Argo

Nhà phát triển Argo Sam Gao DeepSeeked đã tìm ra các chức năng quan trọng của Argo trong giai đoạn đầu thiết kế sản phẩm. Là một hệ thống quy trình làm việc, Argo đã xây dựng LLM vào tiêu chuẩn DeepSeek R 1 và chuyển giao công việc tạo quy trình làm việc ban đầu cho DeepSeek R 1. Ngoài ra, do WorkFlow, lượng token tiêu thụ và thông tin ngữ cảnh sẽ rất lớn (trung bình >= 10.000 token) và Argo cũng tích hợp CoT (Chuỗi tư duy) vào quy trình suy nghĩ của WorkFlow. Mã nguồn mở của DeepSeek không chỉ giúp giảm chi phí cho các sản phẩm quy trình làm việc mà còn cho phép triển khai LLM cục bộ trong Argo, đồng thời đảm bảo quyền riêng tư và bảo mật cho người dùng.

Trước khi DeepSeek R 1 ra mắt, Argo đã tích hợp logic đào tạo ban đầu cho mô hình Chain-of-Thought "CoT" vào quy trình sản xuất Agent Workflow của Argo. Đặc biệt, đối với các nhiệm vụ như giao dịch meme và phân tích xu hướng thị trường, Argo đã tùy chỉnh quy trình làm việc của mình bằng Graph-of-Thought (GoT), một phương pháp mới cấu trúc lý luận dưới dạng đồ thị trong đó các nút biểu diễn "suy nghĩ LLM" và các cạnh biểu diễn sự phụ thuộc giữa các suy nghĩ này.

Argo đã chọn GoT, Luồng công việc AI tiền điện tử duy nhất hiện đang sử dụng mô hình này, để đạt được quy trình đáng tin cậy và minh bạch hơn. Cách tiếp cận sáng tạo này ảnh hưởng trực tiếp đến tính bảo mật và sự tin cậy của các giao dịch trên nền tảng Argo. Việc tích hợp Mind Map (GoT) vào tác nhân AI Web3 đưa Argo lên vị trí hàng đầu trong giao dịch tiền điện tử AI. Lý luận có cấu trúc của CoT không chỉ tăng cường tính bảo mật của các giao dịch tài chính mà còn đảm bảo việc ra quyết định minh bạch và đáng tin cậy, điều này rất quan trọng trong tài chính phi tập trung (DeFi).

Điều đáng chú ý là các nhà phát triển cốt lõi của Argo là Sam và Shaw đã đồng sáng tác một bài báo có tiêu đề "EraseAnything: Cho phép xóa khái niệm trong máy biến dòng chỉnh lưu" về cách xóa các khái niệm không mong muốn khỏi các mô hình khuếch tán văn bản thành hình ảnh quy mô lớn mà không ảnh hưởng đến hiệu suất tạo tổng thể của mô hình. Họ đã nhận được sự giúp đỡ từ nhà nghiên cứu DeepSeek Xingchao Liu.

Đường cong Hyperbol

Hyperbolic Labs cũng dẫn đầu trong việc công bố việc lưu trữ mô hình DeepSeek-R 1 trên nền tảng GPU của mình. Người dùng có thể thuê tài nguyên GPU Hyperblic để chạy mô hình DeepSeek-R 1 cục bộ hoặc trong một trung tâm dữ liệu được chỉ định mà không cần gửi dữ liệu nhạy cảm đến máy chủ của DeepSeek. Cách tiếp cận này không chỉ đảm bảo quyền riêng tư dữ liệu mà còn tận dụng hiệu suất suy luận tuyệt vời của mô hình DeepSeek. Đồng thời, thông qua mạng máy tính phi tập trung của Hyperbolic, người dùng có thể có được khả năng suy luận hiệu quả của mô hình DeepSeek với chi phí thấp hơn. Đây sẽ là giải pháp rất cạnh tranh cho các công ty khởi nghiệp, siêu doanh nhân cá nhân hoặc thậm chí là người dùng AI hiệu quả đơn giản.

Đợt bong bóng vỡ này thực sự đã giáng một đòn nặng nề vào thị trường AI tiền điện tử và nhiều token AI đã mất đi giá trị cường điệu. Nhưng về bản chất, DeepSeek không phá hủy Crypto AI mà buộc thị trường phải phát triển nhanh hơn. Sau DeepSeek R 1, tương lai của Crypto AI sẽ không còn chỉ dựa vào suy đoán nữa mà sẽ được tái thiết xung quanh điện toán AI phi tập trung, cơ chế khuyến khích kinh tế để đào tạo mô hình, phân phối công bằng các nguồn lực AI và các sản phẩm thực tế. Thách thức thực sự là liệu Crypto có thể sử dụng cuộc cách mạng công nghệ do DeepSeek mang lại để xây dựng một hệ sinh thái AI thực sự có giá trị hay không thay vì chỉ tạo ra các khái niệm và sự cường điệu.

Đây không phải là kết thúc mà là sự tiến hóa. Trí tuệ nhân tạo tiền điện tử cần phải di chuyển nhanh hơn và mạnh mẽ hơn. / Tăng tốc

Chào mừng tham gia cộng đồng chính thức của Odaily