Từ điển thuật ngữ AI (Phiên bản tháng 3/2026), đề xuất lưu lại

golem

Odaily资深作者

@web3_golem

2026-03-11 11:34

Bài viết này có khoảng 2615 từ, đọc toàn bộ bài viết mất khoảng 4 phút

30 từ mới, hãy ghi nhớ chút ít, để không còn gật đầu mỉm cười một cách gượng gạo khi tụ tập trò chuyện.

Tóm tắt AI

Mở rộng

Quan điểm cốt lõi: Bài viết này nhằm cung cấp cho những người làm việc trong lĩnh vực blockchain và tiền điện tử một hướng dẫn từ vựng cơ bản và nâng cao trong lĩnh vực AI, giúp họ nhanh chóng hiểu các khái niệm cốt lõi của ngành AI, để đối phó với xu hướng "AI+Web3" ngày càng hội tụ.
Yếu tố then chốt:
1. LLM và SLM: Mô hình ngôn ngữ lớn (LLM) là mô hình học sâu xử lý nhiều loại nội dung, trong khi mô hình ngôn ngữ nhỏ (SLM) nhấn mạnh chi phí thấp và triển khai cục bộ.
2. AI Agent: Chỉ hệ thống thông minh có thể hiểu mục tiêu, gọi công cụ và thực thi nhiệm vụ, được coi là chìa khóa chuyển đổi từ chatbot sang hệ thống có thể thực thi.
3. Token và Cửa sổ ngữ cảnh: Token là đơn vị cơ bản để mô hình AI xử lý và tính phí, còn cửa sổ ngữ cảnh quyết định tổng số Token mà mô hình có thể "nhớ" trong một lần xử lý.
4. Suy luận và Chi phí: Quá trình suy luận (Inference) sau khi mô hình đi vào hoạt động là nguồn chi phí chính trong giai đoạn thương mại hóa, thường có câu nói "huấn luyện đã đắt, suy luận còn tốn kém hơn".
5. RAG và Grounding: Tạo sinh tăng cường truy xuất (RAG) tạo câu trả lời bằng cách kết hợp nguồn dữ liệu bên ngoài, nhằm đạt được sự căn chỉnh thực tế (Grounding), giải quyết vấn đề dữ liệu lỗi thời và ảo giác của mô hình.
6. Gọi công cụ và API: Khả năng mô hình gọi các công cụ bên ngoài (Tool Calling) là then chốt của Agent, còn API là cơ sở hạ tầng kết nối ứng dụng AI với dịch vụ bên thứ ba.
7. Điểm nóng ngành: Quy trình làm việc của tác nhân thông minh (Agentic Workflow), lập trình theo cảm hứng (Vibe Coding) và giao thức ngữ cảnh mô hình (MCP) là các khái niệm và xu hướng nổi bật hiện tại trong giới AI.

Original | Odaily (@OdailyChina)

Author｜Golem (@web 3_golem)

Hiện nay, nếu người trong giới tiền điện tử không quan tâm đến AI, rất dễ bị chế giễu (đúng vậy, bạn của tôi, hãy nghĩ xem tại sao bạn lại nhấp vào đây).

Bạn có hoàn toàn không hiểu các khái niệm cơ bản về AI, phải hỏi Doubao ý nghĩa của từng từ viết tắt trong mỗi câu không? Bạn có từng tham gia các sự kiện offline về AI và hoàn toàn mơ hồ về các thuật ngữ chuyên môn, nhưng vẫn phải giả vờ như mình không bị "mất kết nối" không?

Mặc dù việc bước chân vào ngành AI trong thời gian ngắn là không thực tế, nhưng việc biết các từ vựng cơ bản tần suất cao trong ngành AI chắc chắn không thiệt. May mắn thay, bài viết tiếp theo này được chuẩn bị cho bạn ↓ Thành thật khuyên bạn nên đọc kỹ và lưu lại.

Từ vựng cơ bản (12)

LLM (Mô hình ngôn ngữ lớn)

LLM cốt lõi là mô hình học sâu được huấn luyện trên lượng dữ liệu khổng lồ, giỏi hiểu và tạo ra ngôn ngữ, nó có thể xử lý văn bản, và ngày càng có khả năng xử lý các loại nội dung khác.

Đối lập với nó là SLM (Mô hình ngôn ngữ nhỏ) - thường nhấn mạnh mô hình ngôn ngữ có chi phí thấp hơn, triển khai nhẹ hơn, thuận tiện hơn cho việc cục bộ hóa.

AI Agent (Tác nhân thông minh AI)

AI Agent không chỉ là "mô hình biết trò chuyện", mà là một hệ thống có thể hiểu mục tiêu, gọi công cụ, thực hiện nhiệm vụ theo từng bước, và khi cần thiết còn có thể lập kế hoạch và xác minh. Google định nghĩa agent là phần mềm có thể lập luận dựa trên đầu vào đa phương thức và thực hiện hành động thay mặt người dùng.

Multimodal (Đa phương thức)

Mô hình AI không chỉ đọc văn bản, mà có thể xử lý đồng thời nhiều dạng đầu vào/đầu ra như văn bản, hình ảnh, âm thanh, video. Google định nghĩa rõ ràng đa phương thức là khả năng xử lý và tạo ra các loại nội dung khác nhau.

Prompt (Từ gợi ý)

Lệnh người dùng nhập vào mô hình, là cách tương tác cơ bản nhất giữa người và máy.

Generative AI (AI tạo sinh / AIGC)

Nhấn mạnh AI "tạo ra" thay vì chỉ phân loại hoặc dự đoán, mô hình tạo sinh có thể tạo ra văn bản, mã code, hình ảnh, meme, video, v.v. dựa trên prompt.

Token (Mã thông báo)

Đây là một trong những khái niệm giống "đơn vị Gas" nhất trong giới AI. Mô hình không hiểu nội dung theo "số từ", mà xử lý đầu vào/đầu ra theo token, việc tính phí, độ dài ngữ cảnh, tốc độ phản hồi thường liên quan chặt chẽ đến token.

Context Window (Cửa sổ ngữ cảnh / Độ dài ngữ cảnh)

Chỉ tổng số token mà mô hình có thể "nhìn thấy" và sử dụng một lần, cũng có thể gọi là số lượng token mà mô hình có thể xem xét hoặc "nhớ" khi xử lý một lần.

Memory (Bộ nhớ)

Cho phép mô hình hoặc Agent lưu giữ sở thích người dùng, ngữ cảnh nhiệm vụ, trạng thái lịch sử.

Training (Huấn luyện)

Quá trình mô hình học các tham số từ dữ liệu.

Inference (Suy luận thực thi)

Trái ngược với huấn luyện, chỉ quá trình mô hình nhận đầu vào và tạo ra đầu ra sau khi đưa lên mạng. Trong ngành thường nói "huấn luyện rất đắt, suy luận còn tốn kém hơn", vì nhiều chi phí trong giai đoạn thương mại hóa thực tế xảy ra ở inference. Việc phân biệt huấn luyện/suy luận liên quan cũng là khung cơ bản khi các nhà cung cấp chính thảo luận về chi phí triển khai.

Tool Use / Tool Calling (Gọi công cụ)

Ý nghĩa là mô hình không chỉ xuất ra văn bản, mà có thể đi gọi các công cụ như tìm kiếm, thực thi mã, cơ sở dữ liệu, API bên ngoài, v.v., điều này đã được coi là một trong những khả năng then chốt của Agent.

API (Giao diện)

Cơ sở hạ tầng khi sản phẩm, ứng dụng, Agent AI kết nối với dịch vụ bên thứ ba.

Từ vựng nâng cao (18)

transformer (Kiến trúc Transformer)

Một kiến trúc mô hình giúp AI giỏi hơn trong việc hiểu mối quan hệ ngữ cảnh, cũng là nền tảng công nghệ của hầu hết các mô hình ngôn ngữ lớn ngày nay, đặc điểm lớn nhất là có thể đồng thời xem xét mối quan hệ giữa mỗi từ và các từ khác trong toàn bộ đoạn nội dung.

Attention (Cơ chế chú ý)

Nó là cơ chế cốt lõi quan trọng nhất của Transformer, tác dụng là để mô hình khi đọc một câu, tự động đánh giá "những từ nào đáng xem trọng tâm nhất".

Agentic / Agentic Workflow (Kiểu tác nhân thông minh / Quy trình làm việc Agent hóa)

Đây là cách nói rất hot gần đây, ý nghĩa là một hệ thống không còn chỉ là "hỏi một đáp một", mà mang tính tự chủ nhất định trong việc phân giải nhiệm vụ, quyết định bước tiếp theo, gọi khả năng bên ngoài. Nhiều nhà cung cấp coi nó là dấu hiệu "từ Chatbot tiến tới hệ thống có thể thực thi".

Subagents (Tác nhân con)

Một Agent lại tách ra thành nhiều Agent nhỏ chuyên trách để xử lý nhiệm vụ con.

Skills (Mô-đun khả năng tái sử dụng)

Cùng với sự bùng nổ của OpenClaw, từ này gần đây trở nên rõ ràng phổ biến, đây là đơn vị khả năng/hướng dẫn vận hành có thể cài đặt, tái sử dụng, kết hợp cho AI Agent, nhưng cũng đặc biệt nhắc nhở có rủi ro lạm dụng công cụ và lộ dữ liệu.

Hallucination (Ảo giác máy móc)

Ý nghĩa là mô hình nói sai một cách nghiêm túc, "cảm nhận được các mô hình không tồn tại" từ đó tạo ra đầu ra sai lầm hoặc vô lý, đây là đầu ra quá tự tin của mô hình trông có vẻ hợp lý nhưng thực chất là sai.

Latency (Độ trễ)

Thời gian mô hình mất từ khi nhận yêu cầu đến khi xuất kết quả, thuộc một trong những thuật ngữ kỹ thuật phổ biến nhất, cứ nói đến triển khai và sản phẩm hóa là sẽ xuất hiện thường xuyên.

Guardrails (Lan can bảo vệ)

Dùng để giới hạn mô hình/Agent có thể làm gì, khi nào dừng, nội dung gì không được xuất ra.

Vibe Coding (Lập trình theo cảm giác)

Từ này cũng là thuật ngữ AI hot nhất hiện nay, ý nghĩa là người dùng trực tiếp diễn đạt nhu cầu thông qua đối thoại, AI viết mã code, còn người dùng không cần hiểu cụ thể cách viết code.

Parameters (Tham số)

Quy mô số bên trong mô hình dùng để lưu trữ khả năng và kiến thức, thường được dùng để đo lường một cách thô thiển quy mô mô hình, "trăm tỷ tham số", "nghìn tỷ tham số" đều là cách nói hù dọa phổ biến nhất trong giới AI.

Reasoning Model (Mô hình suy luận mạnh)

Nó thường chỉ các mô hình giỏi hơn trong việc suy luận nhiều bước, lập kế hoạch, xác minh, thực thi nhiệm vụ phức tạp.

MCP (Giao thức ngữ cảnh mô hình)

Đây là thuật ngữ mới rất hot gần một năm nay, tác dụng tương tự như thiết lập giao diện chung giữa mô hình và công cụ/nguồn dữ liệu bên ngoài.

Fine-tuning / Tuning (Tinh chỉnh)

Là tiếp tục huấn luyện trên mô hình cơ sở, để nó thích ứng hơn với nhiệm vụ, phong cách hoặc lĩnh vực cụ thể. Bảng thuật ngữ của Google trực tiếp coi tuning và fine-tuning là các khái niệm liên quan.

Distillation (Chưng cất)

Nén khả năng của mô hình lớn càng nhiều càng tốt cho mô hình nhỏ, giống như để "giáo viên" dạy cho "học sinh".

RAG (Tạo sinh tăng cường truy xuất)

Điều này gần như đã trở thành cấu hình cơ bản của AI doanh nghiệp. Microsoft định nghĩa nó là mô hình "tìm kiếm + LLM", sử dụng dữ liệu bên ngoài để làm grounding cho câu trả lời, giải quyết vấn đề dữ liệu huấn luyện mô hình lỗi thời, không hiểu biết cơ sở kiến thức riêng tư. Mục đích là xây dựng câu trả lời dựa trên tài liệu thực tế và kiến thức riêng tư, thay vì chỉ dựa vào việc mô hình tự nhớ lại.

Grounding (Căn chỉnh sự thật)

Thường xuất hiện cùng với RAG, ý nghĩa là để câu trả lời của mô hình được xây dựng dựa trên các căn cứ bên ngoài như tài liệu, cơ sở dữ liệu, trang web, v.v., thay vì chỉ dựa vào trí nhớ tham số để "tự do phát huy". Microsoft trong tài liệu về RAG đã xác định rõ grounding là giá trị cốt lõi.

Embedding (Nhúng vector / Vector ngữ nghĩa)

Là mã hóa nội dung như văn bản, hình ảnh, âm thanh, v.v. thành vector số chiều cao, để tính toán độ tương đồng ngữ nghĩa.

Benchmark (Kiểm tra chuẩn)

Cách đánh giá sử dụng một bộ tiêu chuẩn thống nhất để kiểm tra khả năng của mô hình, cũng là ngôn ngữ bảng xếp hạng mà các mô hình của các hãng thích dùng nhất để "chứng minh mình mạnh".