AI 블랙박스 사전 (2026년 3월판), 추천 저장
- 핵심 관점: 본문은 블록체인 및 암호화폐 분야 종사자들을 위해 AI 분야의 기초 및 심화 어휘 가이드를 제공하여, 점점 더 융합되는 'AI+Web3' 트렌드에 대응할 수 있도록 AI 업계의 핵심 개념을 빠르게 이해하는 데 도움을 주는 것을 목표로 합니다.
- 핵심 요소:
- LLM과 SLM: 대규모 언어 모델(LLM)은 다양한 유형의 콘텐츠를 처리하는 딥러닝 모델이며, 소규모 언어 모델(SLM)은 저비용과 현지화 배포를 강조합니다.
- AI 에이전트: 목표를 이해하고 도구를 호출하며 작업을 실행할 수 있는 지능형 시스템을 의미하며, 챗봇에서 실행 가능한 시스템으로 전환하는 핵심으로 간주됩니다.
- 토큰과 컨텍스트 창: 토큰은 AI 모델이 처리하고 과금하는 기본 단위이며, 컨텍스트 창은 모델이 한 번에 처리할 수 있는 '기억' 토큰의 총량을 결정합니다.
- 추론과 비용: 모델이 상용화된 후의 추론(Inference) 과정은 상업화 단계의 주요 비용 원천으로, 흔히 "훈련은 비싸지만, 추론은 더 비싸다"고 말합니다.
- RAG와 그라운딩: 검색 증강 생성(RAG)은 외부 데이터 소스를 결합하여 답변을 생성하며, 사실 정합(Grounding)을 달성하여 모델의 데이터 구식화와 환각 문제를 해결하는 것을 목표로 합니다.
- 도구 호출과 API: 모델이 외부 도구를 호출하는 능력(Tool Calling)은 에이전트의 핵심이며, API는 AI 애플리케이션과 제3자 서비스를 연결하는 기반 시설입니다.
- 업계 핫이슈: 에이전트 워크플로(Agentic Workflow), 분위기 코딩(Vibe Coding) 및 모델 컨텍스트 프로토콜(MCP)은 현재 AI 업계의 인기 개념과 트렌드입니다.
Original | Odaily (@OdailyChina)
Author | Golem (@web 3_golem)

지금, 암호화폐 커뮤니티 사람들이 AI를 관심 밖으로 두면 쉽게 조롱받기 쉽습니다(네, 제 친구, 왜 이 글을 클릭했는지 생각해보세요).
AI의 기본 개념을 전혀 모르고, 매 문장의 약어마다 Doubao(두바오)에게 무슨 뜻인지 물어보나요? 또 AI 오프라인 행사에서 각종 전문 용어에 대해 어리둥절하면서도, 연결이 끊기지 않은 척 연기하나요?
단기간에 AI 업계에 발을 들이는 것은 비현실적이지만, AI 업계의 고빈도 기본 어휘를 알아두는 것은 손해보는 일이 아닙니다. 운 좋게도, 다음 글은 여러분을 위해 준비된 것입니다↓ 진심으로 여러분이 숙독하고 저장하길 권합니다.
기본 어휘 (12)
LLM (대형 언어 모델)
LLM의 핵심은 방대한 데이터로 훈련되어 언어 이해와 생성에 능숙한 딥러닝 모델로, 텍스트를 처리할 수 있으며 현재는 다른 유형의 콘텐츠도 점점 더 잘 처리하고 있습니다.
이와 대조되는 것은 SLM(소형 언어 모델)로, 일반적으로 비용이 더 낮고 배포가 더 가볍고 현지화가 더 편리한 언어 모델을 강조합니다.
AI Agent (AI 에이전트)
AI Agent는 단순히 '대화할 수 있는 모델'이 아니라, 목표를 이해하고 도구를 호출하며 단계별로 작업을 실행하고 필요할 경우 계획 및 검증까지 할 수 있는 시스템을 의미합니다. Google은 에이전트를 다중 모드 입력을 기반으로 추론하고 사용자를 대신해 작업을 실행할 수 있는 소프트웨어로 정의합니다.
Multimodal (다중 모드)
해당 AI 모델은 텍스트만 읽는 것이 아니라 텍스트, 이미지, 오디오, 비디오 등 다양한 입력/출력 형태를 동시에 처리할 수 있습니다. Google은 다중 모드를 명확히 다른 유형의 콘텐츠를 처리하고 생성하는 능력으로 정의합니다.
Prompt (프롬프트)
사용자가 모델에 입력하는 지시문으로, 가장 기본적인 인간-컴퓨터 상호작용 방식입니다.
Generative AI (생성형 AI / AIGC)
AI의 단순 분류나 예측이 아닌 '생성'을 강조하며, 생성형 모델은 프롬프트에 따라 텍스트, 코드, 이미지, 밈, 비디오 등의 콘텐츠를 생성할 수 있습니다.
Token (토큰)
이는 AI 업계에서 가장 'Gas 단위'와 비슷한 개념 중 하나입니다. 모델은 '단어 수'가 아닌 토큰 단위로 콘텐츠를 이해하며, 입력/출력을 처리합니다. 과금, 컨텍스트 길이, 응답 속도는 모두 일반적으로 토큰과 밀접한 관련이 있습니다.
Context Window (컨텍스트 창 / 컨텍스트 길이)
모델이 한 번에 '볼' 수 있고 활용할 수 있는 총 토큰 양을 의미하며, 모델이 단일 처리 시 고려하거나 '기억'할 수 있는 토큰 수라고도 할 수 있습니다.
Memory (메모리)
모델이나 에이전트가 사용자 선호도, 작업 컨텍스트, 이전 상태를 유지하도록 합니다.
Training (훈련)
모델이 데이터에서 매개변수를 학습하는 과정입니다.
Inference (추론 실행)
훈련과 상대적인 개념으로, 모델이 온라인에 배포된 후 입력을 받아 출력을 생성하는 과정을 의미합니다. 업계에서는 종종 '훈련은 비싸지만, 추론은 더 비싸다'고 말하는데, 실제 상업화 단계에서는 많은 비용이 추론 과정에서 발생하기 때문입니다. 관련 훈련/추론 구분은 주류 업체들이 배포 비용을 논의할 때의 기본 프레임워크이기도 합니다.
Tool Use / Tool Calling (도구 사용 / 도구 호출)
모델이 단순히 텍스트를 출력하는 것이 아니라 검색, 코드 실행, 데이터베이스, 외부 API 등의 도구를 호출할 수 있다는 의미로, 이는 이미 에이전트의 핵심 능력 중 하나로 간주되고 있습니다.
API (인터페이스)
AI 제품, 애플리케이션, 에이전트가 제3자 서비스를 연결할 때의 기반 인프라입니다.
심화 어휘 (18)
transformer (트랜스포머 아키텍처)
AI가 컨텍스트 관계를 더 잘 이해하도록 하는 모델 아키텍처로, 오늘날 대부분의 대형 언어 모델의 기술적 토대이며, 가장 큰 특징은 전체 문장 내 각 단어와 다른 단어들의 관계를 동시에 볼 수 있다는 점입니다.
Attention (어텐션 메커니즘)
이는 트랜스포머의 가장 핵심적인 메커니즘으로, 모델이 한 문장을 읽을 때 '어떤 단어를 가장 중점적으로 봐야 하는지' 자동으로 판단하도록 하는 역할을 합니다.
Agentic / Agentic Workflow (에이전트식 / 에이전트화 워크플로우)
이는 최근 매우 뜨거운 용어로, 시스템이 더 이상 '일문일답'이 아니라 어느 정도 자율성을 가지고 작업을 분해하고 다음 단계를 결정하며 외부 능력을 호출한다는 의미입니다. 많은 업체들이 이를 '챗봇에서 실행 가능한 시스템으로의 전환'의 표지판으로 삼고 있습니다.
Subagents (하위 에이전트)
한 에이전트가 다시 여러 개의 전문적인 소형 에이전트로 분리되어 하위 작업을 처리합니다.
Skills (재사용 가능한 능력 모듈)
OpenClaw의 폭발적인 인기와 함께, 이 단어는 최근 분명히 더 흔해졌습니다. 이는 AI 에이전트를 위한 설치 가능하고 재사용 가능하며 조합 가능한 능력 단위/작업 설명서이지만, 도구 남용 및 데이터 노출 위험도 특별히 경고합니다.
Hallucination (기계 환각)
모델이 진지하게 허튼소리를 하며, '존재하지 않는 패턴을 인지'하여 잘못되거나 터무니없는 출력을 생성하는 것을 의미합니다. 이는 모델이 합리적으로 보이지만 실제로는 잘못된 지나친 자신감의 출력입니다.
Latency (지연 시간)
모델이 요청을 받아 결과를 출력하는 데 걸리는 시간으로, 가장 흔한 엔지니어링 전문 용어 중 하나이며, 실제 구현과 제품화에 대해 이야기할 때 자주 등장합니다.
Guardrails (가드레일)
모델/에이전트가 무엇을 할 수 있고, 언제 멈추며, 어떤 콘텐츠를 출력해서는 안 되는지 제한하는 데 사용됩니다.
Vibe Coding (분위기 코딩)
이 단어 역시 현재 가장 핫한 AI 전문 용어로, 사용자가 직접 대화를 통해 요구사항을 표현하고 AI가 코드를 작성하며, 사용자는 구체적으로 코드 작성 방법을 알 필요가 없다는 의미입니다.
Parameters (매개변수)
모델 내부에서 능력과 지식을 저장하는 데 사용되는 숫자 규모로, 모델 규모를 대략적으로 측정하는 데 자주 사용되며, '수백억 매개변수', '수천억 매개변수'는 AI 업계에서 가장 흔한 허풍 용어입니다.
Reasoning Model (강력한 추론 모델)
이는 일반적으로 다단계 추론, 계획, 검증, 복잡한 작업 실행에 더 능숙한 모델을 의미합니다.
MCP (모델 컨텍스트 프로토콜)
이는 최근 1년 동안 매우 뜨거운 새로운 전문 용어로, 모델과 외부 도구/데이터 소스 사이에 범용 인터페이스를 구축하는 역할을 합니다.
Fine-tuning / Tuning (미세 조정)
기본 모델에서 계속 훈련하여 특정 작업, 스타일 또는 도메인에 더 적응하도록 하는 것입니다. Google 용어집은 튜닝과 미세 조정을 관련 개념으로 직접 정의합니다.
Distillation (증류)
대형 모델의 능력을 가능한 한 소형 모델로 압축하는 것으로, '선생님'이 '학생'을 가르치는 것과 같습니다.
RAG (검색 증강 생성)
이는 거의 기업 AI의 기본 구성 요소가 되었습니다. Microsoft는 이를 '검색 + LLM' 모드로 정의하며, 외부 데이터를 사용하여 답변에 근거를 제공하고, 모델 훈련 데이터의 구식 문제와 사설 지식 기반에 대한 이해 부족 문제를 해결합니다. 목적은 모델 자체의 기억에만 의존하는 것이 아니라 실제 문서와 사설 지식에 기반하여 답변을 구축하는 것입니다.
Grounding (사실 정렬)
RAG와 함께 자주 등장하며, 모델의 답변이 모델의 매개변수 기억에만 의존한 '자유 발휘'가 아니라 문서, 데이터베이스, 웹페이지 등의 외부 근거에 기반하도록 한다는 의미입니다. Microsoft는 RAG 문서에서 사실 정렬을 핵심 가치로 명확히 정의합니다.
Embedding (벡터 임베딩 / 의미 벡터)
텍스트, 이미지, 오디오 등의 콘텐츠를 고차원 숫자 벡터로 인코딩하여 의미 유사도 계산을 가능하게 합니다.
Benchmark (벤치마크 테스트)
일련의 통일된 표준을 사용하여 모델 능력을 테스트하는 평가 방식으로, 각 업체의 모델이 '자신이 강력함을 증명'하기 위해 가장 좋아하는 순위표 언어이기도 합니다.


