챕터
011부 · 큰 그림
022부 · 언어를 숫자로
033부 · 어텐션과 트랜스포머
044부 · 학습: 모델은 어떻게 만들어지는가
055부 · 추론: 모델은 어떻게 답을 만드는가
066부 · 한계와 그 이유
077부 · 원리에서 실전으로 (시리즈 다리)
08부록
개요
챗봇이 답을 만들어내는 진짜 원리를, 수식 없이 그림과 비유로 풀어내는 안내서입니다.
이 안내서는 ChatGPT·Claude·Gemini 같은 대규모 언어 모델(LLM, Large Language Model) 이 글자 그대로 어떻게 답을 만들어내는지를 설명합니다. "AI에게 물어봤다"는 말 뒤에서 실제로 무슨 일이 벌어지는지, 그 메커니즘을 비유와 그림으로 따라갑니다.
코딩을 몰라도, 수학을 잊었어도 괜찮습니다. 모든 핵심은 비유로 먼저 설명하고, 더 깊이 알고 싶은 분을 위한 내용은 🔬 콜아웃으로 따로 모아두었습니다. 콜아웃을 건너뛰어도 본문만으로 완결됩니다.
전체 그림 한눈에 보기
모든 LLM은 결국 아래 한 줄짜리 흐름을 한 토큰씩, 수없이 반복합니다.
flowchart LR
A["입력 텍스트<br/>(당신의 질문)"] --> B["토큰<br/>(숫자 조각으로 쪼갬)"]
B --> C["임베딩<br/>(의미를 가진 좌표로)"]
C --> D["모델 내부<br/>(어텐션·트랜스포머 층)"]
D --> E["다음 토큰 확률 분포<br/>(어떤 단어가 올까?)"]
E --> F["토큰 1개 선택<br/>(샘플링)"]
F --> G["출력에 이어 붙임"]
G -->|"방금 만든 토큰을<br/>다시 입력에 더해 반복"| B
classDef input fill:#fff3b0,stroke:#e0a800,color:#000
classDef inside fill:#a8e6e2,stroke:#2ba89e,color:#000
classDef output fill:#b9f6ca,stroke:#2e9e5b,color:#000
class A,B input
class C,D inside
class E,F,G output
이 한 장의 그림이 안내서 전체의 뼈대입니다. 각 부에서 이 흐름의 한 칸씩을 자세히 들여다봅니다.
부별 구성
| 부 | 제목 | 다루는 것 | 핵심 질문 |
|---|---|---|---|
| 1부 | 큰 그림 | LLM이 무엇이고 무엇이 아닌가 | "다음 단어 맞히기"가 어떻게 대화가 되는가? |
| 2부 | 언어를 숫자로 | 토큰화와 임베딩 | 모델은 글자를 어떻게 '보는가'? |
| 3부 | 어텐션과 트랜스포머 | 맥락 처리의 심장 | 모델은 어떻게 문맥을 이해하는 것처럼 보이는가? |
| 4부 | 학습 | 모델이 만들어지는 과정 | 지식은 어디에 담기는가? |
| 5부 | 추론(생성) | 답을 만드는 과정 | 왜 같은 질문에 다른 답이 나오는가? |
| 6부 | 한계와 그 이유 | 환각·편향·약점 | 왜 자신 있게 틀리는가? |
| 7부 | 원리에서 실전으로 | 프롬프트·RAG·도구·에이전트 | 원리가 실전 기법을 어떻게 설명하는가? |
| 부록 | 용어집·대조표·더 깊이 | 참고 자료 | — |
이 안내서를 읽는 법
- 처음부터 순서대로 읽는 것을 권합니다. 각 부는 앞부분의 개념 위에 쌓입니다.
- 🔬 더 깊이 콜아웃은 선택입니다. 건너뛰어도 흐름이 끊기지 않습니다.
- 흔한 오해 깨기 박스는 "흔히 ~라고 생각하지만, 실제로는 ~"의 형태로, 잘못 알려진 통념을 바로잡습니다.
- 다이어그램은 단순화입니다. 실제 모델은 훨씬 복잡하며, 그림은 직관을 위한 지도일 뿐입니다.
이 안내서가 다루지 않는 것
- 수학적 유도와 코드: 손실 함수, 역전파, 행렬 연산의 수식은 다루지 않습니다(🔬에서 개념만 언급).
- 특정 모델의 내부 스펙: "GPT-5의 파라미터 수" 같은 제품별 수치는 빠르게 바뀌고 공개되지 않는 경우가 많아 다루지 않습니다.
- 직접 모델을 만들거나 파인튜닝하는 실습: 이 안내서는 이해를 목표로 하며, 구현 튜토리얼이 아닙니다.
- AI의 의식·지각 여부에 대한 단정: 활발한 논쟁 영역이며, 한쪽으로 결론짓지 않고 쟁점을 소개합니다.
시리즈 내 위치
이 안내서는 "원리 편"입니다. 왜 LLM이 그렇게 작동하는지를 다룹니다. 같은 원리를 바탕으로 한 후속 편(프롬프트 엔지니어링 실전, RAG·검색 결합, 에이전트 설계 등)은 7부에서 연결됩니다. 원리를 먼저 잡아두면 실전 기법이 "왜 통하는지"가 저절로 보입니다.
최종 갱신 시점의 사실관계는 웹 검색으로 확인했습니다. 다만 활발히 연구 중인 주제(이해·추론·의식 여부, 차세대 아키텍처 등)는 정설이 아니라 논쟁 중임을 본문에서 밝혔습니다.