L2 중급

LLM 안내서

대규모 언어모델의 원리와 활용을 개념부터.

8챕터

1부(部)

77분총 분량

챕터

011부 · 큰 그림 022부 · 언어를 숫자로 033부 · 어텐션과 트랜스포머 044부 · 학습: 모델은 어떻게 만들어지는가 055부 · 추론: 모델은 어떻게 답을 만드는가 066부 · 한계와 그 이유 077부 · 원리에서 실전으로 (시리즈 다리) 08부록

개요

챗봇이 답을 만들어내는 진짜 원리를, 수식 없이 그림과 비유로 풀어내는 안내서입니다.

이 안내서는 ChatGPT·Claude·Gemini 같은 대규모 언어 모델(LLM, Large Language Model) 이 글자 그대로 어떻게 답을 만들어내는지를 설명합니다. "AI에게 물어봤다"는 말 뒤에서 실제로 무슨 일이 벌어지는지, 그 메커니즘을 비유와 그림으로 따라갑니다.

코딩을 몰라도, 수학을 잊었어도 괜찮습니다. 모든 핵심은 비유로 먼저 설명하고, 더 깊이 알고 싶은 분을 위한 내용은 🔬 콜아웃으로 따로 모아두었습니다. 콜아웃을 건너뛰어도 본문만으로 완결됩니다.

전체 그림 한눈에 보기

모든 LLM은 결국 아래 한 줄짜리 흐름을 한 토큰씩, 수없이 반복합니다.

flowchart LR
    A["입력 텍스트<br/>(당신의 질문)"] --> B["토큰<br/>(숫자 조각으로 쪼갬)"]
    B --> C["임베딩<br/>(의미를 가진 좌표로)"]
    C --> D["모델 내부<br/>(어텐션·트랜스포머 층)"]
    D --> E["다음 토큰 확률 분포<br/>(어떤 단어가 올까?)"]
    E --> F["토큰 1개 선택<br/>(샘플링)"]
    F --> G["출력에 이어 붙임"]
    G -->|"방금 만든 토큰을<br/>다시 입력에 더해 반복"| B

    classDef input fill:#fff3b0,stroke:#e0a800,color:#000
    classDef inside fill:#a8e6e2,stroke:#2ba89e,color:#000
    classDef output fill:#b9f6ca,stroke:#2e9e5b,color:#000
    class A,B input
    class C,D inside
    class E,F,G output

이 한 장의 그림이 안내서 전체의 뼈대입니다. 각 부에서 이 흐름의 한 칸씩을 자세히 들여다봅니다.

부별 구성

부	제목	다루는 것	핵심 질문
1부	큰 그림	LLM이 무엇이고 무엇이 아닌가	"다음 단어 맞히기"가 어떻게 대화가 되는가?
2부	언어를 숫자로	토큰화와 임베딩	모델은 글자를 어떻게 '보는가'?
3부	어텐션과 트랜스포머	맥락 처리의 심장	모델은 어떻게 문맥을 이해하는 것처럼 보이는가?
4부	학습	모델이 만들어지는 과정	지식은 어디에 담기는가?
5부	추론(생성)	답을 만드는 과정	왜 같은 질문에 다른 답이 나오는가?
6부	한계와 그 이유	환각·편향·약점	왜 자신 있게 틀리는가?
7부	원리에서 실전으로	프롬프트·RAG·도구·에이전트	원리가 실전 기법을 어떻게 설명하는가?
부록	용어집·대조표·더 깊이	참고 자료	—

이 안내서를 읽는 법

처음부터 순서대로 읽는 것을 권합니다. 각 부는 앞부분의 개념 위에 쌓입니다.
🔬 더 깊이 콜아웃은 선택입니다. 건너뛰어도 흐름이 끊기지 않습니다.
흔한 오해 깨기 박스는 "흔히 ~라고 생각하지만, 실제로는 ~"의 형태로, 잘못 알려진 통념을 바로잡습니다.
다이어그램은 단순화입니다. 실제 모델은 훨씬 복잡하며, 그림은 직관을 위한 지도일 뿐입니다.

이 안내서가 다루지 않는 것

수학적 유도와 코드: 손실 함수, 역전파, 행렬 연산의 수식은 다루지 않습니다(🔬에서 개념만 언급).
특정 모델의 내부 스펙: "GPT-5의 파라미터 수" 같은 제품별 수치는 빠르게 바뀌고 공개되지 않는 경우가 많아 다루지 않습니다.
직접 모델을 만들거나 파인튜닝하는 실습: 이 안내서는 이해를 목표로 하며, 구현 튜토리얼이 아닙니다.
AI의 의식·지각 여부에 대한 단정: 활발한 논쟁 영역이며, 한쪽으로 결론짓지 않고 쟁점을 소개합니다.

시리즈 내 위치

이 안내서는 "원리 편"입니다. 왜 LLM이 그렇게 작동하는지를 다룹니다. 같은 원리를 바탕으로 한 후속 편(프롬프트 엔지니어링 실전, RAG·검색 결합, 에이전트 설계 등)은 7부에서 연결됩니다. 원리를 먼저 잡아두면 실전 기법이 "왜 통하는지"가 저절로 보입니다.

최종 갱신 시점의 사실관계는 웹 검색으로 확인했습니다. 다만 활발히 연구 중인 주제(이해·추론·의식 여부, 차세대 아키텍처 등)는 정설이 아니라 논쟁 중임을 본문에서 밝혔습니다.