부록 E. 용어집

본문에 등장한 용어를 가나다·알파벳 순으로 정리했습니다. 영어 원어를 병기했습니다. 각 항목 끝에 자세히 다룬 장을 표시했습니다.

ㄱ~ㅎ

검색 증강 생성 (RAG, Retrieval-Augmented Generation) — 질문과 관련된 문서를 검색해 컨텍스트에 넣고, 그것을 근거로 답하게 하는 방식. 3부 컨텍스트 원칙의 자동화. (26장)

과적합 (overfitting) — 예시에 지나치게 맞춰져 새로운 입력에 일반화하지 못하는 현상. few-shot 예시가 너무 많거나 편향될 때 발생. (7장)

과잉 거부 (over-refusal) — 전혀 문제없는 요청을 표면적 단어·주제 때문에 모델이 과도하게 거부하는 것. 맥락 제공으로 완화. (21장)

과잉생성 (over-generation) — 요청한 것보다 많이·길게 답하는 것. "~만" + 범위·분량 명시로 억제. (19장)

구분자 (delimiter) — 지시와 자료의 경계를 긋는 표시(XML 태그, 마크다운 제목, 따옴표 등). 일관성이 핵심. (11장)

구조화 출력 (structured output) — JSON 등 정해진 스키마를 따르는 출력. 제공자 기능으로 강제하면 파싱 안정적. 형식만 보장하지 내용 정확성은 별개. (8장)

다음 토큰 예측 (next-token prediction) — LLM의 작동 본질. 주어진 텍스트 다음에 올 가장 그럴듯한 토큰을 반복 생성. (2장)

단계적 사고 / 사고 사슬 (chain-of-thought, CoT) — 답 전에 중간 추론 과정을 거치게 하는 기법. 일반 모델 복잡 작업엔 유효, 추론 모델엔 불필요·역효과 가능. (9장)

도구 사용 (tool use / function calling) — 모델이 계산기·검색·DB 등 외부 도구를 스스로 호출하게 하는 것. 능력 한계 보완. (26장)

멀티턴 (multi-turn) — 여러 번 주고받는 대화. 이전 기록이 누적되어 매번 전달됨. (15, 28장)

미세 조정 (fine-tuning) — 모델 자체를 추가 학습시키는 것(프롬프팅과 별개 영역). 이 안내서는 프롬프트·컨텍스트에 집중.

부패 (context corruption) — 대화 중 오류·잘못된 전제가 컨텍스트에 남아 이후 답의 토대가 되는 것. (15장)

시스템 프롬프트 (system prompt) — 대화·여러 작업에 걸쳐 지속되는 설정(역할·원칙·톤). "딱 맞는 고도"로 설계. (27장)

압축 (compaction) — 긴 대화·자료의 핵심을 요약해 컨텍스트를 절약하는 것. 장기 작업의 핵심. (15, 17장)

에이전트 (agent) — 모델이 스스로 다음 단계를 정하며 목표를 향해 행동하는 시스템. 체이닝(사람이 흐름 설계)과 구분. (28장)

오염 (context contamination) — 한 컨텍스트에 무관한 여러 주제가 섞여 서로 간섭하는 것. 작업 격리로 예방. (15장)

역할 / 페르소나 (role / persona) — 모델에게 특정 직군·관점을 부여하는 것. 마법이 아니라 정보 압축. 없던 능력은 못 만듦. (6장)

중간 소실 (lost in the middle) — 긴 컨텍스트의 한가운데 정보가 양 끝보다 덜 활용되는 경향. (14장)

컨텍스트 (context) — 모델이 한 응답에서 보는 모든 텍스트(시스템·대화·자료·도구 결과·질문). 모델 세계의 전부. (2, 3장)

컨텍스트 엔지니어링 (context engineering) — 모델이 무엇을 보게 할지 전체를 설계하는 기술. 프롬프트 엔지니어링을 포함하는 더 넓은 개념. (3, 12~17장)

컨텍스트 윈도우 (context window) — 모델이 한 번에 볼 수 있는 텍스트의 최대 분량. 토큰 단위. 용량은 효과가 아님. (12장)

탈옥 (jailbreak) — 안전장치를 우회하려는 시도. 이 안내서의 범위가 아니며 권장하지 않음. (21장)

temperature (온도) — 출력 무작위성을 조절하는 파라미터. 낮으면 결정적, 높으면 다양. 최신 추론 모델은 기본값 유지 권장 경우 많음. (2, 22장)

토큰 (token) — 모델이 텍스트를 다루는 단위(대략 단어 일부~한 단어). 길이·비용의 단위. 한국어는 영어보다 토큰을 더 씀. (2, 12장)

퓨샷 / 원샷 / 제로샷 (few-shot / one-shot / zero-shot) — 프롬프트에 넣는 예시 개수(여러 개 / 1개 / 0개). (7장)

프롬프트 (prompt) — 좁게는 모델에 주는 이번 지시, 넓게는 입력 전체. (1, 3장)

프롬프트 엔지니어링 (prompt engineering) — 원하는 출력을 일관되게 얻도록 입력을 설계·반복 개선하는 기술. (1장)

프롬프트 주입 (prompt injection) — 데이터 속 악의적 지시를 모델이 진짜 지시로 오해해 따르게 하는 공격. 구분자만으로는 못 막음. (32장)

프롬프트 체이닝 (prompt chaining) — 작업을 단계로 쪼개 한 단계의 출력을 다음 입력으로 넘기는 것. "한 단계 한 책임". (24장)

환각 (hallucination) — 모델이 사실 아닌 내용을 그럴듯하고 자신 있게 만드는 것. "그럴듯함을 잇는다"는 본질의 부작용. 0이 되지 않음. (18장)

attention 예산 (attention budget) — 모델이 컨텍스트에 기울일 수 있는 주의의 유한한 총량. 길수록 묽어짐. (2, 4, 12장)

LLM-as-judge — 한 모델의 출력을 다른 모델로 채점하는 평가 방식. 편리하나 채점 모델 편향 주의. (23, 25장)

prefill (출력 prefill / leading words) — 답의 시작 부분을 직접 깔아주어 형식을 이어받게 하는 기법. (8장)

목차로 · 다음 부록 → F. 추가 학습 링크