L1 입문

pandas 데이터 분석 입문

설치 없이 브라우저로 시작하는 표 데이터 분석.

20챕터
1부(部)
3시간총 분량
첫 챕터 시작 →

챕터

개요

설치 한 번 없이, 브라우저만 열면 시작하는 데이터 분석 안내서
프로그래밍이 처음이어도 괜찮습니다. 작은 예제부터 손으로 직접 실행하며, 데이터를 불러오고·정리하고·합치고·그림으로 그리는 전 과정을 차근차근 익힙니다.

이 안내서는 누구를 위한 건가요?

  • 프로그래밍이 처음이거나 Python 기초만 살짝 아는 분
  • 엑셀로 데이터를 다뤄봤지만, 코드로 데이터를 다뤄본 적은 없는 분
  • "데이터 분석을 배우고 싶은데, 도대체 어디서부터 시작해야 할지 모르겠는" 분
  • 컴퓨터에 뭔가 설치하는 것조차 부담스러운 분 — 그래서 설치가 필요 없는 Google Colab으로 시작합니다.

통계학이나 수학 지식은 필요 없습니다. 평균·합계 정도의 상식만 있으면 충분합니다.

📌 이 안내서의 약속 (핵심 원칙)

  1. 손으로 익힙니다. 모든 개념에는 복사해서 붙여넣으면 실제로 돌아가는 코드와 그 결과(표·숫자·그래프)가 함께 옵니다. 눈으로만 읽지 말고 꼭 직접 실행해 보세요.
  2. 설치 장벽이 없습니다. 첫 장에서 Google Colab(구글 코랩 — 설치 없이 브라우저에서 Python을 실행하는 무료 도구)부터 익힙니다.
  3. 모르는 용어는 그 자리에서 풀어 줍니다. 처음 나오는 약어·전문 용어는 등장하는 자리에서 한두 문장으로 설명합니다.
  4. 에러가 나도 괜찮습니다. 입문자가 자주 막히는 지점과 그 해결법을 함께 짚습니다.

🗺️ 데이터 분석의 큰 그림

데이터 분석은 보통 아래의 흐름을 따라갑니다. 이 안내서도 이 순서대로 진행됩니다.

flowchart LR
    A[원본 데이터<br/>CSV·표·텍스트] --> B[불러오기<br/>load]
    B --> C[정리하기<br/>clean]
    C --> D[변형하기<br/>transform]
    D --> E[합치기·묶기<br/>merge·group]
    E --> F[요약하기<br/>summarize]
    F --> G[시각화<br/>visualize]
    G --> H[인사이트<br/>발견!]

    classDef raw fill:#fff3bf,stroke:#f59f00,color:#000
    classDef proc fill:#c3fae8,stroke:#0ca678,color:#000
    classDef obj fill:#d0ebff,stroke:#1971c2,color:#000
    classDef out fill:#d3f9d8,stroke:#2f9e44,color:#000

    class A raw
    class B,C,D proc
    class E,F obj
    class G,H out

각 단계가 무엇인지는 본문에서 하나씩 풀어 설명하니, 지금 다 이해하지 못해도 괜찮습니다.

📚 전체 목차

0부 · 미리 준비하기 (Python & NumPy 기초)

프로그래밍이 정말 처음이라면 여기서 시작하세요. 이미 Python을 안다면 건너뛰고 1부로 가도 됩니다.
제목내용
01Python 기초 — 변수와 연산변수, 사칙연산, 출력·입력
02Python 기초 — 데이터 타입불·리스트·딕셔너리·문자열·튜플·집합
03Python 기초 — 조건문과 반복문if, for, while, 컴프리헨션
04Python 기초 — 함수함수, 람다, map, filter
05NumPy 기초배열, 모양, 수학 연산, 인덱싱

1부 · 시작하기

제목내용
06데이터 분석이란, 그리고 왜 배우는가데이터가 왜 중요한가
07Google Colab 시작하기노트북 만들기·셀 실행·파일 업로드

2부 · Pandas 시리즈 (Series)

제목내용
08시리즈란 무엇인가1차원 데이터, 인덱스
09시리즈의 속성·메서드와 다루기정렬·연산·인덱싱·슬라이싱

3부 · Pandas 데이터프레임 (DataFrame)

제목내용
10데이터프레임이란 무엇인가2차원 표, 생성, CSV 읽고 쓰기
11열 선택·추가·삭제와 요소 선택.loc, .iloc, 브로드캐스팅

4부 · 데이터 정리와 가공

제목내용
12결측치 처리와 기능 엔지니어링NaN 다루기, 새 열 만들기, 타입 변환

5부 · 합치고 묶기

제목내용
13연결·병합·결합concat, merge, join
14멀티인덱싱과 그룹화group-by, split-apply-combine

6부 · 데이터 시각화 (Matplotlib)

제목내용
15Matplotlib 기초 그래프선·산점·원형·히스토그램, 서브플롯

7부 · 데이터 시각화 (Seaborn)

제목내용
16Seaborn으로 통계 시각화산점도·카운트플롯·페어플롯·히트맵

8부 · 시계열 데이터 (날짜/시간)

제목내용
17날짜와 시간 다루기datetime, 시계열 시각화

9부 · 텍스트 데이터

제목내용
18텍스트 데이터 분석문자열 연산·불용어·토큰화·워드클라우드

부록

부록제목역할
C고유 용어집이 주제의 핵심 개념 (시리즈·데이터프레임·그룹화 등)
D기초 기술 용어 사전입문자가 모를 일반 기술 용어 (CSV·NaN·dtype 등)

🧭 이 안내서 활용법

  • 순서대로 읽으세요. 각 장은 앞 장의 내용을 딛고 올라갑니다. 다만 Python을 이미 안다면 0부는 건너뛰어도 됩니다.
  • 반드시 직접 실행하세요. 코드 블록을 Colab에 그대로 붙여넣고 실행하면 책에 적힌 것과 같은 결과가 나옵니다. 눈으로 읽는 것과 손으로 치는 것은 전혀 다릅니다.
  • 미니 챌린지를 꼭 풀어 보세요. 각 장 끝에는 직접 풀어볼 작은 과제(🛠 미니 챌린지)와 해설(✅)이 있습니다. 해설을 보기 전에 먼저 스스로 시도해 보세요.
  • 처음 보는 약어는 본문에서 풀이되며, 부록 D(기초 기술 용어 사전)에서도 찾을 수 있습니다. 핵심 개념은 부록 C(고유 용어집)에 모아 두었습니다.
  • 콜아웃 박스를 눈여겨보세요:
    • 💡 — 알아두면 편한 것
    • ⚠️ 흔한 실수 — 입문자가 자주 빠지는 함정
    • 📌 핵심 — 이것만은 기억하기
    • 🔑 새 용어 — 처음 나온 용어 정리

필요한 사전지식

거의 없습니다. 다음만 알면 됩니다.

  • 컴퓨터로 웹 브라우저를 켜고 인터넷을 쓸 수 있다
  • 평균·합계가 무엇인지 안다

Python을 한 번도 안 써봤다면 0부부터, Python 기초가 있다면 1부부터 시작하세요.

준비됐나요? 그럼 01. Python 기초 — 변수와 연산부터 시작합니다. 🚀