목차

    ⏳ Time Log/1. One Day (Daily · TIL)

    [TIL] Day 98 — 머신러닝 핵심 개념 + 데이터 흐름 정리 (3/12)

    this.Serena 2026. 6. 8. 21:59

    [TIL] Day 98 — 머신러닝 핵심 개념 + 데이터 흐름 정리 (3/12)

    날짜: 2026-03-12
    기술 스택: Python Machine Learning scikit-learn NumPy


    한 줄 요약: 머신러닝 3대 학습 방식(지도/비지도/강화) + 데이터 흐름(Train→Val→Test) + 대표 알고리즘 비교 정리


    머신러닝 3가지 학습 방식

    학습 방식 특징 대표 태스크
    지도 학습 Label 있는 데이터로 학습 분류, 회귀
    비지도 학습 정답 없는 데이터에서 패턴 발견 군집화, 차원 축소
    강화 학습 환경과 상호작용하며 보상 최대화 게임 AI, 로봇

    데이터 흐름

    원시 데이터 수집 → 전처리 → 특성 공학
    ↓
    데이터 분할: Train / Validation / Test
    ↓
    모델 학습 → 평가 → (미충족 시 재학습)
    ↓
    성능 충족 시 최종 모델 배포

    대표 알고리즘

    알고리즘 유형 주요 용도
    선형 회귀 회귀 연속값 예측
    로지스틱 회귀 분류 확률 기반 이진 분류
    결정 트리 분류/회귀 규칙 기반 분기 구조
    랜덤 포레스트 분류/회귀 다수 트리 앙상블(Ensemble) → 안정성 향상
    K-Means 군집화 데이터를 K개 군집으로 분류

    평가 지표

    • 분류: Accuracy / Precision / Recall / F1-Score
    • 회귀: MSE(평균제곱오차) / MAE(평균절댓값오차)

    더 알아볼 것

    • Overfitting vs Underfitting — 원인과 해결 방법
    • scikit-learn train_test_split + Cross Validation 실습
    • 라벨 인코딩 — LabelEncoder vs OneHotEncoder
    • NumPy 배열 shape 해석 — 1D/2D/3D 차원 구조 이해