목차
[TIL] Day 98 — 머신러닝 핵심 개념 + 데이터 흐름 정리 (3/12)
날짜: 2026-03-12
기술 스택: Python Machine Learning scikit-learn NumPy
한 줄 요약: 머신러닝 3대 학습 방식(지도/비지도/강화) + 데이터 흐름(Train→Val→Test) + 대표 알고리즘 비교 정리
머신러닝 3가지 학습 방식
| 학습 방식 | 특징 | 대표 태스크 |
|---|---|---|
| 지도 학습 | Label 있는 데이터로 학습 | 분류, 회귀 |
| 비지도 학습 | 정답 없는 데이터에서 패턴 발견 | 군집화, 차원 축소 |
| 강화 학습 | 환경과 상호작용하며 보상 최대화 | 게임 AI, 로봇 |
데이터 흐름
원시 데이터 수집 → 전처리 → 특성 공학
↓
데이터 분할: Train / Validation / Test
↓
모델 학습 → 평가 → (미충족 시 재학습)
↓
성능 충족 시 최종 모델 배포
대표 알고리즘
| 알고리즘 | 유형 | 주요 용도 |
|---|---|---|
| 선형 회귀 | 회귀 | 연속값 예측 |
| 로지스틱 회귀 | 분류 | 확률 기반 이진 분류 |
| 결정 트리 | 분류/회귀 | 규칙 기반 분기 구조 |
| 랜덤 포레스트 | 분류/회귀 | 다수 트리 앙상블(Ensemble) → 안정성 향상 |
| K-Means | 군집화 | 데이터를 K개 군집으로 분류 |
평가 지표
- 분류: Accuracy / Precision / Recall / F1-Score
- 회귀: MSE(평균제곱오차) / MAE(평균절댓값오차)
더 알아볼 것
- Overfitting vs Underfitting — 원인과 해결 방법
- scikit-learn
train_test_split+ Cross Validation 실습 - 라벨 인코딩 —
LabelEncodervsOneHotEncoder - NumPy 배열
shape해석 — 1D/2D/3D 차원 구조 이해
'⏳ Time Log > 1. One Day (Daily · TIL)' 카테고리의 다른 글
| [TIL] Day 107 — 모의면접 (3/20) (0) | 2026.06.08 |
|---|---|
| [TIL] Day 99 — LangChain RAG + OpenAI API 활용 (3/13) (0) | 2026.06.08 |
| [TIL] Day 97 — Python 가상환경(venv) + LangChain 개발 환경 세팅 + 호텔 챗봇 실행 (3/11) (0) | 2026.06.08 |
| [TIL] Day 80 — 특강: AI 시대 개발자 취업 전략 (2/10) (0) | 2026.06.08 |