비지도학습 (Unsupervised Learning)
레이블이 없는 데이터에서 패턴 발견
← 메인으로 돌아가기
2.1 군집화 (Clustering)
데이터를 그룹으로 분류
유형별 분류
- 파티션 기반 (K-means, K-medoids)
- 계층적 (Hierarchical)
- 밀도 기반 (DBSCAN, OPTICS)
- 분포 기반 (Gaussian Mixture)
- 그리드 기반 (STING, CLIQUE)
실제 예시
- 고객 세분화
- 이미지 세그멘테이션
- 문서 그룹화
- 유전자 클러스터링
- 시장 세분화
2.2 차원 축소 (Dimensionality Reduction)
데이터 차원 감소
선형 방법
- PCA (주성분 분석)
- LDA (선형 판별 분석)
- Factor Analysis
- ICA (독립 성분 분석)
비선형 방법
- t-SNE
- UMAP
- Autoencoder
- Isomap
- LLE (Locally Linear Embedding)
2.3 이상치 탐지 (Anomaly Detection)
비정상적인 패턴 찾기
예시
- 사기 거래 탐지
- 시스템 장애 감지
- 품질 관리
- 네트워크 침입 탐지
- 의료 이상 징후 감지
2.4 밀도 추정 (Density Estimation)
데이터 분포 추정
방법
- Kernel Density Estimation (KDE)
- Gaussian Mixture Models (GMM)
- Hidden Markov Models (HMM)
- Parzen Window