비지도학습 (Unsupervised Learning)

레이블이 없는 데이터에서 패턴 발견

← 메인으로 돌아가기

2.1 군집화 (Clustering)

데이터를 그룹으로 분류

유형별 분류

  • 파티션 기반 (K-means, K-medoids)
  • 계층적 (Hierarchical)
  • 밀도 기반 (DBSCAN, OPTICS)
  • 분포 기반 (Gaussian Mixture)
  • 그리드 기반 (STING, CLIQUE)

실제 예시

  • 고객 세분화
  • 이미지 세그멘테이션
  • 문서 그룹화
  • 유전자 클러스터링
  • 시장 세분화

2.2 차원 축소 (Dimensionality Reduction)

데이터 차원 감소

선형 방법

  • PCA (주성분 분석)
  • LDA (선형 판별 분석)
  • Factor Analysis
  • ICA (독립 성분 분석)

비선형 방법

  • t-SNE
  • UMAP
  • Autoencoder
  • Isomap
  • LLE (Locally Linear Embedding)

2.3 이상치 탐지 (Anomaly Detection)

비정상적인 패턴 찾기

예시

  • 사기 거래 탐지
  • 시스템 장애 감지
  • 품질 관리
  • 네트워크 침입 탐지
  • 의료 이상 징후 감지

2.4 밀도 추정 (Density Estimation)

데이터 분포 추정

방법

  • Kernel Density Estimation (KDE)
  • Gaussian Mixture Models (GMM)
  • Hidden Markov Models (HMM)
  • Parzen Window