Deep Learning

STEPWISE feature selection

Kimhj 2023. 9. 14. 09:12
  • 머신러닝 모델에서 사용할 변수를 선택하는 방법으로, 특징 중요도에 따라 변수를 추가하거나 제거하면서 반복 수행하여 최종 변수 선택
  • 방법
    • Forward Selection : 빈 모델로 시작해서 가장 중요한 변수를 하나씩 추가하면서 성능 측정
    • Backward Selection : 모든 변수를 사용한 모델로 시작해서 중요도가 가장 낮은 변수를 제거하면서 성능 측정
    • Bidirectional : Forward 와 Backward를 결합한 방식으로, 중요한 변수를 추가하면서 동시에 덜 중요한 변수를 제거하면서 성능을 측정
  • 평가기준 : P-value (보통 0.05나 0.01 사용)
  • 장점
    • 불필요한 변수 제거는 모델을 간소화 하고 복잡도를 줄임
    • 계산비용 줄어듬
    • 과적합 방지
  • 단점
    • 모든 경우의 수를 고려하지 못하므로, 최적조합을 찾지 못할 수 있음.
    • 특징간 상호작용이 고려되지 않을 수 있음.
    • 데이터에 따라 불안정할 수 있음.

'Deep Learning' 카테고리의 다른 글

Optimizer 종류  (0) 2023.09.17
딥러닝 모델종류  (0) 2023.09.14
Learning Curve (Learning Rate 조정)  (0) 2023.08.25
Local Minimum  (0) 2023.08.25
Pytorch 기본  (0) 2023.08.23