2014년 4월 16일 수요일

데이터 마이닝 기법이 다양한 이유, 기법 선택시 고려사항

데이터 마이닝에 사용되는 예측 및 분류를 위한 다양한 방법이 존재.
각 기법이 나름대로 장단점을 가지기 때문.
어느 한 기법의 유용성 즉 기법 선택시 고려사항은 다음 것들이 있다.

  • 데이터 집합의 크기
  • 데이터에 존재하는 패턴의 유형
  • 해당 기법이 요구하는 가정을 데이터가 만족시키는지 여부
  • 데이터 잡음의 정도
  • 특수한 분석 목적 등
일반적으로 통용되는 방식은 여러가지 다양한 데이터마이닝 기법들을 적용해보고, 그 목적중에 가장 유용한 기법을 선택하는 것.

("비즈니스 인텔리전스를 위한 데이터 마이닝"에서)