분류함수를 의사결정 규칙으로 이뤄진 나무 모양으로 그리는 방법 1. 장점과 단점 누구에게나 설명하기 용이하다, 계산이 복잡하지 않다. 대용량 데이터에서도 빠르게 만들수 있다. 비정상 잡음 데이터에 대해서도 민감함이 없이 분류할 수 있다. 분류의 정확도가 높다 과대적합이 발생할 가능성이 높다. 분류 경계선 부근의 자료값에 대해서 오차가 크다. 설명변수 간의 중요도를 판단하기 쉽지 않다. 2. 분석과정 성장단계: 최적의 분리규칙(splitting rule)을 찾아서 나무를 성장시키는 과정으로 적절한 정지규칙을 만족하면 중단 가지치기 단계: 불필요한 가지를 제거 타당성 평가 단계: 이익도표나 위험도표를 통해 의사결정나무를 평가 해석 및 예측 단계 3. 분리기준 카이제곱 통계량 p값이 작아지는 방향으로 자식 마..