지니 불순물—의사 결정 트리에서 노드를 분할하는 또 다른 기준
가장 인기있는 고전적인 기계 학습 알고리즘 중 하나로서 의사 결정 트리는 설명 가능성으로 인해 다른 것보다 훨씬 직관적입니다. 의사 결정 트리 모델을 구성하는 알고리즘을 도입했습니다.의사결정 트리 기본 사항 및 아이디 3 알고리즘
이 글에서,나는 또한 아마 가장 일반적으로 사용되는 의사 결정 트리 모델을 구축하기위한 카트라는 또 하나의 알고리즘을 소개합니다. 이 라이브러리는 그러한 문제를 표준화된 프로그래밍 인터페이스를 제공함으로써 해결합니다.
장바구니 알고리즘은 분류 및 회귀 트리의 약자입니다. 그것은 브레이 만 등에 의해 발명되었다. 1984 년.
그것은 일반적으로 매우 유사하다 씨 4.5 개에는,그러나 뒤에 오는 중요한 특성이 있습니다:
- 여러 개의 분기를 가질 수있는 일반 트리 대신 카트는 각 노드에서 두 개의 분기 만있는 이진 트리를 사용합니다.
- 장바구니는 정보 이득이 아닌 노드를 분할하는 기준으로 지니 불순물을 사용합니다.
- 장바구니는 숫자 대상 변수를 지원하므로 연속 값을 예측하는 회귀 트리가 될 수 있습니다.
이 문서에서는 분류 트리로 카트에 초점을 맞출 것이다.
지니 불순물