랜덤 포레스트 편집하기
IT위키
편집을 취소할 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 게시해주세요.
최신판 | 당신의 편집 | ||
10번째 줄: | 10번째 줄: | ||
* '''[[배깅|배깅(Bagging)]]''': 같은 알고리즘으로 여러 개의 분류기를 만들어서 결합하는 앙상블 학습 기법 | * '''[[배깅|배깅(Bagging)]]''': 같은 알고리즘으로 여러 개의 분류기를 만들어서 결합하는 앙상블 학습 기법 | ||
== 의사결정트리의 한계 == | == 의사결정트리의 한계 === | ||
* 학습 데이터에 따라 생성되는 결정 트리가 크게 달라져 일반화가 어려운 [[과적합]] 문제 발생 | * 학습 데이터에 따라 생성되는 결정 트리가 크게 달라져 일반화가 어려운 [[과적합]] 문제 발생 | ||
* 계층적 접근방식으로, 중간에 에러 발생 시 하위 계층으로 에러 전파 | * 계층적 접근방식으로, 중간에 에러 발생 시 하위 계층으로 에러 전파 | ||
21번째 줄: | 21번째 줄: | ||
== 랜덤 포레스트 주요 기법 == | == 랜덤 포레스트 주요 기법 == | ||
[[파일:랜덤 포레스트 시각화.png]] | |||
[[파일:랜덤 포레스트 과정.gif]] | |||
=== 배깅을 통한 포레스트 구성 === | === 배깅을 통한 포레스트 구성 === | ||
;부트스트랩(bootstrap)을 통해 조금씩 다른 훈련 데이터에 대해 훈련된 기초 분류기(base learner)들을 결합(aggregating)시키는 방법 | |||
=== 랜덤 노드 최적화 === | === 랜덤 노드 최적화 === | ||
* 분석에 사용되는 변수를 랜덤하게 추출 | * 분석에 사용되는 변수를 랜덤하게 추출 | ||
* 훈련 단계에서 훈련의 목적 함수를 최대로 만드는 매개변수 최적값 도출 | * 훈련 단계에서 훈련의 목적 함수를 최대로 만드는 매개변수 최적값 도출 |