랜덤 포레스트: 두 판 사이의 차이

2020년 1월 8일 (수) 01:43 판

Random Forest
여러 개의 결정 트리들을 임의적으로 학습하는 방식의 앙상블 방법으로서, 여러가지 학습기들을 생성한 후 이를 선형 결합하여 최종 학습기를 만드는 방법

부트스트랩(bootstrap)을 통해 조금씩 다른 훈련 데이터에 대해 훈련된 기초 분류기(base learner)들을 결합(aggregating)시키는 방법

@@ 10번째 줄: / 10번째 줄: @@
 * '''[[배깅|배깅(Bagging)]]''': 같은 알고리즘으로 여러 개의 분류기를 만들어서 결합하는 앙상블 학습 기법
-== 의사결정트리의 한계 ===
+== 의사결정트리의 한계 ==
 * 학습 데이터에 따라 생성되는 결정 트리가 크게 달라져 일반화가 어려운 [[과적합]] 문제 발생
 * 계층적 접근방식으로, 중간에 에러 발생 시 하위 계층으로 에러 전파
@@ 21번째 줄: / 21번째 줄: @@
 == 랜덤 포레스트 주요 기법 ==
+=== 배깅을 통한 포레스트 구성 ===
 [[파일:랜덤 포레스트 시각화.png]]
+* 부트스트랩(bootstrap)을 통해 조금씩 다른 훈련 데이터에 대해 훈련된 기초 분류기(base learner)들을 결합(aggregating)시키는 방법
+=== 랜덤 노드 최적화 ===
 [[파일:랜덤 포레스트 과정.gif]]
-=== 배깅을 통한 포레스트 구성 ===
-;부트스트랩(bootstrap)을 통해 조금씩 다른 훈련 데이터에 대해 훈련된 기초 분류기(base learner)들을 결합(aggregating)시키는 방법
-=== 랜덤 노드 최적화 ===
 * 분석에 사용되는 변수를 랜덤하게 추출
 * 훈련 단계에서 훈련의 목적 함수를 최대로 만드는 매개변수 최적값 도출