경고: 로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다. 로그인하거나 계정을 생성하면 편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
편집을 취소할 수 있습니다.
이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 게시해주세요.
최신판 |
당신의 편집 |
17번째 줄: |
17번째 줄: |
| ** 협의적으로는 아래서 설명하는 특성 추출을 차원 축소와 동일한 개념으로 이해 | | ** 협의적으로는 아래서 설명하는 특성 추출을 차원 축소와 동일한 개념으로 이해 |
| ** 광의적으로는 아래서 설명하는 두가지 기법을 아우르는 상위 개념 | | ** 광의적으로는 아래서 설명하는 두가지 기법을 아우르는 상위 개념 |
| ** '''특성 선정(Feature Selection)'''
| | * '''특성 선정(Feature Selection)''' |
| *** 특성 랭킹(Feature Ranking) 또는 특성 중요도(Feature Importance)에 따라 선정
| | ** 특성 랭킹(Feature Ranking) 또는 특성 중요도(Feature Importance)에 따라 선정 |
| *** 분석가의 사전 배경 지식을 이용하거나, 랜덤 선정 및 성능 측정을 반복하는 방법 사용
| | ** 분석가의 사전 배경 지식을 이용하거나, 랜덤 선정 및 성능 측정을 반복하는 방법 사용 |
| ** '''특성 추출(Feature Extraction)'''
| | * '''특성 추출(Feature Extraction)''' |
| *** 특성을 단순히 선택하는 것이 아니라 특성들의 조합으로 새로운 특성을 생성
| | ** 특성을 단순히 선택하는 것이 아니라 특성들의 조합으로 새로운 특성을 생성 |
| *** [[PCA]]는 특성 추출 기법에 속함
| | ** [[PCA]]는 특성 추출 기법에 속함 |
| * '''스케일링(Scaling)'''
| |
| ** 변수의 분포가 편향되어 있을 경우, 변수 간의 관계가 잘 드러나지 않는 경우 범위 변환
| |
| ** 전체 값에 로그나 제곱루트 적용하는 방법 등
| |
| * '''변형(Transform)'''
| |
| ** 기존 존재하는 변수의 성질을 이용해 다른 변수를 만드는 방법
| |
| ** 날짜별 판매 데이터에 주말 여부를 추가하는 등, 분석가에 경험에 따라 추가 또는 변형
| |
| * '''비닝(Binning)'''
| |
| ** 연속형 변수를 범주형 변수로 변환
| |
| ** 33살, 47살 -> 30대, 40대
| |
| * '''더미(Dummy)'''
| |
| ** 범주형 변수를 연속형 변수로 변환 가능
| |
| ** 기존 특성이나 특성의 조합을 규칙에 따라 수치화하여 Dummy Data로 추가
| |