데이터 마이닝: 두 판 사이의 차이

IT위키
편집 요약 없음
편집 요약 없음
 
(사용자 6명의 중간 판 19개는 보이지 않습니다)
1번째 줄: 1번째 줄:
[[분류:데이터베이스]]
[[분류:데이터 과학]]
 
;Data Mining
;Data Mining
;많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정
== 일반적 절차 ==
* 데이터 추출(Data Selection)
* → 데이터 정제(Cleaning)
* → 데이터 변형(Tansformation)
* → 분석(Analysis)
* → 해석(Interpretation)
* → 보고서 작성(Reporting)
==주요 기술 분류==
{| class="wikitable"
!학습 구분
!기법
!세부 기법
|-
| rowspan="2" |지도학습
|분류(Classification)
|
*판별분석
*[[로지스틱 회귀분석]]
*최근접이웃기법
*[[의사결정 나무]]
*나이브베이즈분류
*[[인공 신경망]]
*[[서포트 벡터 머신]]
|-
|예측(Prediction)
|
*[[회귀 분석]]
*[[K-최근접 이웃]]
*[[인공 신경망]]
*평활법
|-
| rowspan="3" |비지도학습
|[[군집화|군집화(Clustering)]]
|
*계층적 군집화
*[[K-평균 군집화]]
*유한혼합모형
*이중군집법
|-
|연관 규칙(Association Rule)
|
*장바구니 분석
*서열분석
*트랜잭션데이터 분석
|-
|가중치 결정
|
*신경망
|-
||비정형분석
| colspan="2" |
*[[텍스트 마이닝]]
*[[오피니언 마이닝]]
*[[리얼리티 마이닝]]
*[[소셜 네트워크 마이닝]]
|}
==같이 보기==
*[[머신 러닝|기계 학습]]
*[[딥 러닝|신경망 학습]]
*[[Apriori 알고리즘]]


== 기법 ==
== 참고 문헌 ==
* 연관 탐사(Association)
** 연관성이 있는 데이터 조합을 찾아 패턴을 발견
** 제품간 관계를 찾아내는 장바구니 분석에 주로 사용
* 연속성 탐사(Sequence)
** 시계열 분석이라고도 함
** 시간의 경과에 따른 패턴 정의
* 분류 탐사(Classification)
** 특정 범주에 따라 대상을 분류
** ex) 영등포에 사는 20대 전문직의 속성은?
* 군집 탐사(Clustering)
** 유사한 특성을 지닌 데이터 그룹을 구분


== 주요 기술 ==
* [[Www.ktword.co.kr/abbr view.php?m temp1=932|정보통신기술용어해설]]
* 의사결정 나무
* 기계 학습
* 신경망 학습
* Apriori 알고리즘

2021년 3월 30일 (화) 09:32 기준 최신판


Data Mining
많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정

일반적 절차[편집 | 원본 편집]

  • 데이터 추출(Data Selection)
  • → 데이터 정제(Cleaning)
  • → 데이터 변형(Tansformation)
  • → 분석(Analysis)
  • → 해석(Interpretation)
  • → 보고서 작성(Reporting)

주요 기술 분류[편집 | 원본 편집]

학습 구분 기법 세부 기법
지도학습 분류(Classification)
예측(Prediction)
비지도학습 군집화(Clustering)
연관 규칙(Association Rule)
  • 장바구니 분석
  • 서열분석
  • 트랜잭션데이터 분석
가중치 결정
  • 신경망
비정형분석

같이 보기[편집 | 원본 편집]

참고 문헌[편집 | 원본 편집]