데이터 마이닝: Difference between revisions

From IT Wiki
No edit summary
No edit summary
 
(18 intermediate revisions by 6 users not shown)
Line 1: Line 1:
[[분류:데이터베이스]]
[[분류:데이터 과학]]
 
;Data Mining
;Data Mining
;많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정
== 일반적 절차 ==
* 데이터 추출(Data Selection)
* → 데이터 정제(Cleaning)
* → 데이터 변형(Tansformation)
* → 분석(Analysis)
* → 해석(Interpretation)
* → 보고서 작성(Reporting)
==주요 기술 분류==
{| class="wikitable"
!학습 구분
!기법
!세부 기법
|-
| rowspan="2" |지도학습
|분류(Classification)
|
*판별분석
*[[로지스틱 회귀분석]]
*최근접이웃기법
*[[의사결정 나무]]
*나이브베이즈분류
*[[인공 신경망]]
*[[서포트 벡터 머신]]
|-
|예측(Prediction)
|
*[[회귀 분석]]
*[[K-최근접 이웃]]
*[[인공 신경망]]
*평활법
|-
| rowspan="3" |비지도학습
|[[군집화|군집화(Clustering)]]
|
*계층적 군집화
*[[K-평균 군집화]]
*유한혼합모형
*이중군집법
|-
|연관 규칙(Association Rule)
|
*장바구니 분석
*서열분석
*트랜잭션데이터 분석
|-
|가중치 결정
|
*신경망
|-
||비정형분석
| colspan="2" |
*[[텍스트 마이닝]]
*[[오피니언 마이닝]]
*[[리얼리티 마이닝]]
*[[소셜 네트워크 마이닝]]
|}
==같이 보기==
*[[머신 러닝|기계 학습]]
*[[딥 러닝|신경망 학습]]
*[[Apriori 알고리즘]]


== 기법 ==
== 참고 문헌 ==
* '''연관 법칙(Association Rule)'''
** 연관성이 있는 데이터 조합을 찾아 패턴을 발견
** 제품간 관계를 찾아내는 장바구니 분석에 주로 사용
* '''[[연속성 패턴|연속성 패턴 마이닝(Sequential Pattern Mining)]]'''
** 시계열 분석이라고도 함
** 시간의 경과에 따른 패턴 정의
* '''[[분류|분류(Classification)]]'''
** 특정 범주에 따라 대상을 분류
** ex) 영등포에 사는 20대 전문직의 속성은?
* '''[[군집화|군집화(Clustering)]]'''
** 유사한 특성을 지닌 데이터 그룹을 구분


== 주요 기술 ==
* [[Www.ktword.co.kr/abbr view.php?m temp1=932|정보통신기술용어해설]]
* 의사결정 나무
* 기계 학습
* 신경망 학습
* Apriori 알고리즘

Latest revision as of 09:32, 30 March 2021


Data Mining
많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정

일반적 절차[edit | edit source]

  • 데이터 추출(Data Selection)
  • → 데이터 정제(Cleaning)
  • → 데이터 변형(Tansformation)
  • → 분석(Analysis)
  • → 해석(Interpretation)
  • → 보고서 작성(Reporting)

주요 기술 분류[edit | edit source]

학습 구분 기법 세부 기법
지도학습 분류(Classification)
예측(Prediction)
비지도학습 군집화(Clustering)
연관 규칙(Association Rule)
  • 장바구니 분석
  • 서열분석
  • 트랜잭션데이터 분석
가중치 결정
  • 신경망
비정형분석

같이 보기[edit | edit source]

참고 문헌[edit | edit source]