데이터 과학

IT위키
Data Science

데이터 과학의 정의[편집 | 원본 편집]

새로운 학문이라는 주장[편집 | 원본 편집]

  • 전통적인 통계학에서 IT기술 및 AI 모델을 접목하여, 요소간 연관성을 찾고 미래를 예측하는 인사이트를 얻는 학문 분야
  • 표본 조사를 통한 모집단 추정 위주의 기존 학문과 달리
    • 대규모 정형/비정형 데이터 전체를 대상으로 한다는 측면에서 대상과, 접근법의 차이가 있고
    • 모집단을 추정하는 것 이상으로, 요소 간 연관성을 도출하여 분류하거나, 상관관계를 통해 예측을 수행한다는 측면에서 목적성과 기능성의 차이

기존 학문이라는 주장[편집 | 원본 편집]

  • 코스마라는 통계학자는 데이터 과학이 통계학에서 이름만 바꾼 것이라 주장
    • 제대로된 통계학과라면 데이터 과학의 모든것을 배우고 있을 것

데이터 과학의 구성[편집 | 원본 편집]

구성 학문 설명
통계학 전통적인 수학적, 통계적 분석 기법
데이터 변환 데이터 프로파일링, 전처리(클렌징, 정제)
시각화 BI 도구, 라이브러리 이용한 그래프화 등