스파크 DataFrame: 두 판 사이의 차이

IT 위키
(새 문서: * 상위 문서: 스파크, 데이터프레임 '''Spark DataFrame''' 스파크에서 정형 데이터처리를 위해 사용되는 데이터셋 객체 * R, 파이썬 Pandas...)
 
(아파치 스파크 데이터프레임 문서로 넘겨주기)
태그: 새 넘겨주기 시각 편집
 
1번째 줄: 1번째 줄:
* 상위 문서: [[스파크]], [[데이터프레임]]
#넘겨주기 [[아파치 스파크 데이터프레임]]
 
'''Spark DataFrame'''
 
스파크에서 정형 데이터처리를 위해 사용되는 데이터셋 객체
 
* R, 파이썬 Pandas 등 유사한 개념을 제공하는 기존 언어들에 영향을 받아 스파크 버전 1.3부터 지원
* RDD를 기반으로 동작하며 Spark SQL 사용에 최적화 됨
 
== 생성 방법 ==
 
* 기존 RDD를 DataFrame으로 변환
* 외부 데이터에서 로드하여 DataFrame 생성
* SQL 쿼리 실행결과로 DataFrame 생성
 
[[분류:데이터 과학]]

2025년 3월 31일 (월) 08:44 기준 최신판