모든 공개 기록
IT 위키
IT 위키에서 사용할 수 있는 모든 기록이 표시됩니다. 기록 종류나 사용자 이름(대소문자 구별) 또는 영향을 받는 문서(대소문자 구별)를 선택하여 범위를 좁혀서 살펴볼 수 있습니다.
(최신 | 오래됨) (다음 50개 | 이전 50개) (20 | 50 | 100 | 250 | 500) 보기- 2025년 4월 2일 (수) 08:50 빅데이터분석기사 토론 기여님이 아파치 스파크 매니지드 테이블 문서를 만들었습니다 (새 문서: 아파치 스파크 매니지드 테이블(Managed Table)은 Apache Spark SQL에서 테이블의 메타데이터와 데이터를 모두 관리하는 테이블 유형이다. 이 테이블은 Hive 메타스토어(Hive Metastore)와 연동되어, 테이블 생성, 수정, 삭제 등의 작업 시 Spark가 테이블의 데이터와 관련 메타데이터를 직접 관리한다. ==개요== 아파치 스파크 매니지드 테이블은 사용자가 CREATE TABLE 구문을 통해 테이...) 태그: 시각 편집
- 2025년 4월 2일 (수) 08:38 빅데이터분석기사 토론 기여님이 아파치 스파크 2.0 문서를 만들었습니다 (새 문서: 아파치 스파크 2.0은 대규모 분산 데이터 처리를 위한 오픈소스 프레임워크인 Apache Spark의 주요 업그레이드 버전으로, 전 버전 대비 성능 개선과 API 통합, 그리고 새로운 데이터 처리 기능을 대폭 향상시킨 버전이다. ==개요== 아파치 스파크 2.0은 이전 버전에서 분리되어 있던 SparkContext, SQLContext, HiveContext 등의 다양한 컨텍스트를 단일 진입점인 SparkSession으로 통합하...) 태그: 시각 편집
- 2025년 4월 2일 (수) 08:33 빅데이터분석기사 토론 기여님이 아파치 스파크 Spark SQL 문서를 만들었습니다 (새 문서: 아파치 스파크 Spark SQL은 Apache Spark 내에서 구조화된 데이터를 다루기 위한 핵심 모듈로, 표준 SQL 문법을 지원하며 DataFrame 및 Dataset API를 통해 데이터를 읽고, 처리하고, 저장할 수 있도록 한다. Catalyst 옵티마이저와 Tungsten 실행 엔진의 지원을 받아 고성능 분산 데이터 처리를 실현하며, Hive와의 통합을 통해 기존 빅데이터 생태계와도 원활하게 연동된다. ==개요== Spark...) 태그: 시각 편집
- 2025년 4월 2일 (수) 08:32 빅데이터분석기사 토론 기여님이 아파치 스파크 SparkSession 문서를 만들었습니다 (새 문서: SparkSession는 Apache Spark 애플리케이션의 진입점(Entry Point)으로, 스파크 SQL, 데이터프레임, 그리고 Dataset API를 포함한 다양한 기능에 접근할 수 있도록 하는 핵심 객체이다. SparkSession은 이전 버전의 SQLContext, HiveContext, 그리고 SparkContext의 기능을 통합하여 제공함으로써, 사용자가 보다 간편하게 Spark 애플리케이션을 구성하고 실행할 수 있도록 한다. ==개요== SparkSession은...) 태그: 시각 편집
- 2025년 4월 2일 (수) 08:30 빅데이터분석기사 토론 기여 계정이 생성되었습니다