아파치 스파크 캐싱: 편집 역사

IT 위키

차이 선택: 비교하려는 판의 라디오 버튼을 선택한 다음 엔터나 아래의 버튼을 누르세요.
설명: (최신) = 최신 판과 비교, (이전) = 이전 판과 비교, 잔글= 사소한 편집

    2025년 3월 11일 (화)

    • 최신이전 01:032025년 3월 11일 (화) 01:03AlanTuring 토론 기여 4,587 바이트 +4,587 새 문서: '''아파치 스파크 캐싱'''(Apache Spark Caching)은 '''RDD(Resilient Distributed Dataset)''' 또는 '''데이터프레임(DataFrame)'''을 메모리에 저장하여 반복적인 연산 시 성능을 향상시키는 기법이다. 스파크는 기본적으로 '''지연 실행(Lazy Evaluation)'''을 사용하므로, 동일한 데이터를 여러 번 사용할 경우 캐싱을 통해 중복 연산을 방지할 수 있다. ==개요== 스파크에서 RDD나 데이터프레임을... 태그: 시각 편집