아파치 스파크 DSL 편집하기 (부분)

==예제==
아래 예제는 스칼라(Scala)를 사용하여 Apache Spark DSL을 활용한 간단한 데이터 처리 작업을 보여준다.
===예제 코드 (Scala)===
<syntaxhighlight lang="scala">
import org.apache.spark.sql.SparkSession

object SparkDSLExample {
  def main(args: Array[String]): Unit = {
    // SparkSession 생성
    val spark = SparkSession.builder
      .appName("SparkDSLExample")
      .master("local[*]")
      .getOrCreate()

    import spark.implicits._

    // 데이터셋 생성: 예제 데이터를 DataFrame으로 변환
    val df = Seq(
      ("Alice", 34),
      ("Bob", 45),
      ("Cathy", 29)
    ).toDF("name", "age")

    // DSL을 사용한 데이터 변환: 'age'가 30 이상인 행만 필터링하고, 'name' 컬럼 선택
    val result = df.filter($"age" >= 30).select("name")
    result.show()

    // SparkSession 종료
    spark.stop()
  }
}
</syntaxhighlight>
===예제 코드 (Python)===
<syntaxhighlight lang="python">
from pyspark.sql import SparkSession

# SparkSession 생성
spark = SparkSession.builder \
    .appName("SparkDSLExample") \
    .master("local[*]") \
    .getOrCreate()

# 예제 데이터 생성 및 DataFrame 변환
data = [("Alice", 34), ("Bob", 45), ("Cathy", 29)]
df = spark.createDataFrame(data, ["name", "age"])

# DSL을 사용한 데이터 처리: 'age'가 30 이상인 행 필터링 후 'name' 컬럼 선택
result = df.filter(df.age >= 30).select("name")
result.show()

spark.stop()
</syntaxhighlight>