1ambda/spark-code.py

## spark-code.py
spark
  .read                     // 데이터를 읽어옵니다.
  .format("jdbc")           // "jdbc" 뿐 아니라 "kafka" 등 다양한 Format 을 사용할 수 있습니다

  .join(...)                // 다른 데이터와 Join (병합) 합니다.

  .where(...)               // 데이터 Row 필터링하거나
  .selectExpr(...)          // 필요한 Column 만 선택합니다.

  repartition(5, "col1")    // 얼마나 / 어떤 기준으로 분산해 처리할지를 정의합니다
  .groupBy(...)             // 집계 연산을 수행합니다
  .agg(...)

  repartition(...)          // 얼마나 / 어떤 기준으로 분산해 저장할지를 정의합니다.
  .write
  .format("kafka")        // 데이터를 Parquet Format
  .option(...)              // 원하는 옵션을 주어
  .save(...)                // 저장합니다.
	spark
	.read // 데이터를 읽어옵니다.
	.format("jdbc") // "jdbc" 뿐 아니라 "kafka" 등 다양한 Format 을 사용할 수 있습니다

	.join(...) // 다른 데이터와 Join (병합) 합니다.

	.where(...) // 데이터 Row 필터링하거나
	.selectExpr(...) // 필요한 Column 만 선택합니다.

	repartition(5, "col1") // 얼마나 / 어떤 기준으로 분산해 처리할지를 정의합니다
	.groupBy(...) // 집계 연산을 수행합니다
	.agg(...)

	repartition(...) // 얼마나 / 어떤 기준으로 분산해 저장할지를 정의합니다.
	.write
	.format("kafka") // 데이터를 Parquet Format
	.option(...) // 원하는 옵션을 주어
	.save(...) // 저장합니다.