
Iceberg์ ์ฃผ์ ๊ธฐ๋ฅ์ ์๊ฐํ๊ณ Delta-lake, Hudi์ ๋น๊ตํ์ฌ ์๊ฐํฉ๋๋ค.์ด์ ์ ์ค์นํ Docker Compose์๋ Iceberg์ ์์ ์คํ Jupyter ๋ ธํธ๋ถ๋ ํจ๊ป ํฌํจ๋์ด ์์ต๋๋ค. ํด๋น ํ์ผ์ ๊ธฐ๋ฐ์ผ๋ก ์ค์ตํ๋ฉฐ ์ค๋ช ํ๊ฒ ์ต๋๋ค.(https://jongwho.tistory.com/37) Spark ์คํ ์์from pyspark.sql import SparkSessionspark = SparkSession.builder.appName("Jupyter").getOrCreate()spark-- ํ ์ด๋ธ ์์ฑCREATE DATABASE IF NOT EXISTS nyc ๋ฐ์ดํฐ ๋ก๋ ๋ฐ ํ ์ด๋ธ ์์ฑdf = spark.read.parquet("/home/iceberg/data/yellow_t..