Kafka๋ก ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ , Iceberg์ Delta Lake์ ์ ์ฅํ ๋ค,
Spark๋ก ์ฒ๋ฆฌํด๋ณด๋ ์ค์๊ฐ ๋ถ์ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํฉ๋๋ค.
๐ฅ ์ด ์๋ฆฌ์ฆ์ ๋ชฉํ
Docker ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ดํฐ ์์ง๋์ด๋ง์์ ์์ฃผ ๋ฑ์ฅํ๋ ๊ธฐ์ ์คํ์ธ Kafka, Data Lake(Iceberg, Delta lake)๋ฅผ ์ง์ ๊ตฌ์ฑํ๊ณ ํ ์คํธ ํด๋ณผ ์ ์์ต๋๋ค. ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ ๋ด์ฉ๋ค์ ๋ํด ์๊ฐํ๊ฒ ์ต๋๋ค.
- Kafka ์ค์๊ฐ ๋ถ์ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ
- Docker ๊ธฐ๋ฐ ๋น ๋ฐ์ดํฐ ๋ถ์ ํ๊ฒฝ ๊ตฌ์ถ
- Iceberg Vs Delta Lake ์ฐจ์ด์ ๋น๊ต
์ํคํ ์ฒ ์๊ฐ
- Kafka๋ ๋ฐ์ดํฐ๋ฅผ ์ง์ ํ์ธํ ์ ์๋๋ก RedPanda๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- Iceberg์ Delta-Lake๋ ๊ณต์ ์ฌ์ดํธ ๋ฐ ๊ณต์ github์์ ์ ๊ณตํ๋ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- Minio๋ AWS์ S3(๋๋ GCP์ Cloudstorage)์ ์ญํ ๋ก ๋ฐ์ดํฐ๋ ์ดํฌ์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ ์ญํ ์ ํฉ๋๋ค.
- ๊ทธ๋ฆฌ๊ณ Iceberg, Delta lake๋ jupyter notebook์ ํฌํจํ๊ณ ์์ด Spark๋ฅผ ํ ์คํธ ํ ์ ์์ต๋๋ค.
- ๋ชจ๋ ๋ฆฌ์์ค๋ Docker(Docker Compose)๋ก ๊ตฌ์ฑํฉ๋๋ค.
๋ฐ์ํ