data_lake

๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ์™€ ํด๋ผ์šฐ๋“œ DW

๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ

  • ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ

    • image

      • https://vitalflux.com/data-lake-design-principles-best-practices/

    • ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ๋Š” ์ถ”ํ›„์— ํŠน์ •ํ•œ ์šฉ๋„๋กœ ์‚ฌ์šฉ๋ , ํ•„ํ„ฐ๋ง๋˜์ง€ ์•Š์€ ์ด์งˆ์ ์ธ ๋ฐ์ดํ„ฐ๋ฅผ ๋Œ€๋Ÿ‰์œผ๋กœ ์ €์žฅํ•ฉ๋‹ˆ๋‹ค.

    • ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ๋Š” ๋‹ค์–‘ํ•œ ํ˜•์‹์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์›๋ณธ ํ˜•์‹ ๋˜๋Š” ๋•Œ์— ๋”ฐ๋ผ ๋น„์ •ํ˜• ํ˜•์‹์œผ๋กœ ์ €์žฅํ•ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ธฐ์—๋Š” ๋” ์ €๋ ดํ•˜์ง€๋งŒ ์›จ์–ดํ•˜์šฐ์Šค์˜ ์ •ํ˜•ํ™”๋œ ๋ฐ์ดํ„ฐ์™€ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ์ฟผ๋ฆฌํ•˜๋Š” ๋ฐ ์ตœ์ ํ™”๋˜์–ด ์žˆ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

    • ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ๋Š” ํŽ˜ํƒ€๋ฐ”์ดํŠธ ๊ทœ๋ชจ์˜ ์ •ํ˜•, ๋ฐ˜์ •ํ˜•, ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ์ง‘๊ณ„ํ•˜๊ธฐ ์œ„ํ•œ ์ค‘์•™ ๋ฐ์ดํ„ฐ์Šคํ† ์–ด๊ฐ€ ๋์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ์˜ ๋ฒ„์ „ ๊ด€๋ฆฌ ๋ฐ ๋กค๋ฐฑ์„ ์ง€์›ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

    • ๋ณต์ œ๋ณธ ๊ฐ„์˜ ์ผ๊ด€์„ฑ ๋ณด์žฅ, ๊ธฐ๋ณธ ๋ฐ์ดํ„ฐ์˜ ์Šคํ‚ค๋งˆ ์ง„ํ™”, ๋ถ€๋ถ„ ์—…๋ฐ์ดํŠธ ์ง€์›, ๊ธฐ์กด ๋ฐ์ดํ„ฐ ์—…๋ฐ์ดํŠธ๋ฅผ ์œ„ํ•œ ACID ์ผ๊ด€์„ฑ ๋“ฑ๊ณผ ๊ฐ™์€ ๋ฐ์ดํ„ฐ ์ˆ˜๋ช…์ฃผ๊ธฐ ๊ด€๋ฆฌ ์ž‘์—…๋“ค์ด ์žˆ๋Š”๋ฐ ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ๊ฐ€ ์ค‘์•™ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋กœ ์ธ๊ธฐ๋ฅผ ์–ป๊ธฐ๋Š” ํ–ˆ์ง€๋งŒ, ์ „ํ†ต์ ์ธ ๋ฐ์ดํ„ฐ ์ˆ˜๋ช…์ฃผ๊ธฐ ๊ด€๋ฆฌ ์ž‘์—…์— ๋Œ€ํ•œ ์ง€์›์€ ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค.

  • ์ง€์›๋˜๋Š” ํŒŒ์ผ ํ˜•์‹

    • ๋ฐ์ดํ„ฐ ํ˜•์‹์€ ํฌ๋งท์˜ ๊ฒฌ๊ณ ์„ฑ(์ฆ‰, ๋ฐ์ดํ„ฐ ์†์ƒ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋Œ€ํ•ด ํฌ๋งท์ด ์–ผ๋งˆ๋‚˜ ์ž˜ ํ…Œ์ŠคํŠธ๋๋Š”์ง€)๊ณผ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” SQL ์—”์ง„ ๋ฐ ๋ถ„์„ ํ”Œ๋žซํผ๊ณผ์˜ ์ƒํ˜ธ ์šด์šฉ์„ฑ์— ๋Œ€ํ•œ ๋ถ€๋ถ„์—์„œ ๊ท ํ˜•์„ ๋งž์ถฐ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

      • ํ‘œํ˜„์„ฑ : ํฌ๋งท์ด ์ง€๋„, ๋ ˆ์ฝ”๋“œ, ๋ชฉ๋ก, ์ค‘์ฒฉ๋œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ ๋“ฑ๊ณผ ๊ฐ™์€ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?

      • ๊ฒฌ๊ณ ์„ฑ : ํฌ๋งท์ด ์ž˜ ์ •์˜๋ผ ์žˆ๊ณ  ์‰ฝ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€? ์†์ƒ ์‹œ๋‚˜๋ฆฌ์˜ค์™€ ๊ธฐํƒ€ ์˜ˆ์™ธ ์ผ€์ด์Šค์— ๋Œ€ํ•ด ํ…Œ์ŠคํŠธ๊ฐ€ ์ž˜๋๋Š”๊ฐ€? ๊ฒฌ๊ณ ์„ฑ์˜ ๋‹ค๋ฅธ ์ค‘์š”ํ•œ ์ธก๋ฉด์€ ํฌ๋งท์˜ ๋‹จ์ˆœ์„ฑ. ํ˜•์‹์ด ๋ณต์žกํ• ์ˆ˜๋ก ์ง๋ ฌํ™” ๋ฐ ์—ญ์ง๋ ฌํ™” ๋“œ๋ผ์ด๋ฒ„์—์„œ ๋ฒ„๊ทธ๊ฐ€ ๋ฐœ์ƒํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง‘๋‹ˆ๋‹ค.

      • ๊ณต๊ฐ„ ํšจ์œจ์„ฑ : ๋ฐ์ดํ„ฐ์˜ ๊ฐ„๊ฒฐํ•œ ํ‘œํ˜„์€ ์–ธ์ œ๋‚˜ ์ตœ์ ํ™”์˜ ๊ธฐ์ค€์ด ๋จ. ๊ณต๊ฐ„ ํšจ์œจ์„ฑ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์ง„์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋Šฅ๋ ฅ๊ณผ ๋ฐ์ดํ„ฐ๋ฅผ ์••์ถ•ํ•˜๋Š” ๋Šฅ๋ ฅ์ด๋ผ๋Š” ๋‘ ๊ฐ€์ง€ ์š”์†Œ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

      • ์•ก์„ธ์Šค ์ตœ์ ํ™” : ์‘์šฉํ”„๋กœ๊ทธ๋žจ ์ฟผ๋ฆฌ์— ๋Œ€ํ•œ ์‘๋‹ต์œผ๋กœ ์•ก์„ธ์Šค ๋˜๋Š” ๋ฐ์ดํ„ฐ์–‘(๋ฐ”์ดํŠธ)์„ ์ตœ์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ฟผ๋ฆฌ ์œ ํ˜•์— ๋”ฐ๋ผ ํฌ๊ฒŒ ๋‹ฌ๋ผ์ง€๋ฉฐ, ์–ด๋””์—๋‚˜ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐฉ๋ฒ•์€ ์—†์Šต๋‹ˆ๋‹ค(select * ์ฟผ๋ฆฌ vs ์ œํ•œ๋œ ์ˆ˜์˜ ์—ด ๊ฐ’์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•„ํ„ฐ๋งํ•˜๋Š” ์ฟผ๋ฆฌ). ์•ก์„ธ์Šค ์ตœ์ ํ™”์˜ ๋˜ ๋‹ค๋ฅธ ๊ณ ๋ ค ์‚ฌํ•ญ์€ ๋ณ‘๋ ฌ ์‹คํ–‰์„ ์œ„ํ•œ ํŒŒ์ผ์„ ๋ถ„ํ• ํ•˜๋Š” ๊ธฐ๋Šฅ

    • ์ฃผ์š” ํฌ๋งท

      • ํ…์ŠคํŠธ ํŒŒ์ผ : ๊ฐ€์žฅ ์˜ค๋ž˜๋œ ํ˜•์‹ ์ค‘ ํ•˜๋‚˜. ์‚ฌ๋žŒ์ด ์ฝ์„ ์ˆ˜ ์žˆ๊ณ  ์ƒํ˜ธ ์šด์šฉ์ด ๊ฐ€๋Šฅํ•˜์ง€๋งŒ, ๊ณต๊ฐ„๊ณผ ์ ‘๊ทผ ์ตœ์ ํ™” ์ธก๋ฉด์—์„œ ์ƒ๋‹นํžˆ ๋น„ํšจ์œจ์ 

      • CSV/TSV : ์ด ํ˜•์‹์—๋Š” ๋น„ํšจ์œจ์ ์ธ ์ด์ง„ ํ‘œํ˜„๊ณผ ์•ก์„ธ์Šค์— ๊ด€๋ จ๋œ ์ œํ•œ์ด ์žˆ์Œ. ๋˜ํ•œ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ์ด ํ˜•์‹์œผ๋กœ ํ‘œํ˜„ํ•˜๊ธฐ๋Š” ์–ด๋ ค์›€

      • JSON : ์ด ํ˜•์‹์€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ๋ฐœ์ž์—๊ฒŒ ๊ฐ€์žฅ ํ‘œํ˜„์„ฑ์ด ์žˆ๊ณ  ๋ฒ”์šฉ์ ์ธ ํ˜•์‹ ์ค‘ ํ•˜๋‚˜. ์ด ๋ชฉ๋ก์˜ ๋‹ค๋ฅธ ํ˜•์‹๊ณผ ๋น„๊ตํ•˜๋ฉด ๊ณต๊ฐ„ ๋ฐ ์•ก์„ธ์Šค ์ธก๋ฉด ๋ชจ๋‘์—์„œ ์ตœ์ ํ™”๋˜์ง€ ์•Š์•˜์Œ

      • SequenceFile : Hadoop์—์„œ ๊ฐ€์žฅ ์˜ค๋ž˜๋œ ํŒŒ์ผ ํ˜•์‹ ์ค‘ ํ•˜๋‚˜. ๋ฐ์ดํ„ฐ๋Š” ํ‚ค-๊ฐ’ ์Œ์œผ๋กœ ํ‘œ์‹œ๋จ. ์ž๋ฐ”๊ฐ€ ์“ฐ๊ธฐ ๊ฐ€๋Šฅํ•œ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ์‚ฌ์šฉํ•ด Hadoop์— ์•ก์„ธ์Šคํ•˜๋Š” ์œ ์ผํ•œ ๋ฐฉ๋ฒ•์ด์—ˆ์„ ๋•Œ ์ธ๊ธฐ๊ฐ€ ์žˆ์—ˆ์Œ. ๊ฐ€์žฅ ํฐ ๋ฌธ์ œ๋Š” ์ƒํ˜ธ ์šด์šฉ์„ฑ์ด์—ˆ๊ณ , ์ผ๋ฐ˜์ ์ธ ์ •์˜๊ฐ€ ์—†์—ˆ์Œ

      • Avro : ์Šคํ‚ค๋งˆ๊ฐ€ ํŒŒ์ผ ํ—ค๋”์™€ ํ•จ๊ป˜ ์ €์žฅ๋œ๋‹ค๋Š” ์ ์„ ์ œ์™ธํ•˜๋ฉด SequenceFile๊ณผ ์œ ์‚ฌํ•จ. ํ˜•์‹์€ ํ‘œํ˜„์„ฑ์ด ์žˆ๊ณ  ์ƒํ˜ธ ์šด์šฉ์ด ๊ฐ€๋Šฅํ•จ. ์ด์ง„ ํ‘œํ˜„์—๋Š” ์˜ค๋ฒ„ํ—ค๋“œ๊ฐ€ ์žˆ์œผ๋ฉฐ, ์ตœ์ ํ™”๊ฐ€ ์ตœ๊ณ ๋กœ ์ž˜๋œ ๊ฒƒ์€ ์•„๋‹˜. ์ „๋ฐ˜์ ์œผ๋กœ ๋ฒ”์šฉ ์›Œํฌ๋กœ๋“œ์— ์ ํ•ฉํ•จ

      • ORCFile : ๊ณ ๊ธ‰ ์‚ฌ์šฉ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์—ด ๊ธฐ๋ฐ˜ ํฌ๋งท. Hadoop ์—์ฝ”์‹œ์Šคํ…œ์—์„œ ์ด ํฌ๋งท์€ RCfile ํฌ๋งท์˜ ํ›„์† ํฌ๋งท์œผ๋กœ ์—ฌ๊ฒจ์ง€๊ณ  ์žˆ๋Š”๋ฐ, ์ด๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋ฌธ์ž์—ด๋กœ ์ €์žฅํ•˜๋Š” ๋ฐ ๋น„ํšจ์œจ์ ์ด์—ˆ์Œ. ORCFile์€ ๊ฐ•๋ ฅํ•œ Hortonworks ์ง€์›๊ณผ ์ตœ๊ทผ์˜ ํฅ๋ฏธ๋กœ์šด ๋ฐœ์ „์„ ํ†ตํ•ด PPD(Push Predicate Down)์™€ ํ–ฅ์ƒ๋œ ์••์ถ• ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•จ

      • Parquet : ORCFile๊ณผ ์œ ์‚ฌํ•˜๋ฉฐ ํด๋ผ์šฐ๋ฐ๋ผ์˜ ์ง€์›์„ ๋ฐ›์Œ. Parquet๋Š” ๊ตฌ๊ธ€ Dremel๋…ผ๋ฌธ์˜ ์ตœ์ ํ™”๋ฅผ ๊ตฌํ˜„ํ•จ

    • ์ธ์ฝ”๋”ฉ๊ณผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋‹ค์–‘ํ•œ ์••์ถ• ๊ธฐ์ˆ ๋กœ zlib, gzip, LZO, Snappy ๋“ฑ์ด ๋„๋ฆฌ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

  • ๊ณ ์ถฉ

    • ์›์‹œ ๋ฐ์ดํ„ฐ ์ˆ˜๋ช…์ฃผ๊ธฐ ์ž‘์—…์— ์ž๋™ํ™”๋œ API๊ฐ€ ์—†๊ณ  ์žฌํ˜„์„ฑ ๋ฐ ๋กค๋ฐฑ, ๋ฐ์ดํ„ฐ ์ œ๊ณต ๊ณ„์ธต ํ”„๋กœ๋น„์ €๋‹ ๋“ฑ์— ๋Œ€ํ•œ ์—”์ง€๋‹ˆ์–ด๋ง ์ „๋ฌธ ์ง€์‹์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

    • ๋™์‹œ ์ฝ๊ธฐ-์“ฐ๊ธฐ ์ž‘์—…์— ๋Œ€ํ•œ ๋ ˆ์ดํฌ์˜ ์ผ๊ด€์„ฑ ๋ถ€์กฑ์„ ์ˆ˜์šฉํ•˜๊ธฐ ์œ„ํ•ด ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์ด์šฉํ•œ ๋Œ€์ฒด ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

    • ๊ทœ์ • ์ค€์ˆ˜๋ฅผ ์œ„ํ•ด ๊ณ ๊ฐ์˜ ๊ธฐ๋ก์„ ์‚ญ์ œํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ์ฆ๋ถ„ ์—…๋ฐ์ดํŠธ์˜ ์ตœ์ ํ™” ์ˆ˜์ค€์ด ๋งค์šฐ ๋‚ฎ์Šต๋‹ˆ๋‹ค.

    • ์ŠคํŠธ๋ฆผ ์ผ๊ด„ ์ฒ˜๋ฆฌ๋ฅผ ๊ฒฐํ•ฉํ•œ ํ†ตํ•ฉ ๋ฐ์ดํ„ฐ ๊ด€๋ฆฌ๊ฐ€ ๋ถˆ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

    • ๋Œ€์ฒด ๋ฐฉ์•ˆ๋“ค์€ ์ผ๊ด„ ์ฒ˜๋ฆฌ ๋ฐ ์ŠคํŠธ๋ฆผ(๋žŒ๋‹ค ์•„ํ‚คํ…์ฒ˜๋ผ๊ณ  ํ•จ)์— ๋Œ€ํ•ด ๋ณ„๋„์˜ ์ฒ˜๋ฆฌ ์ฝ”๋“œ ๊ฒฝ๋กœ๋ฅผ ํ•„์š”๋กœ ํ•˜๊ฑฐ๋‚˜ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์ด๋ฒคํŠธ(์นดํŒŒ ์•„ํ‚คํ…์ฒ˜๋ผ๊ณ  ํ•จ)๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ•˜๋Š”๋ฐ, ์ด๋Š” ๋Œ€๊ทœ๋ชจ ๊ด€๋ฆฌ๊ฐ€ ์‰ฝ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

ํด๋ผ์šฐ๋“œ DW

  • ํด๋ผ์šฐ๋“œ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค

    • ์›๋ž˜ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋Š” ์˜จํ”„๋ ˆ๋ฏธ์Šค ์„œ๋ฒ„ ๋‚ด์— ๊ตฌ์ถ•, ๋งŽ์€ ๊ฒฝ์šฐ ํ–ฅ์ƒ๋œ ๊ฑฐ๋ฒ„๋„Œ์Šค, ๋ณด์•ˆ์„ฑ, ๋ฐ์ดํ„ฐ ์ฃผ๊ถŒ, ๊ฐœ์„ ๋œ ๋Œ€๊ธฐ์‹œ๊ฐ„์„ ์ œ๊ณตํ•จ, ์˜จํ”„๋ ˆ๋ฏธ์Šค ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋Š” ํƒ„๋ ฅ์ ์ด์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์—, ๋ฏธ๋ž˜ ์ˆ˜์š”์— ๋Œ€๋น„ํ•ด ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋ฅผ ํ™•์žฅํ•˜๋ ค๋ฉด ๋ณต์žกํ•œ ์˜ˆ์ธก ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์˜จํ”„๋ ˆ๋ฏธ์Šค ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋Š” ๊ด€๋ฆฌ๋„ ๋งค์šฐ ๋ณต์žกํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

    • ํด๋ผ์šฐ๋“œ ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๊ธฐ์—…์ด ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค๋ฅผ ์ง€์›ํ•˜๊ธฐ ์œ„ํ•ด ํ•˜๋“œ์›จ์–ด ๋ฐ ์†Œํ”„ํŠธ์›จ์–ด ์ธํ”„๋ผ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ฑฐ๋‚˜ ๊ด€๋ฆฌํ•  ํ•„์š” ์—†์ด ๋ฐ์ดํ„ฐ์—์„œ ๊ฐ€์น˜๋ฅผ ์ถ”์ถœํ•˜๋Š” ๋ฐ์—๋งŒ ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.

    • ์ด์ 

      • ๋Œ€๊ทœ๋ชจ ๋˜๋Š” ๊ฐ€๋ณ€ ์ปดํ“จํŠธ ๋˜๋Š” ์Šคํ† ๋ฆฌ์ง€ ์š”๊ตฌ์‚ฌํ•ญ์— ๋Œ€ํ•œ ํƒ„๋ ฅ์ ์ธ ํ™•์žฅ ์ง€์›

      • ์‚ฌ์šฉ ํŽธ์˜์„ฑ

      • ๊ด€๋ฆฌ ์šฉ์ด์„ฑ

      • ๋น„์šฉ ์ ˆ๊ฐ

      • ์˜จํ”„๋ ˆ๋ฏธ์Šค ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค์™€ ๋™์ผํ•œ ํŠน์„ฑ๊ณผ ์ด์ ์„ ์ œ๊ณตํ•˜๋ฉด์„œ, ๋™์‹œ์— ์œ ์—ฐ์„ฑ, ํ™•์žฅ์„ฑ, ๋ฏผ์ฒฉ์„ฑ, ๋ณด์•ˆ ๋ฐ ๋น„์šฉ ์ ˆ๊ฐ๊ณผ ๊ฐ™์€ ํด๋ผ์šฐ๋“œ ์ปดํ“จํŒ…์˜ ์ถ”๊ฐ€ ์ด์ ๊นŒ์ง€ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

      • ์‹œ์Šคํ…œ

        • Amazon Redshift

          • Redshift๋Š” ๋น„์ฆˆ๋‹ˆ์Šค ์ธํ…”๋ฆฌ์ „์Šค(BI) ๋„๊ตฌ์™€ ์›ํ™œํ•˜๊ฒŒ ํ†ตํ•ฉ๋  ์ˆ˜ ์žˆ๋Š” Managedํ˜• ํด๋ผ์šฐ๋“œ ๋ฐ์ดํ„ฐ์›จ์–ด ํ•˜์šฐ์Šค ์„œ๋น„์Šค

          • ์›จ์–ดํ•˜์šฐ์Šค์— ETL(Extract, Transform, Load)๋งŒ ์žˆ์œผ๋ฉด ํ˜„๋ช…ํ•œ ๋น„์ฆˆ๋‹ˆ์Šค ์˜์‚ฌ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๊ธฐ๊ฐ€ ์ˆ˜์›”ํ•ด์ง‘๋‹ˆ๋‹ค.

        • Google BigQuery

          • Google์˜ ์ž์ฒด ๋ฐ์ดํ„ฐ์›จ์–ด ํ•˜์šฐ์ง• ์†”๋ฃจ์…˜

          • Dremel์€ BigQuery์—์„œ ์ฟผ๋ฆฌ๋ฅผ ์‹คํ–‰ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” Google์—์„œ ๊ฐœ๋ฐœํ•œ ๊ฐ•๋ ฅํ•œ ์ฟผ๋ฆฌ ์—”์ง„์ž…๋‹ˆ๋‹ค. Google์— ์˜ํ•˜๋ฉด Dremel์€ ๋งค์šฐ ํฐ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ SQL๊ณผ ๊ฐ™์€ ์œ ์‚ฌํ•œ ์ฟผ๋ฆฌ๋ฅผ ์‹คํ–‰ํ•˜๊ณ  ๋‹จ ๋ช‡ ์ดˆ๋งŒ์— ์ •ํ™•ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์ฟผ๋ฆฌ์„œ๋น„์Šค

          • BugQuery ๋ฐ Dremel์€ ๋ฆฌ์†Œ์Šค๋ฅผ ํ• ๋‹นํ•˜๊ณ  Dremel ์ž‘์—…์— ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜๋Š”๋ฐ ๋„์›€์ด ๋˜๋Š” Borg ๋ฐ Colossus์™€ ๊ฐ™์€ ๋‹ค๋ฅธ Google ํด๋ผ์šฐ๋“œ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

        • SnowFlake

          • Redshift์™€ Snowflake๋Š” ๊ด€๊ณ„ํ˜• ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ด€๋ฆฌ ์‹œ์Šคํ…œ

          • SaaS(Software-as-a-Service) ๋ชจ๋ธ๋กœ ์ œ๊ณต๋˜๋Š” ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ์™€ ๋ฐ˜ ๊ตฌ์กฐํ™”๋œ ๋ฐ์ดํ„ฐ ๋ชจ๋‘๋ฅผ ์ง€์›ํ•˜๋Š” ๋ฐ์ดํ„ฐ์›จ์–ด ํ•˜์šฐ์Šค

          • Snowflake๋Š” ๋น ๋ฅด๊ณ  ์‚ฌ์šฉ์ž ์นœํ™”์ ์ด๋ฉฐ ๊ธฐ์กด ๋ฐ์ดํ„ฐ์›จ์–ด ํ•˜์šฐ์Šค๋ณด๋‹ค ๋” ๋งŽ์€ ์œ ์—ฐ์„ฑ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

          • Snowflake๋Š” Snowflake Elastic Data Warehouse์˜ ํ˜•ํƒœ๋กœ ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ์Šคํ† ๋ฆฌ์ง€ ๋ฐ ๋ถ„์„์„ ์ œ๊ณต, ์‚ฌ์šฉ์ž๋Š” ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ ํ•˜๋“œ์›จ์–ด ๋ฐ ์†Œํ”„ํŠธ์›จ์–ด๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•˜๊ณ  ์ €์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Reference

  • https://www.oreilly.com/library/view/designing-data-intensive-applications/9781491903063/

  • https://www.oreilly.com/library/view/the-self-service-data/9781492075240/

Last updated