BigQuery 쿼리가 느릴 때 어디를 봐야 하는지 정리합니다. 콘솔의 실행 계획(Execution Graph)으로 병목 stage를 집고, INFORMATION_SCHEMA.JOBS로 추세를 보고, slot_ms와 큐잉 시간으로 슬롯 부족을 구분하는 방법을 다룹니다....

Data Engineering

BigQuery Deep Dive·2026년 6월 7일

3. 슬롯과 컴퓨트 과금

지난 편에서는 데이터를 보관할 때 발생하는 storage 비용을 다뤘습니다. 이번 편의 주제는 쿼리를 돌릴 때 발생하는 compute 비용입니다.

Data Engineering

BigQuery Deep Dive·2026년 5월 10일

2. 저장 모델과 비용

지난 편에서는 BigQuery의 compute(Dremel)와 storage(Colossus)가 분리된 구조를 봤습니다. 이 분리가 비용에도 그대로 적용됩니다. 쿼리를 돌리면 compute 비용이 발생하고, 데이터를 그냥 저장만 해도 storage 비용이 따로 발생합니...

Data Engineering

BigQuery Deep Dive·2026년 4월 26일

1. 쿼리 한 줄이 처리되기까지

이전 데이터 엔지니어링 시리즈에서 BigQuery를 한 번 다뤘습니다. 그땐 Capacitor 포맷이 주제였고, compute-storage 분리는 "Dremel과 Colossus가 Jupiter 네트워크로 연결되어 있다" 정도로만 짚고 넘어갔습니다.

Data Engineering

Data Engineering·2026년 4월 12일

Apache Iceberg - Parquet 파일 위의 테이블 포맷

이전 글에서는 Schema Registry가 Kafka 환경에서 스키마 호환성을 검증하는 구조를 살펴봤습니다. 스트리밍에서는 Schema Registry가 스키마 진화를 관리하지만, 데이터 레이크 쪽은 사정이 다릅니다. S3에 Parquet 파일이 수만 개 쌓여 있고,...

Data Engineering

Data Engineering·2026년 3월 27일

Schema Registry - 스키마 진화를 안전하게 다루는 법

이전 글에서는 Avro가 스키마를 파일에 넣어 태그 없는 바이트를 해석하고, Writer/Reader Schema 분리로 스키마 진화를 지원하는 구조를 살펴봤습니다. 마지막에 Kafka 환경에서 Schema Registry가 스키마를 중앙 관리하고 호환성을 검증한다고 ...

Data Engineering

Data Engineering·2026년 3월 15일