구글 빅쿼리는 10억 명이 넘는 사용자를 보유한 구글 제품에서 수집되는 수천억 개의 유저 행동을 빠르게 처리하고 분석하기 위한 내부 활용을 목적으로 개발된 제품이었습니다. 이후 빅데이터 시대가 도래하고 그 빅데이터에 구글의 훌륭한 기술력이 더해져, 현존하는 가장 크고 강력하며 빠른 서버리스 빅데이터 플랫폼으로 발전했습니다. 이 책은 이러한 빅쿼리를 쉽게 잘 사용할 수 있도록 빅쿼리 공용 데이터셋과 구글 클라우드의 여러 솔루션을 함께 실습하며 배울 수 있는 내용이 가득 담겨 있습니다. 또한 빅쿼리에 익숙한 분이라면 이 책의 중후반부터 심도있게 다뤄지는 고급 과정을 통해 빅데이터 플랫폼의 정수를 깊게 느껴볼 수 있습니다. 제가 빅쿼리를 공부하며 오랜 기간 정독했던 원서였는데, 많은 개발자가 쉽게 읽고 이해할 수 있는 번역서가 출간되어 매우 기쁩니다. 이 책은 빅쿼리를 다루는 분이라면 마치 바이블 서적처럼 회사 책상에 한 권씩 구비해야 하는 책입니다. 만약 빅쿼리를 사용하지 않는다 하더라도 쿼리 엔진의 구조, 컬럼형 스토리지, 쿼리 최적화 방법, 머신러닝 등 빅데이터 플랫폼 아키텍처와 그 정수를 공부하는 데 큰 도움이 되는 책이므로 꼭 일독하시길 권합니다.
- 백정상 (구글 파트너 디벨로퍼 애드버킷)
『Google BigQuery: The Definitive Guide』 한국어판이 나오게 되어 기쁘고, 바쁜 중에도 번역을 완료해내신 성윤 님께 감사하고 축하드린다. 빅쿼리는 데이터 처리 용량이나 성능 면에서 획기적일 뿐만 아니라, 누구나 쉽게 데이터로부터 인사이트를 뽑을 수 있게 했다는 데에도 큰 의의가 있다. 이 책은, 여기에 더하여 빅쿼리 도입 효과를 극대화할 수 있는 여러 기법과 예제들을 소개하고 왜 그렇게 되는지를 설명한다. ICT 종사자라면, 특히나 데이터를 다루는 일을 하고 계신다면 꼭 읽어보시기를 추천드린다.
- 황장군 (데이터 엔지니어)
2년 전, 쏘카의 데이터 인프라를 처음부터 다시 만들면서 빅쿼리를 회사 전체의 메인 데이터 웨어하우스 및 분석 도구로 사용하기 시작했다. 지금은 200명 가까운 빅쿼리 사용자가 직접 쿼리를 하고 있는데, 이는 회사 전체의 절반이 넘는 인원이다. 회고해보자면 빅쿼리는 극단적으로 시간과 비용을 아껴주면서도 생산성을 극대화해주었기에, 우리가 수행한 여러 가지 시도 중 가장 잘한 결정 중 하나라고 생각한다.
빅쿼리는 역사가 깊은 제품임에도 적극적으로 기능이 변화하고 있어 당시의 빅쿼리 관련 서적은 아쉬움이 많았다. 『구글 빅쿼리 완벽 가이드』는 제목 그대로 빅쿼리를 잘 사용하는 법을 완벽하게 가이드하고 있어 데이터 분석을 새롭게 시작하거나 이미 활용하고 있는 독자 모두에게 큰 도움이 될 것이라 생각한다. 정확한 번역을 위해 고생해주신 역자분들께 감사의 인사를 전하고 싶다.
- 김상우 (쏘카 데이터그룹장, 쏘카/타다 데이터 오퍼레이션 총괄)
마이리얼트립이 ‘데이터가 흐르는 조직’이 되는 데 가장 큰 도움을 준 것은 클라우드 분석 환경, 그중에서도 구글 빅쿼리(Google BigQuery)다. 빅쿼리를 이용하면 적은 비용과 리소스로 데이터 분석 인프라를 굉장히 효율적으로 구축할 수 있다. 빅쿼리 기반의 분석 환경을 통해 데이터 분석가뿐 아니라 회사의 모든 구성원들이 쉽게 데이터에 접근할 수 있게 되었고, 이는 데이터 기반으로 일하는 문화를 만드는 데 큰 도움이 되었다.
이 책은 기본적인 SQL 언어의 문법부터 빅쿼리를 활용한 데이터 파이프라인 설계와 머신러닝 활용에 이르기까지, 빅쿼리를 통해 할 수 있는 데이터 활용에 대한 주제들을 굉장히 폭넓게 다룬다. 클라우드 데이터베이스를 활용해서 효율적인 분석 환경을 구축하고 싶은 데이터 엔지니어와 분석가들에게 큰 도움이 될 것이라고 생각한다.
- 양승화 (마이리얼트립(MyRealTrip) 그로스실 실장)
데이터 드리븐(data-driven) 문화를 위해서는 구성원 누구나 부담없이 데이터를 조회할 수 있는 환경이 필요하고, 이를 위한 데이터 웨어하우스를 구성해야하는 문제를 만나게 됩니다. 빅쿼리는 이러한 문제를 해결해주는 강력한 솔루션이고, 『구글 빅쿼리 완벽 가이드』는 완벽 가이드라는 제목 그대로 빅쿼리와 관련된 모든 내용을 일목요연하게 담아낸 책입니다. 빅쿼리가 왜 강력한지부터 시작해, 기본적인 SQL 문법부터 배열, 구조체, 윈도우 함수 등 빅쿼리 표준 SQL의 고급 문법, 빅쿼리 내부 아키텍처, 쿼리 퍼포먼스 최적화, 원하는 데이터를 빅쿼리에 로딩시키는 다양한 패턴들 소개와 더불어 스크립팅, BI 엔진, 빅쿼리 머신러닝 같은 최신 주제들까지, 빅쿼리 사용자에게 필요한 모든 내용을 충실히 담아냈습니다. 데이터플로우, 컴포저 같은 구글 클라우드의 다른 서비스들과 연계하여 통합된 데이터 시스템을 구성하는 패턴들에 대해서도 잘 설명되어 있어 이를 고민하는 엔지니어들에게도 훌륭한 길잡이가 되어줄 것입니다.
- 이창현 (매스프레소(Mathpresso) 데이터 팀 리드)
분산 파일 시스템의 기틀을 마련했지만 플랫폼 주도권 경쟁에서 오픈소스에 밀리고 말았던 구글은, 절치부심 하던 차 클라우드 시대를 맞이하여 주도권을 잡기 위한 기술력을 다시 한번 뽐내고 있다. 빅쿼리는 그런 구글의 기술력이 집약된 결정체로, 마치 마법과 같은 놀라운 성능을 보여주는 제품이다. 이 책은 구글에서 디렉터로 재직 중인 저자가 직접 집필하여 정확한 내용과 함께 풍부한 예제, 빅쿼리의 내부 구조를 상세히 소개한다. 빅쿼리의 마법이 궁금했던 이들에게 마법이 아닌 기술임을 알려주는 것은 물론, 빅쿼리를 잘 이해하고 있는 역자진의 자연스러운 번역과 함께 독자를 빅쿼리의 마법으로 이끌어줄 것이다. 마법에 빠져들고 싶은 모든 이에게 추천한다.
- 박상길 (현대자동차 AIRS 책임연구원, 『파이썬 알고리즘 인터뷰』 저자)
빅데이터 시대라는 말은 이제 이전 시대의 용어처럼 느껴짐에도 불구하고 데이터를 제대로 활용하는 회사는 드뭅니다. 데이터를 잘 사용해서 제품에 적용한다는 말이 언뜻 쉬워 보여도 데이터를 잘 쌓고 정제해서 분석하고 응용하는 과정은 어렵습니다. 특히 무엇보다도, 실제로 제품을 개발하는 개발 부서에서 직접 데이터를 쉽게 볼 수 있는 것이 중요합니다. 데이터 전문 인력이 아니더라도 제품을 개발하면서 적재적소에 데이터를 잘 활용하는 것은 매우 중요합니다.
빅쿼리는 개발자가 아니더라도 콘솔에서 쉽게 데이터를 조회하고 분석하고 더 나아가 대시보드까지 만들 수 있도록 환경을 만들어줍니다. 빅쿼리를 통해 대량의 데이터를 조회하는데 속도가 워낙 빨라서 데이터 분석 과정의 속도의 혁신이 생기고 있습니다. 이 책에서는 빅쿼리가 어떤 점에서 훌륭하고 어떻게 구성되어 있는지부터 시작해서 SQL까지도 친절하게 설명해줍니다. 데이터를 잘 활용하기 위해 빅쿼리를 고민하는 곳이라면 이 책은 정말 많은 도움이 될 것이라고 생각합니다.
- 이웅원 (당근마켓 데이터 사이언티스트)
이 책은 엔터프라이즈 데이터 웨어하우스를 기존 기술 스택에서 구글 클라우드로 이전하려는 빠르게 성장하는 기업들에게 꼭 필요한 책이다. 이 책의 저자 락과 조던은 비즈니스 분석에 엔터프라이즈 데이터 웨어하우스로 사용할 수 있고, SQL을 사용해 실시간 데이터 스트림을 쿼리할 수 있는 빅쿼리의 포괄적인 내용을 설명한다. 관리형 하둡 및 스파크 클러스터에서 빅쿼리에 액세스하며, 머신러닝을 사용해 카테고리를 자동으로 분류하고 당신의 데이터를 예측한다. 이 책의 저자인 락과 조던은 빅쿼리를 포괄적으로 다루므로, 빅쿼리의 다양한 활용을 배울 수 있다. 비즈니스 분석을 위한 기업용 데이터 웨어하우스로 활용할 수 있을 뿐만 아니라, SQL을 이용한 실시간 데이터 스트림 조회, 관리형 하둡과 스파크 클러스터에서 빅쿼리로의 접근, 머신러닝을 이용한 데이터의 자동 분류 및 예측에도 빅쿼리를 활용할 수 있다.
- 토마스 쿠리안 (Thomas Kurian, 구글 클라우드(Google Cloud)의 CEO)
이따금씩 세상의 모든 것을 변화시키는 소프트웨어나 서비스가 나오기도 한다. 빅쿼리는 기업이 데이터에 대해 생각할 수 있는 모든 방법을 변화시켰다. 애초부터 세계에서 가장 거대한 데이터셋을 처리하기 위해 설계된 빅쿼리는 데이터 분석과 학습을 위한 최고의 플랫폼 중 하나로 자리잡았다. 2016년 6월에 발표된 ‘표준 SQL’은 지금까지 설계한 SQL 중 가장 깔끔하고 완전하며 강력한 구현 중 하나다. 빅쿼리의 강력한 기능의 몇 가지 예를 들자면, 중첩된 데이터, 자바스크립트와 SQL의 사용자 정의 함수, 지리 공간 데이터, 머신러닝과의 통합, URL을 통한 데이터 공유 등이 있다. 빅쿼리를 배우려 한다면, 이 세상에서 빅쿼리를 가장 잘 아는 2명인 조던과 락이 쓴 이 책말고 다른 선택지는 없을 것이다.
- 로이드 탭 (Lloyd Tabb, 루커(Looker)의 공동 창업자이자 CTO)
7년 넘게 빅쿼리를 사용해왔음에도 빅쿼리에 대해 내가 미처 몰랐던 내용을 이 책에서 알려준다는 사실에 정말 기뻤다! 이 책은 모범 사례와 기법에 대한 귀중한 통찰력을 제공하며, 여러 가지 개념을 이해하기 쉽게 설명한다. 실용적인 방식으로 내용을 따라갈 수 있도록 훌륭하게 구성된 코드 예제는 책에 재미와 흥미를 배가시켜준다. 빅쿼리 사용자들에게 믿을 만한 참고서가 될 것임에 분명하다.
- 그레이엄 폴리 (Graham Polley, 서비안(Servian)의 경영 컨설턴트)