Opis
Koncepcja big data, nauka o danych i analityka danych wspomagają dziś procesy decyzyjne w przedsiębiorstwach w niespotykanym wcześniej zakresie. Zwiększają poziom efektywności pracy w wielu różnych branżach. Korporacje zaczęły więc eksperymenty z wykorzystaniem big data i technologii chmury, aby budować jeziora danych oraz tworzyć oparte na nich systemy podejmowania decyzji. Niejeden z tych projektów się nie powiódł, gdyż nie został dostosowany do kultury i potrzeb przedsiębiorstwa. Najwyraźniej zabrakło wiedzy, w jaki sposób skutecznie przeprowadzać tak radykalną transformację.
Ta książka jest praktycznym przewodnikiem, który ułatwia wdrażanie architektury jeziora danych (ang. data lake) w przedsiębiorstwie. Omówiono tu różne podejścia do jej uruchamiania i rozwijania, w tym kałuże danych (analityczne piaskownice) i stawy danych (hurtownie danych), a także budowanie jezior danych od podstaw. Opisano konfigurowanie różnych stref, co pozwala na odpowiednie rozmieszczenie zarówno surowych, jak i starannie zarządzanych i przetworzonych danych. Wyjaśniono znaczenie zarządzania dostępem do stref. Zawarto tu również wskazówki umożliwiające zachowanie zgodności z regułami zarządzania danymi przedsiębiorstwa.
W tej książce:
wprowadzenie do hurtowni danych, big data i nauki o danych
praktyczne techniki budowania jezior danych
najlepsze praktyki dostarczania analitykom dostępu do danych
projektowanie architektury jeziora danych oraz różne techniki implementacji
zalety i wady różnych podejść do budowania magazynów danych i zarządzania nimi
Jeziora danych i big data - ocean możliwości!
O autorze
Alex Gorelik jest CEO i założycielem firmy Waterline Data. Wcześniej zakładał startupy, zajmował się marketingiem oraz badaniami produktów, zarządzał zespołem kilkuset inżynierów i pracował nad integracją danych w firmie IBM. Jego kariera jest nieodłącznie związana z nowoczesnymi technologiami przetwarzania danych i ich wdrażaniem dla potrzeb biznesu.