Podstawowa książka na temat inżynierii danych. Omówiono wszystkie aspekty projektowania i eksploatacji różnych architektur danych, a także pełen cykl życia pracy z danymi: przygotowanie, absorpcja, przetwarzanie, czyszczenie, łączenie, orkiestracja, pipeline. Szczególną uwagę poświęcono technologiom chmurowym, rozkładowi obciążenia i bezpiecznemu przechowywaniu danych. Zbadano techniki formułowania zapytań, pracy z bazami danych oraz śledzenia przepływów danych. Książka daje wyczerpujące przedstawienie projektowania systemów do przetwarzania różnorodnych danych, utrzymywania tych systemów w uporządkowanej i dostępnej formie oraz trendów rozwoju nowoczesnego przemysłu danych. Ostatnia dekada to gwałtowny rozwój inżynierii danych, dlatego wśród programistów, badaczy i analityków danych rośnie zapotrzebowanie na kompleksowe rozpatrywanie inżynierii danych jako spójnej paradygmy. Z książki dowiesz się, jak projektować i tworzyć systemy enterprise do przetwarzania danych. Książka pomaga ocenić różnorodne technologie dostępne w ramach inżynierii danych, zrozumieć cykl życia danych jako produktu. Autorzy demonstrują wszystkie niuanse inżynierii danych w dynamice, opowiadają, jak łączyć i zestawiać różne chmurowe technologie przetwarzania danych dla maksymalnego zaspokojenia potrzeb użytkownika. Pokazano, jak zorganizować generację, absorpcję, orkiestrację, przetwarzanie, przechowywanie i pipeline danych oraz zarządzanie nimi w dowolnym środowisku, niezależnie od podstawowej technologii, na której jest zbudowane.