Opis treści

Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w różnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest również świetnie przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, że Apache Spark stanowi znakomity wybór dla programistów zajmujących się big data, a także eksploracją i analizą danych.

To książka przeznaczona dla inżynierów danych i programistów, którzy chcą za pomocą Sparka przeprowadzać skomplikowane analizy danych i korzystać z algorytmów uczenia maszynowego, nawet jeśli te dane pochodzą z różnych źródeł. Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać duże zbiory informacji, aby powstawały niezawodne jeziora danych, w jaki sposób wykonuje się interaktywne zapytania SQL, a także jak tworzy się potoki przy użyciu MLlib i wdraża modele za pomocą biblioteki MLflow. Omówiono również współdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczególnych środowiskach.

Autor:	Praca Zbiorowa
Wydawca:	Wyd. Helion
Nazwa handlowa wydawcy:	HELION
Adres pocztowy:	ul. Kościuszki 1c, 44-100 Gliwice
Adres elektroniczny:	helion@helion.pl
Strony:	360
Rok wydania:	2023

Autor:	Praca Zbiorowa
Wydawca:	Wyd. Helion
Nazwa handlowa wydawcy:	HELION
Adres pocztowy:	ul. Kościuszki 1c, 44-100 Gliwice
Adres elektroniczny:	helion@helion.pl
Liczba stron:	360
Rok wydania:	2023

Spark. Błyskawiczna analiza danych wyd. 2 Praca Zbiorowa książka

Spark. Błyskawiczna analiza danych wyd. 2

Praca Zbiorowa,

Ocena czytelników