Zgłoś błąd

Zauważyłeś błąd w danych? Daj nam znać — poprawimy to.

Dziękujemy!

Twoje zgłoszenie zostało wysłane. Sprawdzimy je jak najszybciej.

O książce
Opis dostarczony przez wydawcę

Ilość danych we wszystkich domenach wciąż rośnie. Jak możemy skutecznie je wykorzystywać? W książce Poznajemy Sparka przedstawiono Apache Spark, system open source do przetwarzania klastrów, dzięki któremu pisanie i uruchamianie aplikacji analizy danych jest szybsze. Za pomocą Sparka można stawić czoła dużym zbiorom danych za pośrednictwem prostych interfejsów w językach Python, Java i Scala.

Dzięki tej pracy, napisanej przez deweloperów Sparka, naukowcy zajmujący się danymi i inżynierowie dowiedzą się, jak przedstawiać równoległe zadania za pomocą kilku wierszy kodu oraz jak pisać aplikacje od prostych zdań wsadowych do przetwarzania strumieniowego i systemów uczących się. Informacje zawarte w książce pozwolą im na:.

·         szybkie zgłębienie możliwości Sparka, takich jak rozproszone zbiory danych, buforowanie w pamięci oraz interaktywna powłoka

·         wykorzystywanie wbudowanych bibliotek, łącznie z Spark SQL, Spark Streaming oraz MLlib

·         wykorzystywanie paradygmatu programowania zamiast łączenia i dopasowywania narzędzi takich jak Hive, Hadoop, Mahout i Storm 

·         poznawanie sposobu wykorzystywania aplikacji interakcyjnych, wsadowych i strumieniowych

dołączanie źródeł danych, np. HDFS, Hive, JSON i S3

Wydanie (1)

Okładka: Poznajemy Sparka. Błyskawiczna analiza danych
Miękka oprawa 15 stycznia 2016

Wydawnictwo Naukowe PWN

300 str.

ISBN 9788301184674