Verwandte Artikel zu Big Data Processing with Apache Spark: Efficiently...

Big Data Processing with Apache Spark: Efficiently tackle large datasets and big data analysis with Spark and Python - Softcover

 
9781789808810: Big Data Processing with Apache Spark: Efficiently tackle large datasets and big data analysis with Spark and Python

Inhaltsangabe

No need to spend hours ploughing through endless data - let Spark, one of the fastest big data processing engines available, do the hard work for you.

Key Features:

- Get up and running with Apache Spark and Python

- Integrate Spark with AWS for real-time analytics

- Apply processed data streams to machine learning APIs of Apache Spark

Book Description:

Processing big data in real time is challenging due to scalability, information consistency, and fault-tolerance. This book teaches you how to use Spark to make your overall analytical workflow faster and more efficient. You'll explore all core concepts and tools within the Spark ecosystem, such as Spark Streaming, the Spark Streaming API, machine learning extension, and structured streaming.

You'll begin by learning data processing fundamentals using Resilient Distributed Datasets (RDDs), SQL, Datasets, and Dataframes APIs. After grasping these fundamentals, you'll move on to using Spark Streaming APIs to consume data in real time from TCP sockets, and integrate Amazon Web Services (AWS) for stream consumption.

By the end of this book, you'll not only have understood how to use machine learning extensions and structured streams but you'll also be able to apply Spark in your own upcoming big data projects.

What You Will Learn:

- Write your own Python programs that can interact with Spark

- Implement data stream consumption using Apache Spark

- Recognize common operations in Spark to process known data streams

- Integrate Spark streaming with Amazon Web Services (AWS)

- Create a collaborative filtering model with the movielens dataset

- Apply processed data streams to Spark machine learning APIs

Who this book is for:

Data Processing with Apache Spark is for you if you are a software engineer, architect, or IT professional who wants to explore distributed systems and big data analytics. Although you don't need any knowledge of Spark, prior experience of working with Python is recommended.

Die Inhaltsangabe kann sich auf eine andere Ausgabe dieses Titels beziehen.

Über die Autorin bzw. den Autor

Manuel Ignacio Franco Galeano is a computer scientist from Colombia. He works for Fender Musical Instruments as a lead engineer in Dublin, Ireland. He holds a master's degree in computer science from University College, Dublin UCD. His areas of interest and research are music information retrieval, data analytics, distributed systems, and blockchain technologies.

„Über diesen Titel“ kann sich auf eine andere Ausgabe dieses Titels beziehen.

Gebraucht kaufen

Zustand: Wie neu
Unread book in perfect condition...
Diesen Artikel anzeigen

EUR 17,12 für den Versand von USA nach Deutschland

Versandziele, Kosten & Dauer

EUR 4,47 für den Versand von Vereinigtes Königreich nach Deutschland

Versandziele, Kosten & Dauer

Suchergebnisse für Big Data Processing with Apache Spark: Efficiently...

Beispielbild für diese ISBN

Manuel Ignacio Franco Galeano
Verlag: Packt Publishing Limited, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu PAP
Print-on-Demand

Anbieter: PBShop.store UK, Fairford, GLOS, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PAP. Zustand: New. New Book. Delivered from our UK warehouse in 4 to 14 business days. THIS BOOK IS PRINTED ON DEMAND. Established seller since 2000. Bestandsnummer des Verkäufers L0-9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 42,66
Währung umrechnen
Versand: EUR 4,47
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Franco Galeano, Manuel Ignacio
Verlag: Packt Publishing, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Softcover

Anbieter: Ria Christie Collections, Uxbridge, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. In. Bestandsnummer des Verkäufers ria9781789808810_new

Verkäufer kontaktieren

Neu kaufen

EUR 41,79
Währung umrechnen
Versand: EUR 5,74
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Franco Galeano, Manuel Ignacio
Verlag: Packt Publishing, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Softcover

Anbieter: California Books, Miami, FL, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers I-9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 39,69
Währung umrechnen
Versand: EUR 8,56
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Foto des Verkäufers

Franco Galeano, Manuel Ignacio
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Paperback or Softback

Anbieter: BargainBookStores, Grand Rapids, MI, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback or Softback. Zustand: New. Big Data Processing with Apache Spark 0.56. Book. Bestandsnummer des Verkäufers BBS-9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 39,01
Währung umrechnen
Versand: EUR 10,70
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 5 verfügbar

In den Warenkorb

Foto des Verkäufers

Franco Galeano, Manuel Ignacio
Verlag: Packt Publishing, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Kartoniert / Broschiert
Print-on-Demand

Anbieter: moluna, Greven, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Kartoniert / Broschiert. Zustand: New. Dieser Artikel ist ein Print on Demand Artikel und wird nach Ihrer Bestellung fuer Sie gedruckt. Processing big data in real-time is challenging due to scalability, information consistency, and fault tolerance. This book shows you how you can use Spark to make your overall analysis workflow faster and more efficient. You ll learn all about the core con. Bestandsnummer des Verkäufers 448332334

Verkäufer kontaktieren

Neu kaufen

EUR 50,04
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Foto des Verkäufers

Manuel Ignacio Franco Galeano
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Paperback

Anbieter: Rarewaves USA, OSWEGO, IL, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback. Zustand: New. No need to spend hours ploughing through endless data - let Spark, one of the fastest big data processing engines available, do the hard work for you.Key FeaturesGet up and running with Apache Spark and PythonIntegrate Spark with AWS for real-time analyticsApply processed data streams to machine learning APIs of Apache SparkBook DescriptionProcessing big data in real time is challenging due to scalability, information consistency, and fault-tolerance. This book teaches you how to use Spark to make your overall analytical workflow faster and more efficient. You'll explore all core concepts and tools within the Spark ecosystem, such as Spark Streaming, the Spark Streaming API, machine learning extension, and structured streaming.You'll begin by learning data processing fundamentals using Resilient Distributed Datasets (RDDs), SQL, Datasets, and Dataframes APIs. After grasping these fundamentals, you'll move on to using Spark Streaming APIs to consume data in real time from TCP sockets, and integrate Amazon Web Services (AWS) for stream consumption.By the end of this book, you'll not only have understood how to use machine learning extensions and structured streams but you'll also be able to apply Spark in your own upcoming big data projects.What you will learnWrite your own Python programs that can interact with SparkImplement data stream consumption using Apache SparkRecognize common operations in Spark to process known data streamsIntegrate Spark streaming with Amazon Web Services (AWS)Create a collaborative filtering model with the movielens datasetApply processed data streams to Spark machine learning APIsWho this book is forData Processing with Apache Spark is for you if you are a software engineer, architect, or IT professional who wants to explore distributed systems and big data analytics. Although you don't need any knowledge of Spark, prior experience of working with Python is recommended. Bestandsnummer des Verkäufers LU-9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 47,38
Währung umrechnen
Versand: EUR 3,43
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Manuel Ignacio Franco Galeano
Verlag: Packt Publishing Limited, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Paperback / softback
Print-on-Demand

Anbieter: THE SAINT BOOKSTORE, Southport, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback / softback. Zustand: New. This item is printed on demand. New copy - Usually dispatched within 5-9 working days 222. Bestandsnummer des Verkäufers C9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 46,76
Währung umrechnen
Versand: EUR 5,02
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Foto des Verkäufers

Manuel Ignacio Franco Galeano
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Paperback

Anbieter: Rarewaves.com UK, London, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback. Zustand: New. No need to spend hours ploughing through endless data - let Spark, one of the fastest big data processing engines available, do the hard work for you.Key FeaturesGet up and running with Apache Spark and PythonIntegrate Spark with AWS for real-time analyticsApply processed data streams to machine learning APIs of Apache SparkBook DescriptionProcessing big data in real time is challenging due to scalability, information consistency, and fault-tolerance. This book teaches you how to use Spark to make your overall analytical workflow faster and more efficient. You'll explore all core concepts and tools within the Spark ecosystem, such as Spark Streaming, the Spark Streaming API, machine learning extension, and structured streaming.You'll begin by learning data processing fundamentals using Resilient Distributed Datasets (RDDs), SQL, Datasets, and Dataframes APIs. After grasping these fundamentals, you'll move on to using Spark Streaming APIs to consume data in real time from TCP sockets, and integrate Amazon Web Services (AWS) for stream consumption.By the end of this book, you'll not only have understood how to use machine learning extensions and structured streams but you'll also be able to apply Spark in your own upcoming big data projects.What you will learnWrite your own Python programs that can interact with SparkImplement data stream consumption using Apache SparkRecognize common operations in Spark to process known data streamsIntegrate Spark streaming with Amazon Web Services (AWS)Create a collaborative filtering model with the movielens datasetApply processed data streams to Spark machine learning APIsWho this book is forData Processing with Apache Spark is for you if you are a software engineer, architect, or IT professional who wants to explore distributed systems and big data analytics. Although you don't need any knowledge of Spark, prior experience of working with Python is recommended. Bestandsnummer des Verkäufers LU-9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 50,26
Währung umrechnen
Versand: EUR 2,30
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Foto des Verkäufers

Manuel Ignacio Franco Galeano
Verlag: Packt Publishing, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Taschenbuch
Print-on-Demand

Anbieter: AHA-BUCH GmbH, Einbeck, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Taschenbuch. Zustand: Neu. nach der Bestellung gedruckt Neuware - Printed after ordering - No need to spend hours ploughing through endless data - let Spark, one of the fastest big data processing engines available, do the hard work for you.Key Features: Get up and running with Apache Spark and Python Integrate Spark with AWS for real-time analytics Apply processed data streams to machine learning APIs of Apache SparkBook Description:Processing big data in real time is challenging due to scalability, information consistency, and fault-tolerance. This book teaches you how to use Spark to make your overall analytical workflow faster and more efficient. You'll explore all core concepts and tools within the Spark ecosystem, such as Spark Streaming, the Spark Streaming API, machine learning extension, and structured streaming.You'll begin by learning data processing fundamentals using Resilient Distributed Datasets (RDDs), SQL, Datasets, and Dataframes APIs. After grasping these fundamentals, you'll move on to using Spark Streaming APIs to consume data in real time from TCP sockets, and integrate Amazon Web Services (AWS) for stream consumption.By the end of this book, you'll not only have understood how to use machine learning extensions and structured streams but you'll also be able to apply Spark in your own upcoming big data projects.What You Will Learn: Write your own Python programs that can interact with Spark Implement data stream consumption using Apache Spark Recognize common operations in Spark to process known data streams Integrate Spark streaming with Amazon Web Services (AWS) Create a collaborative filtering model with the movielens dataset Apply processed data streams to Spark machine learning APIsWho this book is for:Data Processing with Apache Spark is for you if you are a software engineer, architect, or IT professional who wants to explore distributed systems and big data analytics. Although you don't need any knowledge of Spark, prior experience of working with Python is recommended. Bestandsnummer des Verkäufers 9781789808810

Verkäufer kontaktieren

Neu kaufen

EUR 52,62
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: 1 verfügbar

In den Warenkorb

Foto des Verkäufers

Franco Galeano, Manuel Ignacio
Verlag: Packt Publishing, 2018
ISBN 10: 1789808812 ISBN 13: 9781789808810
Neu Softcover

Anbieter: GreatBookPrices, Columbia, MD, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers 34091297-n

Verkäufer kontaktieren

Neu kaufen

EUR 35,63
Währung umrechnen
Versand: EUR 17,12
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Es gibt 9 weitere Exemplare dieses Buches

Alle Suchergebnisse ansehen