Verwandte Artikel zu In-Memory Analytics with Apache Arrow: Perform fast...

In-Memory Analytics with Apache Arrow: Perform fast and efficient data analytics on both flat and hierarchical structured data - Softcover

 
9781801071031: In-Memory Analytics with Apache Arrow: Perform fast and efficient data analytics on both flat and hierarchical structured data

Inhaltsangabe

Process tabular data and build high-performance query engines on modern CPUs and GPUs using Apache Arrow, a standardized language-independent memory format, for optimal performance

Key Features

  • Learn about Apache Arrow's data types and interoperability with pandas and Parquet
  • Work with Apache Arrow Flight RPC, Compute, and Dataset APIs to produce and consume tabular data
  • Reviewed, contributed, and supported by Dremio, the co-creator of Apache Arrow

Book Description

Apache Arrow is designed to accelerate analytics and allow the exchange of data across big data systems easily.

In-Memory Analytics with Apache Arrow begins with a quick overview of the Apache Arrow format, before moving on to helping you to understand Arrow’s versatility and benefits as you walk through a variety of real-world use cases. You'll cover key tasks such as enhancing data science workflows with Arrow, using Arrow and Apache Parquet with Apache Spark and Jupyter for better performance and hassle-free data translation, as well as working with Perspective, an open source interactive graphical and tabular analysis tool for browsers. As you advance, you'll explore the different data interchange and storage formats and become well-versed with the relationships between Arrow, Parquet, Feather, Protobuf, Flatbuffers, JSON, and CSV. In addition to understanding the basic structure of the Arrow Flight and Flight SQL protocols, you'll learn about Dremio’s usage of Apache Arrow to enhance SQL analytics and discover how Arrow can be used in web-based browser apps. Finally, you'll get to grips with the upcoming features of Arrow to help you stay ahead of the curve.

By the end of this book, you will have all the building blocks to create useful, efficient, and powerful analytical services and utilities with Apache Arrow.

What you will learn

  • Use Apache Arrow libraries to access data files both locally and in the cloud
  • Understand the zero-copy elements of the Apache Arrow format
  • Improve read performance by memory-mapping files with Apache Arrow
  • Produce or consume Apache Arrow data efficiently using a C API
  • Use the Apache Arrow Compute APIs to perform complex operations
  • Create Arrow Flight servers and clients for transferring data quickly
  • Build the Arrow libraries locally and contribute back to the community

Who this book is for

This book is for developers, data analysts, and data scientists looking to explore the capabilities of Apache Arrow from the ground up. This book will also be useful for any engineers who are working on building utilities for data analytics and query engines, or otherwise working with tabular data, regardless of the programming language. Some familiarity with basic concepts of data analysis will help you to get the most out of this book but isn't required. Code examples are provided in the C++, Go, and Python programming languages.

Table of Contents

  1. Getting Started with Apache Arrow
  2. Working with Key Arrow Specifications
  3. Data Science with Apache Arrow
  4. Format and Memory Handling
  5. Crossing the Language Barrier with the Arrow C Data API
  6. Leveraging the Arrow Compute APIs
  7. Using the Arrow Datasets API
  8. Exploring Apache Arrow Flight RPC
  9. Powered By Apache Arrow
  10. How to Leave Your Mark on Arrow
  11. Future Development and Plans

Die Inhaltsangabe kann sich auf eine andere Ausgabe dieses Titels beziehen.

Über die Autorin bzw. den Autor

Matthew Topol is a member of the Apache Arrow Project Management Committee (PMC) and a staff software engineer at Voltron Data, Inc. Matt has worked in infrastructure, application development, and large-scale distributed system analytical processing for financial data. At Voltron Data, Matt's primary responsibilities have been working on and enhancing the Apache Arrow libraries and associated sub-projects. In his spare time, Matt likes to bash his head against a keyboard, develop and run delightfully demented fantasy games for his victims-er-friends, and share his knowledge and experience with anyone interested enough to listen.

„Über diesen Titel“ kann sich auf eine andere Ausgabe dieses Titels beziehen.

  • VerlagPackt Publishing
  • Erscheinungsdatum2022
  • ISBN 10 1801071039
  • ISBN 13 9781801071031
  • EinbandTapa blanda
  • SpracheEnglisch
  • Anzahl der Seiten392
  • Kontakt zum HerstellerNicht verfügbar

Gebraucht kaufen

Zustand: Gut
Zustand: Gut | Seiten: 392 | Sprache...
Diesen Artikel anzeigen

Gratis für den Versand innerhalb von/der Deutschland

Versandziele, Kosten & Dauer

EUR 4,56 für den Versand von Vereinigtes Königreich nach Deutschland

Versandziele, Kosten & Dauer

Suchergebnisse für In-Memory Analytics with Apache Arrow: Perform fast...

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Gebraucht Softcover

Anbieter: Buchpark, Trebbin, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: Gut. Zustand: Gut | Seiten: 392 | Sprache: Englisch | Produktart: Bücher. Bestandsnummer des Verkäufers 38978414/3

Verkäufer kontaktieren

Gebraucht kaufen

EUR 27,53
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: 1 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing Limited, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu PAP
Print-on-Demand

Anbieter: PBShop.store UK, Fairford, GLOS, Vereinigtes Königreich

Verkäuferbewertung 4 von 5 Sternen 4 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PAP. Zustand: New. New Book. Delivered from our UK warehouse in 4 to 14 business days. THIS BOOK IS PRINTED ON DEMAND. Established seller since 2000. Bestandsnummer des Verkäufers L0-9781801071031

Verkäufer kontaktieren

Neu kaufen

EUR 67,37
Währung umrechnen
Versand: EUR 4,56
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu Softcover

Anbieter: California Books, Miami, FL, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers I-9781801071031

Verkäufer kontaktieren

Neu kaufen

EUR 63,31
Währung umrechnen
Versand: EUR 8,66
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu Softcover

Anbieter: Ria Christie Collections, Uxbridge, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. In. Bestandsnummer des Verkäufers ria9781801071031_new

Verkäufer kontaktieren

Neu kaufen

EUR 66,58
Währung umrechnen
Versand: EUR 5,85
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing Limited, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu PAP
Print-on-Demand

Anbieter: PBShop.store US, Wood Dale, IL, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PAP. Zustand: New. New Book. Shipped from UK. THIS BOOK IS PRINTED ON DEMAND. Established seller since 2000. Bestandsnummer des Verkäufers L0-9781801071031

Verkäufer kontaktieren

Neu kaufen

EUR 72,42
Währung umrechnen
Versand: EUR 0,83
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Topol, Matthew
Verlag: Packt Publishing 2022-06, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu PF

Anbieter: Chiron Media, Wallingford, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PF. Zustand: New. Bestandsnummer des Verkäufers 6666-IUK-9781801071031

Verkäufer kontaktieren

Neu kaufen

EUR 63,74
Währung umrechnen
Versand: EUR 15,27
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: 10 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing Limited, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu Paperback / softback
Print-on-Demand

Anbieter: THE SAINT BOOKSTORE, Southport, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback / softback. Zustand: New. This item is printed on demand. New copy - Usually dispatched within 5-9 working days 100. Bestandsnummer des Verkäufers C9781801071031

Verkäufer kontaktieren

Neu kaufen

EUR 75,24
Währung umrechnen
Versand: EUR 4,41
Von Vereinigtes Königreich nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Foto des Verkäufers

Matthew Topol
Verlag: Packt Publishing, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu Taschenbuch
Print-on-Demand

Anbieter: AHA-BUCH GmbH, Einbeck, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Taschenbuch. Zustand: Neu. nach der Bestellung gedruckt Neuware - Printed after ordering - Process tabular data and build high-performance query engines on modern CPUs and GPUs using Apache Arrow, a standardized language-independent memory format, for optimal performanceKey Features: Learn about Apache Arrow's data types and interoperability with pandas and Parquet Work with Apache Arrow Flight RPC, Compute, and Dataset APIs to produce and consume tabular data Reviewed, contributed, and supported by Dremio, the co-creator of Apache ArrowBook Description:Apache Arrow is designed to accelerate analytics and allow the exchange of data across big data systems easily.In-Memory Analytics with Apache Arrow begins with a quick overview of the Apache Arrow format, before moving on to helping you to understand Arrow's versatility and benefits as you walk through a variety of real-world use cases. You'll cover key tasks such as enhancing data science workflows with Arrow, using Arrow and Apache Parquet with Apache Spark and Jupyter for better performance and hassle-free data translation, as well as working with Perspective, an open source interactive graphical and tabular analysis tool for browsers. As you advance, you'll explore the different data interchange and storage formats and become well-versed with the relationships between Arrow, Parquet, Feather, Protobuf, Flatbuffers, JSON, and CSV. In addition to understanding the basic structure of the Arrow Flight and Flight SQL protocols, you'll learn about Dremio's usage of Apache Arrow to enhance SQL analytics and discover how Arrow can be used in web-based browser apps. Finally, you'll get to grips with the upcoming features of Arrow to help you stay ahead of the curve.By the end of this book, you will have all the building blocks to create useful, efficient, and powerful analytical services and utilities with Apache Arrow.What You Will Learn: Use Apache Arrow libraries to access data files both locally and in the cloud Understand the zero-copy elements of the Apache Arrow format Improve read performance by memory-mapping files with Apache Arrow Produce or consume Apache Arrow data efficiently using a C API Use the Apache Arrow Compute APIs to perform complex operations Create Arrow Flight servers and clients for transferring data quickly Build the Arrow libraries locally and contribute back to the communityWho this book is for:This book is for developers, data analysts, and data scientists looking to explore the capabilities of Apache Arrow from the ground up. This book will also be useful for any engineers who are working on building utilities for data analytics and query engines, or otherwise working with tabular data, regardless of the programming language. Some familiarity with basic concepts of data analysis will help you to get the most out of this book but isn't required. Code examples are provided in the C++, Go, and Python programming languages.Table of Contents Getting Started with Apache Arrow Working with Key Arrow Specifications Data Science with Apache Arrow Format and Memory Handling Crossing the Language Barrier with the Arrow C Data API Leveraging the Arrow Compute APIs Using the Arrow Datasets API Exploring Apache Arrow Flight RPC Powered By Apache Arrow How to Leave Your Mark on Arrow Future Development and Plans. Bestandsnummer des Verkäufers 9781801071031

Verkäufer kontaktieren

Neu kaufen

EUR 89,06
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: 1 verfügbar

In den Warenkorb

Foto des Verkäufers

Topol, Matthew
Verlag: Packt Publishing, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu Softcover
Print-on-Demand

Anbieter: moluna, Greven, Deutschland

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Dieser Artikel ist ein Print on Demand Artikel und wird nach Ihrer Bestellung fuer Sie gedruckt. &Uumlber den AutorrnrnMatthew Topol is an Apache Arrow contributor and a principal software architect at FactSet Research Systems, Inc. Since joining FactSet in 2009, Matt has worked in both infrastructure and application development, led devel. Bestandsnummer des Verkäufers 615093228

Verkäufer kontaktieren

Neu kaufen

EUR 112,10
Währung umrechnen
Versand: Gratis
Innerhalb Deutschlands
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Matthew Topol
Verlag: Packt Publishing, 2022
ISBN 10: 1801071039 ISBN 13: 9781801071031
Neu Softcover

Anbieter: Lucky's Textbooks, Dallas, TX, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers ABLIING23Mar2912160212999

Verkäufer kontaktieren

Neu kaufen

EUR 56,06
Währung umrechnen
Versand: EUR 64,93
Von USA nach Deutschland
Versandziele, Kosten & Dauer

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Es gibt 1 weitere Exemplare dieses Buches

Alle Suchergebnisse ansehen