Cleaning Data for Effective Data Science: Doing the other 80% of the work with Python, R, and command-line tools

Mertz, David

ISBN 10: 1801071292 ISBN 13: 9781801071291
Verlag: Packt Publishing, 2021
Neu Softcover

Verkäufer Russell Books, Victoria, BC, Kanada Verkäuferbewertung 4 von 5 Sternen 4 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Heritage Bookseller
AbeBooks-Mitglied seit 1996


Beschreibung

Beschreibung:

Special order direct from the distributor. Bestandsnummer des Verkäufers ING9781801071291

Diesen Artikel melden

Inhaltsangabe:

A comprehensive guide for data scientists to master effective data cleaning tools and techniques

Key Features

  • Think about your data intelligently and ask the right questions
  • Master data cleaning techniques using hands-on examples belonging to diverse domains
  • Work with detailed, commented, well-tested code samples in Python and R

Book Description

In data science, data analysis, or machine learning, most of the effort needed to achieve your actual purpose lies in cleaning your data. Using Python, R, and command-line tools, you will learn the essential cleaning steps performed in every production data science or data analysis pipeline. This book not only teaches you data preparation but also what questions you should ask of your data.

The book dives into the practical application of tools and techniques needed for data ingestion, anomaly detection, value imputation, and feature engineering. It also offers long-form exercises at the end of each chapter to practice the skills acquired.

You will begin by looking at data ingestion of a range of data formats. Moving on, you will impute missing values, detect unreliable data and statistical anomalies, and generate synthetic features that are necessary for successful data analysis and visualization goals.

By the end of this book, you will have acquired a firm understanding of the data cleaning process necessary to perform real-world data science and machine learning tasks.

What you will learn

  • Ingest and work with common tabular, hierarchical, and other data formats
  • Apply useful rules and heuristics for assessing data quality and detecting bias
  • Identify and handle unreliable data and outliers in their many forms
  • Impute sensible values into missing data and use sampling to fix imbalances
  • Generate synthetic features that help to draw out patterns in your data
  • Prepare data competently and correctly for analytic and machine learning tasks

Who this book is for

This book is designed to benefit software developers, data scientists, aspiring data scientists, and students who are interested in data analysis or scientific computing.

Basic familiarity with statistics, general concepts in machine learning, knowledge of a programming language (Python or R), and some exposure to data science are helpful.

The text will also be helpful to intermediate and advanced data scientists who want to improve their rigor in data hygiene and wish for a refresher on data preparation issues.

Table of Contents

  1. Data Ingestion – Tabular Formats
  2. Data Ingestion - Hierarchical Formats
  3. Data Ingestion - Repurposing Data Sources
  4. The Vicissitudes of Error - Anomaly Detection
  5. The Vicissitudes of Error - Data Quality
  6. Rectification and Creation - Value Imputation
  7. Rectification and Creation - Feature Engineering
  8. Ancillary Matters - Closure/Glossary

Über die Autorin bzw. den Autor: David Mertz is the founder of KDM Training, a partnership dedicated to educating developers and data scientists in machine learning and scientific computing. Previously, he created the data science training program for Anaconda Inc. With the advent of deep neural networks he has turned to training our robot overlords as well. He was honored to work for 8 years with D. E. Shaw Research, who have built the world's fastest, highly-specialized, supercomputer for performing molecular dynamics. David was a Director of the PSF for six years, and remains co-chair of its Trademarks Committee and of its Scientific Python Working Group. His columns, Charming Python and XML Matters, written in the 2000s, were the most widely read articles in the Python world. He has written previous books for Packt, O'Reilly and Addison-Wesley, and has given keynote addresses at numerous international programming conferences. Long ago, he earned a doctorate in post-structuralist political philosophy. Fate is a cruel mistress.

„Über diesen Titel“ kann sich auf eine andere Ausgabe dieses Titels beziehen.

Bibliografische Details

Titel: Cleaning Data for Effective Data Science: ...
Verlag: Packt Publishing
Erscheinungsdatum: 2021
Einband: Softcover
Zustand: New

Beste Suchergebnisse bei AbeBooks

Beispielbild für diese ISBN

Mertz, David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Gebraucht paperback

Anbieter: HPB-Red, Dallas, TX, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

paperback. Zustand: Good. Connecting readers with great books since 1972! Used textbooks may not include companion materials such as access codes, etc. May have some wear or writing/highlighting. We ship orders daily and Customer Service is our top priority! Bestandsnummer des Verkäufers S_397191279

Verkäufer kontaktieren

Gebraucht kaufen

EUR 7,02
EUR 3,20 shipping
Versand innerhalb von USA

Anzahl: 1 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz; David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Gebraucht Softcover

Anbieter: GreatBookPrices, Columbia, MD, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: good. May show signs of wear, highlighting, writing, and previous use. This item may be a former library book with typical markings. No guarantee on products that contain supplements Your satisfaction is 100% guaranteed. Twenty-five year bookseller with shipments to over fifty million happy customers. Bestandsnummer des Verkäufers 42642714-5

Verkäufer kontaktieren

Gebraucht kaufen

EUR 30,11
EUR 2,25 shipping
Versand innerhalb von USA

Anzahl: 1 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz, David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Gebraucht Softcover

Anbieter: GreatBookPrices, Columbia, MD, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: As New. Unread book in perfect condition. Bestandsnummer des Verkäufers 42642714

Verkäufer kontaktieren

Gebraucht kaufen

EUR 35,42
EUR 2,25 shipping
Versand innerhalb von USA

Anzahl: 1 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz; David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu Softcover

Anbieter: Lucky's Textbooks, Dallas, TX, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers ABLIING23Mar2912160213002

Verkäufer kontaktieren

Neu kaufen

EUR 38,51
EUR 3,40 shipping
Versand innerhalb von USA

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz; David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu Softcover

Anbieter: GreatBookPrices, Columbia, MD, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers 42642714-n

Verkäufer kontaktieren

Neu kaufen

EUR 38,64
EUR 2,25 shipping
Versand innerhalb von USA

Anzahl: 1 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz, David
Verlag: Packt Publishing 2021-03, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu PF

Anbieter: Chiron Media, Wallingford, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PF. Zustand: New. Bestandsnummer des Verkäufers 6666-IUK-9781801071291

Verkäufer kontaktieren

Neu kaufen

EUR 39,51
EUR 17,79 shipping
Versand von Vereinigtes Königreich nach USA

Anzahl: 10 verfügbar

In den Warenkorb

Foto des Verkäufers

Mertz, David
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu Paperback or Softback

Anbieter: BargainBookStores, Grand Rapids, MI, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Paperback or Softback. Zustand: New. Cleaning Data for Effective Data Science: Doing the other 80% of the work with Python, R, and command-line tools. Book. Bestandsnummer des Verkäufers BBS-9781801071291

Verkäufer kontaktieren

Neu kaufen

EUR 40,96
Versand gratis
Versand innerhalb von USA

Anzahl: 5 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz; David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu Softcover

Anbieter: GreatBookPricesUK, Woodford Green, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers 42642714-n

Verkäufer kontaktieren

Neu kaufen

EUR 42,45
EUR 17,22 shipping
Versand von Vereinigtes Königreich nach USA

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

David Mertz
Verlag: Packt Publishing Limited, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu PAP
Print-on-Demand

Anbieter: PBShop.store UK, Fairford, GLOS, Vereinigtes Königreich

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

PAP. Zustand: New. New Book. Delivered from our UK warehouse in 4 to 14 business days. THIS BOOK IS PRINTED ON DEMAND. Established seller since 2000. Bestandsnummer des Verkäufers L0-9781801071291

Verkäufer kontaktieren

Neu kaufen

EUR 42,64
EUR 3,78 shipping
Versand von Vereinigtes Königreich nach USA

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Beispielbild für diese ISBN

Mertz; David
Verlag: Packt Publishing, 2021
ISBN 10: 1801071292 ISBN 13: 9781801071291
Neu Softcover

Anbieter: California Books, Miami, FL, USA

Verkäuferbewertung 5 von 5 Sternen 5 Sterne, Erfahren Sie mehr über Verkäufer-Bewertungen

Zustand: New. Bestandsnummer des Verkäufers I-9781801071291

Verkäufer kontaktieren

Neu kaufen

EUR 43,03
Versand gratis
Versand innerhalb von USA

Anzahl: Mehr als 20 verfügbar

In den Warenkorb

Es gibt 12 weitere Exemplare dieses Buches

Alle Suchergebnisse ansehen