Przetwarzanie pokaźnych ilości informacji daje wiedzę, która leży u podstaw znacznych decyzji podejmowanych poprzez organizację. Pozwala to na uzyskiwanie znakomitych efektów: techniki wyciągania wiedzy z informacji stają się coraz bardziej wyrafinowane. Podstawowym warunkiem sukcesu jest uzyskanie stosownej jakości danych. Wykorzystanie niespójnych i niepełnych danych prowadzi do podejmowania błędnych decyzji. Rezultatem mogą być straty finansowe, stwarzanie solidnych zagrożeń czy uszczerbek na wizerunku. A zatem oczyszczanie jest wyjątkowo ważną częścią analizy danych.
Ta książka jest funkcjonalnym zbiorem gotowych do zastosowania receptur, podanych tak, aby maksymalnie ułatwić proces przygotowania informacji do analizy. Omówiono tu takie kwestie dotyczące informacji jak importowanie, ocena ich jakości, dopełnianie braków, porządkowanie i agregacja, a także przekształcanie. Poza zwięzłym omówieniem tych zadań zaprezentowano najskuteczniejsze techniki ich realizowania przy pomocy przeróżnych narzędzi: Pandas, NumPy, Matplotlib czy SciPy. W ramach każdej receptury wyjaśniono skutki podjętych działań. Cennym uzupełnieniem jest zestaw funkcji i klas zdefiniowanych przez użytkownika, które służą do automatyzacji oczyszczania informacji. Zezwalają na one także dostrojenie procesu do mocnych potrzeb.
Tytuł Czyszczenie danych w Pythonie. Receptury. Postępowe techniki i narzędzia Pythona do wykrywania i eliminacji , a także wyciągania kluczowych cech z informacji Autor Michael Walker Wydawnictwo Helion EAN 9788328380295 ISBN 9788328380295 Kategoria Nauka i technologia\Informatyka ilość stron 328 Rok wydania 2021 Oprawa Miękka Wydanie 1