PyGWalker: simplifier l'analyse exploratoire des données avec Python¶
Présentation de PyGWalker, une bibliothèque Python conçue pour rationaliser vos tâches d'analyse exploratoire de données (EDA) et de visualisation dans bloc-notes Jupyter. Conçu pour les statisticiens nationaux familiers avec Excel et Power BI, PyGWalker transforme votre dataframe pandas (et dataframe polaires) en une interface utilisateur intuitive de style Tableau, améliorant ainsi votre expérience d'exploration de données.
Qu'est-ce que PyGWalker?¶
PyGWalker, affectueusement prononcé comme « Pig Walker », est l'abréviation de « liaison Python de Graphic Walker ». Il s'intègre parfaitement aux bloc-notes Jupyter, fournissant ainsi un pont vers Graphic Walker, une alternative open source à Tableau. Cette bibliothèque permet aux data scientists d'analyser et de visualiser les données sans effort grâce à des opérations simples de glisser-déposer.
Principales caractéristiques:¶
- Interface de style Tableau: profitez d'une interface utilisateur familière de style Tableau pour l'exploration visuelle sans quitter l'environnement Jupyter.
- Fonctionnalité glisser-déposer: simplifiez votre flux de travail grâce à des opérations intuitives de glisser-déposer, facilitant ainsi l'exploration des données.
- Interface utilisateur conversationnelle: participez à l'exploration de données conversationnelles via une interface conviviale.
Installation:¶
Pour démarrer avec PyGWalker, installez la bibliothèque ainsi que les autres dépendances nécessaires à l'aide de la commande suivante:
%%capture
! pip install -U pygwalker ydata-profiling ipywidgets
Exemple d'utilisation:¶
Passons maintenant à un exemple pratique utilisant un ensemble de données. Dans ce cas, nous exploiterons un ensemble de données Pokémon disponible en ligne:
import pandas as pd
import pygwalker as pyg
from ydata_profiling.utils.cache import cache_file
# Mise en cache de l'ensemble de données Pokémon à partir d'une source distante
file_name = cache_file(
"pokemon.csv",
"https://raw.githubusercontent.com/bryanpaget/html/main/pokemon.csv"
)
# Lecture de l'ensemble de données dans un Pandas DataFrame
pokemon_df = pd.read_csv(file_name)
# Lancement de PyGWalker pour l'exploration visuelle
pyg.walk(pokemon_df)
Avec PyGWalker, transformez sans effort vos données en applications de visualisation interactive en utilisant une seule ligne de code. Que vous soyez habitué à Excel ou Power BI, PyGWalker offre une solution transparente et efficace pour explorer et comprendre vos ensembles de données dans l'environnement Jupyter Notebook.