Draw Data: créer facilement des ensembles de données synthétiques¶
Avez-vous déjà souhaité pouvoir générer sans effort un ensemble de données en dessinant visuellement des points sur un plan cartésien? Découvrez Draw Data, une application Python pratique conçue pour les bloc-notes Jupyter. Cet outil vous permet de créer des ensembles de données jouets ou synthétiques en dessinant simplement vos idées directement sur le graphique. Cela s’avère particulièrement utile lors de l’enseignement d’algorithmes d’apprentissage automatique.
Installation:¶
%%capture
! pip install -U drawdata
Commencer:¶
Pour dessiner un ensemble de données, exécutez la cellule suivante. Vous pouvez esquisser jusqu'à quatre classes de points. Ensuite, cliquez sur « Copier CSV » et vos points de données, présentés sous forme de valeurs x, y, z séparées par des virgules, seront copiés dans le presse-papiers. Pour importer les données dans un Pandas DataFrame, utilisez le code suivant:
from drawdata import draw_scatter
draw_scatter()
Affichage du tableau de données:¶
Une fois que vous avez terminé votre dessin, copiez les données dans le presse-papiers. L'étape suivante consiste à utiliser Pandas pour lire le presse-papiers et remplir un DataFrame. Voici un aperçu des premières entrées:
import pandas as pd
# Lecture du presse-papier dans un DataFrame
df = pd.read_clipboard(sep=",")
df
Tracer les données dessinées:¶
Visualiser les points dessinés devient un jeu d'enfant avec Plotly, qui fournit un graphique interactif. L'extrait de code suivant accomplit cela:
import plotly.express as px
import plotly
plotly.offline.init_notebook_mode(connected=True)
# Creating an interactive scatter plot
fig = px.scatter(df, x='x', y='y', color='z')
fig.update_layout(
autosize=False,
width=800,
height=800,
)
fig.show()
Ce guide complet vous permet de dessiner, d'analyser et de visualiser de manière transparente votre ensemble de données synthétiques, rendant ainsi le processus d'enseignement des concepts d'apprentissage automatique plus intuitif et engageant.