Par Charles Saulnier, Conseiller, Analytique des données
Les clients de Tableau Desktop attendaient depuis longtemps un outil leur permettant d’effectuer (presque) toute leur préparation de données sans avoir besoin de l’intervention d’un développeur ni d’outils tiers. C’est maintenant chose faite avec la mise en marché de Tableau Prep annoncée le 24 avril dernier par Tableau.
Tableau est un chef de file de la visualisation de données (DataViz) et du reporting libre-service. Les produits de la suite Tableau Software se situent habituellement au bout de la chaîne de consommation des données (analyse visuelle et création de rapports et tableaux de bord). L’extraction et la modélisation de données, sur lesquelles reposent toutes solutions BI dont font partie Tableau Desktop et Tableau Server, devaient jusqu’à présent absolument se faire via un ou des logiciels tiers. Avec l’essor d’un concurrent tel Power BI de Microsoft, Tableau réplique en ajoutant un module de préparation de données à sa suite.
Ce produit bonifie énormément l’offre propriétaire de Tableau au niveau de la préparation de données. Son interface est visuelle et intuitive, particulièrement pour les utilisateurs de Tableau Desktop, SQL Server Integration Services et Alteryx. Autre atout: Tableau Prep décuple l’autonomie des super-utilisateurs ayant accès à un environnement libre-service grâce à un éventail de fonctions de nettoyage, union, jointure et agrégation à partir d’une ou plusieurs sources de données.
L’interface de travail de Tableau Prep se compose de 5 sections: connexion (A), flux (B), profilage (C), grille de données (D) et liste des modifications apportées à chaque étape (E).
À mon avis, l’aspect le plus intéressant du produit est la fenêtre de profilage, qui permet d’avoir une vue d’ensemble (échantillonnée ou non) sur les données et leur qualité. En effet, c’est ce qui manque souvent lorsque l’on n’a pas accès à un outil dédié comme Talend ou Data Quality Services.
Comme il s’agit de la première version du produit, il reste quelques éléments à ajouter pour en faire un produit d’ETL complet. Il est certain que son attractivité est réduite auprès d’équipes disposant déjà d’outils ETL et de profilage de données. L’autre aspect qui ferait de Tableau Prep un incontournable serait l’ajout de fonctionnalités d’actualisation des sources ou de planification d’exécution des flux créés. En ce moment, l’exécution du flux ne peut se faire que directement dans l’outil. Enfin, les modifications effectuées (ex. champs calculés) dans Tableau Desktop ne peuvent pas être sauvegardées vers le flux Tableau Prep.
Ce produit fait partie de la suite Tableau, mais n’est pas intégré à Tableau Desktop. Il faut se procurer une licence après la période d’évaluation, exception faite des utilisateurs avec licence et contrat de service Tableau Desktop/Server, qui y ont accès gratuitement pendant 2 ans.
Quelques cas d’utilisation pour Tableau Prep :
- Super-utilisateur dans un contexte libre-service sans possibilité d’effectuer des modifications à la source, ou ayant à en effectuer hors du cycle régulier de priorisation/livraison;
- Équipe TI n’ayant pas d’outils ETL dédiés tels SSIS, ou n’ayant pas de droits de modification sur les sources;
- Environnement Tableau Server constitué principalement de sources de type fichier ou extraits
Nous couvrirons plus en détail l’utilisation de cet outil dans un article subséquent.
En conclusion, l’addition de Tableau Prep à la suite Tableau Software en fait (presque) une solution BI complète, de l’extraction des données jusqu’à la consommation de rapports et tableaux de bord. Cela comble la principale lacune que Tableau Desktop pouvait avoir face à Power BI en termes de préparation de données. Afin d’améliorer l’expérience utilisateur, il serait souhaitable que dans un avenir rapproché, la communication entre Tableau Prep, Tableau Desktop et Tableau Server devienne bidirectionnelle, c’est-à-dire que les flux créés dans Tableau Prep puissent être lancés de Desktop ou Server, afin d’avoir un meilleur contrôle sur l’actualisation des données. Enfin, l’ajout d’un volet visuel de modélisation (tel que celui de Power Pivot ou Power BI) constituerait une autre amélioration notable. À suivre …