Par Charles Saulnier, Conseiller, Analytique des données
Dans le premier billet de cette série sur la visualisation de données: L’analytique par la visualisation de données, le Data Viz, vous connaissez? Nous avons présenté une définition de celle-ci et des raisons qui en font un sujet très actuel.
Aujourd’hui, nous allons faire un survol des théories liées à la conception de tableaux de bord et à la visualisation de données avec des exemples. Dans un billet subséquent, nous ferons l’inverse. Nous présenterons des exemples de visualisation discutables et des pistes d’amélioration.
Voici donc 5 bonnes pratiques que toutes et tous selon moi, devraient mettre en pratique :
Orienter la conception sur l’utilisateur
Contextualiser les données
S’appuyer sur Gestalt et les attributs préattentifs pour orienter le lecteur vers l’information qui nous (les) intéresse
Identifier le graphique le mieux adapté au type de données à présenter
Connaître les forces et les limites de l’outil de reporting utilisé
Orienter la conception sur l’utilisateur
C’est un aspect incontournable. L’environnement de travail du client, de même que le médium utilisé pour consulter le tableau, graphique, tableau de bord ou « scorecard » auront un impact sur les choix à faire durant leur développement. Voici quelques aspects à considérer :
Le principal média sur lequel l’information sera diffusée :
- Téléviseurs/ordinateurs de table/écrans de 20 ’’ et plus de diagonale : espace optimal,
- Portables 13-15’’ de diagonale : pixellisation plus fine, moins d’espace viable pour le tableau de bord,
- Tablettes : la quantité d’information doit être plus limitée et agrégée, mais les tablettes offrent de plus grandes opportunités d’interactivité similaires aux applications habituelles,
- Téléphones : conserver l’information essentielle, utiliser des graphiques optimisant l’espace disponible.
L’usager est-il en déplacement ?
- Peut-il mettre à jour les données de façon sécuritaire, ou doit-il extraire les données avant son déplacement,
- Prendre en compte que l’attention de l’usager est plus limitée, donc allez à l’essentiel !
Est-il dans un environnement calme, ou est-il « dérangé » par un ensemble d’autres stimuli ?
- Si l’environnement est chargé (ex. salle de trading), laissez tomber l’information secondaire.
- Plus de stimuli = utilisez des visuels épurés en raison de l’attention limitée par l’environnement.
Le tableau de bord est-il partagé, ou unique à l’usager ? Cela affectera le degré de personnalisation du tableau de bord.
Contextualiser les données
Un chiffre ou un graphique seul est une invitation à de multiples interprétations. Pour orienter le lecteur et appuyer notre propos, nous pouvons utiliser du texte, des valeurs de comparaison, ou une évolution pour rendre l’information affichée significative. Par exemple, pour présenter des résultats de ventes, on peut donner le chiffre :
… mais il devient beaucoup plus significatif si on le présente par comparaison aux autres années, avec un titre plus clair :
S’appuyer sur Gestalt et les attributs préattentifs pour orienter le lecteur vers l’information qui nous (les) intéresse
Disposition du texte
Afin de rendre nos visualisations plus accessibles, il faut s’attarder à quelques considérations quant au texte, notamment sa taille, le type de police, la proximité des données liées et l’orientation.
Le titre nous résume rapidement ce que présente le graphique; les ventes sont classées en ordre décroissant par catégorie, et le texte des axes est dans le sens habituel de lecture, avec le libellé près des barres de données. Ainsi, il est beaucoup plus facile d’interpréter les données. La police utilisée (Segoe UI) est une police Sans Serif à largeur de caractères variable, ce que plusieurs auteurs recommandent particulièrement pour la consultation à l’écran. Cette phrase est par contre rédigée avec une police Serif (High Tower Text) à largeur de caractères fixe, ce qui demande un peu plus d’effort au lecteur et occupe davantage d’espace sur notre canevas.
Palette de couleurs
Dans l’exemple précédent, le premier graphique affichait un éventail de couleurs qui n’apportait aucune valeur ajoutée à l’interprétation des données. En utilisant des contrastes et des couleurs liées au sujet, nous pouvons faciliter la compréhension et orienter l’attention du lecteur vers ce qui nous intéresse.
Comparons ici une table surlignée (heatmap) et une table où le contraste est appliqué au texte directement (ces visuels sont utilisés pour appuyer le propos, d’autres types seraient certainement appropriés pour les données affichées) :
Attention ! Si votre auditoire contient des gens souffrant de dyschromatopsie (daltonisme ou autres), les couleurs ci-dessus ne seront pas perçues de la même façon :
Texte contrasté :
Les utilisateurs d’Excel et autres chiffriers sont habitués à voir les valeurs négatives en rouge (ou autres couleurs vives), et les valeurs positives en noir, ce qui démontre que ce choix est pertinent.
Identifier le graphique le mieux adapté au type de données à présenter
Pourcentage d’un total
Non aux pie charts !! Blague à part, tout dépend du nombre de catégories et de l’élément à surligner: la part de chaque élément, l’écart entre des éléments spécifiques …
Voici un exemple pour représenter la part des buts marqués des joueurs de votre équipe locale :
On voit donc ici que Brendan Gallagher a marqué à lui seul près de 15% des buts de l’équipe. Par contre, il n’est pas possible de voir à quoi ce 100% correspond en termes de nombre total de buts marqués par l’équipe. On pourrait dans ce cas opter pour un graphique empilé, bien qu’il soit plus difficile d’y comparer les joueurs entre eux :
J’ai fait le choix dans le graphique ci-dessus d’utiliser deux attributs pour distinguer les valeurs, outre le texte: la taille des sections, et une échelle de couleur. En fonction du contexte (graphique seul, au sein d’un tableau de bord, contraintes corporatives, etc.), la différence de taille aurait pu suffire. L’avantage de l’échelle de couleurs, dans le cas présent, est la coupure nette entre le meilleur marqueur et les autres joueurs de l’équipe.
Données temporelles
Les graphiques à lignes (time series) sont idéaux pour présenter une évolution dans le temps. Par exemple, pour suivre l’évolution d’un placement :
Données catégorisées
Les graphiques à barres, surtout présentés à l’horizontale, offrent une vue claire sur les données présentées, et sont faciles à lire et interpréter :
Nous pouvons aisément voir les ventes par sous-catégorie, et le total de la catégorie avec le graphique ci-dessus.
Dans un contexte de visualisation, l’interprétation peut prendre diverses formes, telles que la comparaison de valeurs, la classification ou hiérarchie de catégories, la distribution des données d’un échantillon, la corrélation entre des variables ou même les liens au sein d’un réseau social ou d’un organigramme.
Atteinte d’objectifs
Les bullet graphs sont une option incontournable lorsque le graphique s’inscrit dans un tableau de bord, compte tenu de son rapport information/espace occupé :
Ainsi nous présentons la valeur réelle, la cible, et une échelle qualitative de performance au sein du même graphique.
Pour la comparaison avec une notion d’évolution relative dans le temps, un graphique à lignes de type sparkline est aussi approprié. Voici un exemple de rendement relatif au marché sous cette forme :
Ce type de graphique donne une idée de la tendance générale, pour des cas où nous n’avons pas à savoir les valeurs précises. Une combinaison des deux graphiques précédents est souvent très utile pour avoir la situation actuelle et historique d’un coup d’œil :
Distribution
Pour l’analyse exploratoire de données, des histogrammes ou des graphiques de densité permettent d’avoir un aperçu de la distribution des valeurs d’un ensemble de données en un coup d’œil :
Le graphique ci-dessus nous montre que les données présentent 2 pics de fréquence: de 0 à 5$/pc, et de 10 à 30$/pc, où se situe la majorité des valeurs.
Pour les utilisateurs de Python, la bibliothèque Seaborn contient plusieurs fonctions pour produire rapidement ces graphiques (tel l’exemple ci-dessus). Des outils tels Tableau Desktop et Power BI Desktop permettent maintenant d’exécuter des scripts R et Python sans interface externe.
Connaître les forces et les limites de l’outil de reporting utilisé
Peu importe la technologie utilisée, il y aura toujours des cas où notre visuel idéal n’est pas possible à produire avec les outils à notre disposition. Il faut alors trouver le meilleur compromis avec les contraintes auxquelles nous sommes confrontées. Voici une liste non exhaustive de considérations :
Outils libre-service tels Excel, Tableau et Power BI :
- Faciles à utiliser avec un minimum de pratique.
- Offrent certaines fonctions de préparation et nettoyage de données.
- Ont une bibliothèque de visualisations déjà disponible.
- Possèdent un large éventail de connecteurs.
- Ont certaines contraintes de formatage.
- N’offrent pas les mêmes fonctionnalités selon la source de données utilisée et le mode de connexion (importation ou connexion directe).
Programmation via JavaScript, R, Python :
- Requièrent des connaissances en programmation.
- Pas toujours simples à intégrer à l’environnement de reporting “entreprise”.
- Scripts plus complexes pour offrir une interactivité proche des outils libre-service.
- Possèdent plusieurs bibliothèques de fonctions et méthodes paramétrables dédiées à la visualisation.
- Offrent un contrôle quasi complet sur le formatage des visualisations.
- Offrent une grande flexibilité de préparation de données.
En résumé, ce billet a présenté 5 bonnes pratiques pour la conception de visualisations: orienter la conception sur l’utilisateur, contextualiser les données, utiliser les principes de Gestalt de perception pour capter et orienter l’attention, choisir le bon visuel selon le type de données, et enfin, connaître les forces et limites des outils à notre disposition. J’espère que les exemples présentés sauront vous inspirer !
Références :
FEW, Stephen. 2013. Information Dashboards: Displaying data for at-a-glance monitoring. Burlingame: Analytics Press.
NUSSBAUMER KNAFLIC, Cole. 2015. Storytelling withData: a data visualization guide for business professionals. Hoboken: John Wiley & Sons, Inc.
https://fr.wikipedia.org/wiki/Daltonisme
https://en.wikipedia.org/wiki/Principles_of_grouping