Pourquoi un mode éco ?
Le mode éco a été développé conformément à la stratégie de Piano visant à fournir aux clients la solution analytique la plus avancée, qualitative et éthique, surtout en matière de durabilité.
Grâce au mode éco, nous pouvons continuer à fournir des données non échantillonnées aussi rapidement que possible tout en réduisant les ressources informatiques nécessaires pour les fournir. Cela permet de minimiser ainsi l'impact environnemental de l'utilisation de ces données.
Comment fonctionne le mode éco ?
Le mode éco repose sur une fonction statistique appelée HyperLogLog pour estimer le nombre approximatif de valeurs distinctes dans un ensemble de données.
HyperLogLog est un algorithme d'estimation de cardinalité de pointe capable d'estimer des cardinalités distinctes de trillions de lignes avec une erreur relative moyenne de quelques pour cent.
Vous pouvez en savoir plus sur HyperLogLog et ses nombreuses vertus sur Wikipedia.
Quels sont les avantages du mode éco ?
Lorsqu'il est activé, et grâce à la fonction HyperLogLog décrite ci-dessus (Comment fonctionne le mode éco ?), le mode éco réduit considérablement les ressources informatiques nécessaires pour fournir l'ensemble de données demandé par l'utilisateur de Piano Analytics. Selon des études internes régulièrement surveillées et mises à jour, nous estimons que, pour le même ensemble de données demandé, le mode éco réduit les ressources informatiques en moyenne de 20 %, et cela peut aller jusqu'à 60 %.
-
Environnement
Dans la mesure où le mode éco permet de réduire les ressources informatiques nécessaires pour fournir le même ensemble de données, celui-ci permet de diminuer l'empreinte carbone générée lors de l'utilisation de Piano Analytics.
-
Rapidité
Dans la mesure où le mode éco approxime le nombre de valeurs distinctes dans un ensemble de données, celui-ci permet de réduire le temps nécessaire pour obtenir vos données, surtout en cas de demande d'un grand volume de données ou d'une longue période d'analyse (comparaison d'une année à l'autre, par exemple).
-
Qualité des données
Dans la mesure où le mode éco repose sur un algorithme d'estimation de cardinalité de pointe, il n'y a aucun compromis sur la précision des données, car l'erreur relative moyenne de notre implémentation HyperLogLog est estimée à moins de 2 %.
Comment et quand utiliser le mode éco ?
Le "mode éco" est extrêmement efficace pour compter le nombre de valeurs distinctes dans un ensemble de données. Il est donc particulièrement adapté au traitement de métriques qui reposent sur le comptage de valeurs telles que :
- La métrique "Visiteurs" (nombre de Visitor ID dédupliqués)
- La métrique "Visites" (nombre de Visit ID dédupliqués)
- La métrique "Articles" (nombre d'Article ID dédupliqués)
- Et toutes les métriques qui leur sont liées : taux de rebond, temps passé (visite), etc.
Les métriques qui n'ont pas besoin de déduplication d'éléments ne sont pas approximées et affichent exactement les mêmes valeurs avec ou sans le mode éco. Voici quelques exemples :
- Conversions
- Clics
- Chiffre d'affaires HT ou TTC
Souvenez-vous!
Lorsque le mode éco est activé, seules les métriques éligibles sont calculées selon cette méthodologie.Les autres métriques seront calculées sans approximation, comme elles le seraient lorsque le mode est désactivé.
Avec son impact significatif sur les performances, le mode éco est recommandé pour l'ensemble de la phase exploratoire sur de grands volumes de données (sites à fort volume, périodes d'analyse prolongées, cardinalité importante, etc.). Il vous fera gagner un temps précieux pour identifier des insights tout en réduisant considérablement la consommation d'énergie.
Dans Data Query, vous pourrez désactiver le mode éco pour lancer la requête qui vous permettra d'obtenir des résultats exacts.