Pourquoi les équipes data peinent-elles à tirer tout le potentiel de leurs données ?

Par Nicolas Maillard
Sr Director Field Engineering Central & SEMEA

Le quotidien de nombreuses entreprises data-driven est de constamment s’adapter, innover et pérenniser leurs investissements technologiques pour rester compétitives et réussir. En effet, selon une récente étude du BCG, les entreprises les plus innovantes en 2020 se sont remises de la pandémie plus rapidement que les autres et beaucoup d’entre elles sont plus avancées dans leur parcours data. Cependant, malgré les progrès réalisés, les résultats d’un rapport récent de Databricks et du MIT Technology Review montrent que seulement 13 % des entreprises excellent dans la mise en œuvre de leur stratégie data et que les autres éprouvent des difficultés dans une certaine mesure.

Bon nombre des entreprises en difficulté sont confrontées à des défis similaires, tels qu’une architecture fragmentée, des données en silos et la gestion des systèmes hérités. Les équipes data ont beaucoup à surmonter en même temps, tout en naviguant dans les nouvelles technologies et en suivant le rythme effréné de l’évolution des données et de l’analytique. Il est inquiétant de constater que beaucoup d’entre elles ne semblent pas avoir conscience de tout le potentiel de leurs données. Cela est dû en partie au fait que ces équipes ne sont pas certaines de leurs priorités et ne savent pas exactement comment mettre en place une stratégie data pérenne. Mais pourquoi les équipes data ont-elles tant de mal à y parvenir et que peut-on faire pour les aider ?

Identifier problèmes et priorités

L’étude de Databricks et du MIT a révélé un certain nombre de domaines que les organisations estiment devoir traiter en priorité, notamment l’amélioration de la qualité des données, la formation, le recrutement des bonnes compétences et la démocratisation des données. Selon 48% des Chief Data Officers ayant répondu à l’enquête mondiale, la priorité la plus fréquemment citée est de parvenir à une meilleure gestion des données en améliorant leur qualité et leur traitement, et ainsi permettre à chacun dans l’entreprise de trouver les informations nécessaires pour réussir. La deuxième priorité la plus fréquemment évoquée est une plus large adoption des plateformes cloud, stratégie choisie par les 13 % d’entreprises qui performent. Près des trois quarts d’entre elles exploitent au moins la moitié de leurs services data dans un environnement cloud. La flexibilité du travail dans un tel environnement leur apporte un certain nombre d’avantages substantiels, tels que la réduction des coûts, l’efficacité de la collaboration et l’évolutivité, entre autres.

Dans un environnement cloud, les entreprises peuvent appliquer le machine learning (ML) de manière plus efficace et plus fiable grâce à un accès aux données et à leur traitement plus rapides. Cependant, de nombreuses ont du mal à suivre le rythme d’innovation du marché, ce qui se traduit par un manque d’expertise en ML. La formation et le recrutement des bonnes compétences sont essentiels pour remédier à ce problème et suivre le rythme du changement. Les entreprises doivent rendre leurs collaborateurs autonomes pour lancer des analyses plutôt que d’utiliser celles produites par quelqu’un d’autre. La démocratisation des données doit devenir une priorité permanente. Notamment, si seulement l’équipe data travaille avec les données, celles-ci ne sont utilisées qu’à un faible pourcentage de leur potentiel. En revanche, l’accessibilité des données, indépendamment des connaissances techniques, aidera les équipes à tirer le meilleur de leurs données. Plus l’accès aux données est facile, plus elles seront utilisées et pleinement exploitées. Une démarche active vers une culture data est cruciale et, pour cela, la plateforme de données et les données qu’elle contient doivent être accessibles, comprises et fiables.

 

Utiliser les données grâce à l’ouverture et la simplicité

Ces obstacles ne peuvent être surmontés sans une plateforme analytique moderne, ouverte et flexible, qui permette aux équipes de prendre des décisions plus rapides et plus avisées grâce à une vision cohérente de toutes les données.

Option populaire depuis les années 1980, les data warehouses ont révolutionné le monde des données dans lequel nous vivons. Des outils de business intelligence peuvent y être connectés pour poser des questions sur le passé, mais plus difficilement pour se projeter sur l’avenir. De plus, ils sont restreints en termes de volumes et de formats des données qui peuvent être analysées. Une autre option est celle des data lakes qui, en revanche, permettent d’utiliser l’intelligence artificielle (IA) pour poser des questions sur des scénarios futurs. Cependant, les data lakes ont aussi un point faible : toutes les données peuvent être stockées, nettoyées et analysées, mais peuvent être rapidement désorganisées et devenir des « data swamps ». Une architecture de données émergente appelée lakehouse combine le meilleur des deux options. Elle constitue une avancée technologique qui permet enfin aux entreprises de se tourner à la fois vers des scénarios futurs et vers le passé dans un même espace, tout en révolutionnant l’avenir du potentiel des données. En prenant les meilleurs éléments du data warehouse et du data lake, le lakehouse permet aux entreprises de mettre en œuvre une meilleure stratégie data, de mieux gérer les données et d’en exploiter tout le potentiel.

Un autre point important à ne pas négliger est la simplicité des plateformes de données. Elles doivent être faciles à utiliser et dotées d’une architecture flexible pour répondre facilement aux besoins des entreprises, sans nécessiter de refonte, de restructuration ou de connaissances approfondies en matière de données. La plateforme doit également être ouverte, afin que d’autres fournisseurs s’y intègrent et innovent à partir de ce qui est déjà disponible. Les plateformes ouvertes permettent de nombreuses modifications, ce qui signifie que l’innovation et l’ouverture vont de pair, une vraie nécessité à l’heure actuelle.

L’innovation et le rythme des changements s’accélèrent rapidement en matière de données et d’analytique, si bien que les entreprises et leurs équipes data doivent garder la cadence pour en saisir les vastes opportunités et rester compétitives. Une plateforme de données ouverte et simple offrant des données plus accessibles et faciles à comprendre, composante clé d’une culture data réussie, est essentielle pour que de plus en plus d’entreprises excellent dans la mise en œuvre de leur stratégie data et exploitent tout le potentiel de leurs données.

Leave a Reply