7 min de lecture

Trouver et utiliser les données pertinentes — 6 éléments à prendre en compte

Featured Image

Recherchez n’importe quelle publication relative aux données et vous serez bientôt submergé par des rapports sur les promesses de la nouvelle ère des données, des techniques permettant de construire un meilleur moteur de recherche de données ou d’intégrer de nouveaux gadgets logiciels de données, ainsi que des infographiques et visualisations suggérant les types d’informations que vous pouvez obtenir en utilisant le bon amalgame de techniques.

Vous l’avez compris. Le secteur des mégadonnées est vaste. Très vaste. En 2021, 79 zettaoctets de données ont été générés dans le monde. En 2025, il est prévu que ce chiffre passera à plus de 150 zettaoctets de données à analyser. C’est d’une taille de sept séries de trois zéros.

Ceci transformera également les processus d’affaires dans tous les domaines. Le marché de l’analyse des mégadonnées devrait atteindre 103 milliards de dollars d’ici 2023. 97,2 % seront investies dans le secteur des mégadonnées ainsi que dans l’intelligence artificielle, l’apprentissage automatique et d’autres applications pour les aider à donner un sens aux masses de données qu’elles produisent chaque jour. Peu importe qui elles sont ou ce qu’elles font — on attend de plus en plus de chaque organisation qu’elle tire parti des données, quels que soient sa taille, sa mission ou son budget. Les mesures axées sur les données sont désormais la norme, surtout si une organisation veut démontrer sa valeur aux décideurs et aux investisseurs extérieurs.

Avec des ressources limitées, que peuvent faire les petites et moyennes entreprises, les services publics disposant d’un budget limité et les organisations à but non lucratif avec les données ? Comment choisir une approche qui offre la bonne combinaison de données et d’outils pour fournir des informations pertinentes pour votre organisation ? Et d’où viendront les données ?

Trouver les données spécifiques et pertinentes dont vous avez besoin, sans parler de les préparer à être utilisées avec les différents outils et technologies qui vous intéressent, peut devenir rapidement très coûteux si vous ne faites pas attention.

Mais ne désespérez pas ! Il existe des moyens de transformer votre façon de travailler sans ruiner ni vous ni votre organisation. Veillez simplement à prendre en compte les éléments suivants AVANT d’investir du temps ou de l’argent dans une série particulière d’outils et d’ensembles de données :

1. Réfléchissez à ce que vous devez mesurer avec vos données

Pour de nombreuses organisations, il n’est pas facile d’établir des types de mesures fournissant des informations ou racontant un récit fondé sur les données que leurs décideurs ont besoin d’entendre. Certes, les réseaux informatiques et les moteurs d’analyse peuvent produire des chiffres, des lignes de tendance, des pourcentages et d’autres rapports statistiques selon les besoins. Mais qu’est-ce qui importe vraiment dans ces chiffres ? L’élaboration de mesures compatibles avec des approches fondées sur les données est un défi tant sur le plan des connaissances que sur le plan technique. Il s’agit de comprendre ce qu’il est important de capturer dans les données, de savoir quels types de mesures vous pouvez obtenir à partir de différentes combinaisons de sources de données et d’outils d’analyse, et de construire des plates-formes système qui les soutiendront.

Les meilleures mesures seront conçues en collaboration avec les membres des équipes techniques et opérationnelles de votre organisation et tiendront compte de la connaissance et de la compréhension tacites du fonctionnement réel des processus opérationnels dans votre organisation. Ils mesureront la bonne combinaison de performance, d’efficacité, de convivialité et d’impact, qu’ils soient basés sur des fonctions techniques, financières ou opérationnelles. Et ils seront fondés sur la compréhension des données que vous pouvez obtenir, des résultats et des informations que différentes combinaisons d’outils peuvent donner, et de l’impact sur les utilisateurs qui fournissent et ceux qui reçoivent vos produits et services.

2. Assurez-vous que les membres de votre équipe comprennent ce que les différents membres entendent par « données »

Les données et leur signification font l’objet de nombreuses suppositions. Le personnel ayant des connaissances techniques et mathématiques pensera probablement aux données en fonction de leur degré d’automatisation, et si le contenu des champs d’une base de données ou d’une feuille de calcul peut être manipulé de manière computationnelle par vos systèmes informatiques pour effectuer des tâches multiples et automatisées. Le personnel ayant des connaissances opérationnelles et analytiques considérera probablement les données comme des éléments d’information, qu’il s’agisse d’interactions avec d’autres personnes ou d’observations de celles-ci, de clips audio ou vidéo, d’images, de mots sur une page ou de chiffres dans une feuille de calcul. Il s’agit d’informations qu’ils peuvent rechercher, collecter, traiter et analyser avec leur propre cerveau en utilisant les cadres, les méthodologies et les enseignements qu’ils ont appris dans leur pratique professionnelle et leur formation. Beaucoup d’entre eux ne savent pas que les ordinateurs traitent les données de manière beaucoup plus simple et que les données doivent être décomposées en 1 et 0 avant de pouvoir être traitées.

Les cadres fondamentalement différents que les personnes de votre organisation utilisent pour comprendre les données peuvent entraîner une grande confusion quant aux approches axées sur les données qui peuvent convenir à votre processus d’affaires. Mais vous avez besoin d’une compréhension technique, opérationnelle et analytique des données, ainsi que de la perspective des décideurs, si vous voulez tirer pleinement parti de toute approche. Et vous devrez également comprendre ce qui est faisable maintenant et ce qui prendra du temps à développer à l’avenir.

À cette fin, il est important que chaque membre de votre organisation comprenne les forces et les limites des données selon différents points de vue et utilise ces informations pour déterminer ce que vous devez faire maintenant, compte tenu de votre budget et de vos ressources, et ce que vous pouvez prévoir mettre en œuvre ultérieurement.

3. Réfléchissez à la manière dont vous utilisez déjà les données dans votre organisation

Il ne fait aucun doute que vous utilisez déjà des données et que vous avez développé une série de techniques et de méthodologies pour capturer, analyser et transformer ces données en informations. Certains de vos processus et les données qui les soutiennent sont probablement bien documentés, nettoyés et prêts à être ingérés dans le système de votre organisation. D’autres nécessitent probablement un nettoyage important, ou des entrées manuelles, et peuvent nécessiter une réflexion plus approfondie sur la façon de les formaliser et de mieux les intégrer dans votre approche. Mais qu’ils soient prêts à être intégrés ou non, cet ensemble de données, de sources de données et de techniques déjà utilisées par les systèmes et les personnes de votre organisation représentera probablement 85 à 90 % des données sources que vous devrez transformer dans votre nouveau processus axé sur les données.

Comprendre ce dont vous disposez déjà — y compris les parties de votre processus de données qui peuvent être entièrement ou partiellement automatisées, là où vous aurez besoin d’interventions humaines pour la prise de décisions de haut niveau, et là où vous avez des écarts en matière de données — vous aidera grandement à déterminer ce que vous pouvez déjà exploiter dans un processus axé sur les données avant d’investir.

4. Réfléchissez aux autres données qui pourraient exister et que vous pourriez obtenir pour combler les écarts

Des milliers de portails de données ouverts, de services d’abonnement et de sources de données propriétaires sont à votre disposition. Mais le nombre de sources de données pertinentes pour votre domaine, et a fortiori pour une fonction ou un projet spécifique, sera sans aucun doute limité. Et selon le type de données dont vous avez besoin, vous constaterez probablement qu’une grande partie des données dont vous avez réellement besoin pour prendre des décisions devront être traitées avant de pouvoir être utilisées avec vos outils.

Si vous cherchez à tirer parti des données ouvertes financées par le gouvernement, il y a certainement beaucoup de données prêtes à être exploitées par des machines, même s’il faudra déterminer ce qui est pertinent et l’adapter à vos besoins. Si vous souhaitez utiliser des données marketing, produit ou financières, celles-ci ont également tendance à être structurées et disponibles, mais coûteuses. D’autres données dont vous pourriez avoir besoin seront propriétaires, protégées par un pare-feu ou par des lois sur la protection de la vie privée, ou dépendront de la collecte, de la production ou de l’interprétation humaines.

L’exploration de ce qui existe et qui pourrait être pertinent pour votre prise de décision avant de commencer guidera le choix des outils et techniques appropriés. Cela vous aidera également à comprendre ce qui est faisable aujourd’hui avec les outils actuels et ce qui pourrait éventuellement l’être, au fur et à mesure que les innovations dans les technologies de données arrivent à maturité.

5. Réfléchissez au coût de la transformation des données pour pouvoir les utiliser avec les outils de votre choix

Les données ne sont pas gratuites. Pas même les données gratuites. Pour chaque élément de données ou d’enregistrement que vous souhaitez utiliser, il y a un coût de préparation des données afin qu’elles puissent être ingérées, gérées, consultées et transmises aux services et outils de votre système informatique. En fonction du type et de la quantité de données dont vous avez besoin, de leur aspect, de la manière dont vous devrez les collecter et les traiter, et des enjeux de licence et de propriété intellectuelle auxquels vous devrez faire face, les coûts peuvent s’accumuler très, très rapidement. Et ce, avant même de prendre en compte les coûts des outils techniques que vous pourriez utiliser pour exploiter les données dont vous avez besoin.

Heureusement, il existe un nombre croissant d’outils de moins en moins coûteux que vous pouvez utiliser pour obtenir des données dans votre système — par exemple, des outils de collecte et d’extraction de données, des options d’externalisation ouverte, des drones et des possibilités de collecter des données auprès des humains lorsqu’ils interagissent avec les outils et la technologie. Et de nouvelles technologies permettant de tirer plus facilement parti des données apparaissent chaque jour. Comprendre ce qu’il en coûtera pour extraire, transformer et télécharger ces données dans les outils que vous souhaitez utiliser contribuera grandement à garantir que le processus axé sur les données que vous mettrez en œuvre fonctionnera pour votre organisation.

6. Pensez grand, pilotez petit, puis passez à l’échelle en conséquence

Dans un monde aux ressources limitées, il est judicieux de réfléchir aux possibilités et de tester différentes options à petite échelle avant d’opter pour une approche unique. En commençant à petite échelle, vous découvrirez peut-être que l’option la moins coûteuse est suffisamment bonne telle quelle ou, au contraire, qu’elle nécessite un prétraitement important et coûteux afin d’être utilisable. Vous pourriez également découvrir que de nombreuses solutions qui fonctionnent à petite échelle ne seront pas efficaces ou rentables à plus grande échelle. Cela peut signifier que les processus de votre organisation devront eux-mêmes être adaptés, ou que vous devrez chercher une autre option. En testant les rouages avant d’investir, vous pourrez calculer le coût final des données, des licences d’outils et des autres coûts liés à la mise en place de votre système, à la formation des utilisateurs et à l’établissement de nouveaux protocoles.

Ces étapes demandent du temps et des ressources. Toutefois, un investissement minimal au départ pour vous assurer que vous disposez de la bonne combinaison de données et d’outils pour piloter votre processus vous permettra d’économiser considérablement sur le long terme. Ceci est toujours bon pour les résultats de votre organisation.