Sélection de la langue

Recherche

Les données expliquées (DDN3-A09)

Description

Cet article permet de faire la distinction entre données qualitatives et données quantitatives et traite des façons de collecter, d'organiser, d'interpréter et d'utiliser des données pour orienter des décisions.

Publié : 28 août 2024
Type : Article
Contributeur : Alyea Cyr Connell



Les données expliquées

Comme le volume de données ne cesse de croître et que la population réclame de meilleurs services publics, le Canada a fait de la bonne gestion des données et de la prise de décisions fondée sur les données probantes des priorités absolues. En 2023, le gouvernement du Canada a publié la Stratégie relative aux données de 2023-2026 pour la fonction publique fédérale afin de permettre aux ministères d'exploiter au mieux les données et d'atteindre les objectifs fixés. Lorsque la prise de décisions est fondée sur les données (donc sur les faits), elle s'inscrit dans une démarche stratégique et donne de meilleurs résultats. En l'absence de données validées, on joue à la roulette.

Voici quelques exemples. Si vous allez sur un site de rencontres, il est probable que vous sautiez les profils sans photos. Et quand vous magasinez en ligne, vous achetez habituellement le produit qui a reçu les meilleurs commentaires. Vous ne perdez pas non plus votre temps à répondre à une offre d'emploi dont on ne précise pas le salaire. Nous vivons dans un monde axé sur les données; présumer des faits peut mener à des rendez-vous embarrassants, à des achats regrettables et à des pertes financières.

Nous nageons dans les données. Nous devons tous et toutes les utiliser, les maîtriser, apprendre à leur sujet. Amener les membres d'une organisation à bien manipuler les données représente une tâche énorme. Pour qu'une organisation puisse vraiment tirer profit des données, chaque personne doit posséder un niveau de connaissance des données adéquat pour l'emploi qu'elle occupe.

Sandy Kyriakatos, dirigeante principale de l'information, Conseil national de recherches Canada

Les types de données : qualitatives et quantitatives

Le terme « données » est courant, mais il faut savoir que son sens peut varier selon le contexte. Pour beaucoup de gens, ce terme renvoie à la connexion Internet de leur téléphone. Toutefois, sont aussi considérés comme des données les faits, les schémas, les observations ou les enregistrements concernant un objet ou un phénomène, lesquels peuvent prendre la forme d'images, de sons, de textes ou de mesures physiques, comme la distance, le poids, etc. Les données ne sont pas que des informations électroniques ou numériques.

Une façon typique de catégoriser les données consiste à les diviser en données quantitatives et en données qualitatives.

Les données quantitatives sont de l'information numérique obtenue par mesure ou par compte. Ces données s'expriment généralement sous forme de quantité, de somme ou d'intervalle. Le nombre de personnes assistant à une partie de baseball, le temps passé dans la circulation et votre taille sont des données quantitatives. La plupart des ministères possèdent des données quantitatives, comme le nombre de leurs employé·es, le nombre de demandes qu'ils traitent ou le nombre de personnes servies chaque mois.

Les données qualitatives comprennent les énoncés descriptifs qu'on peut faire à propos d'un sujet en se basant sur des observations, des entrevues ou des évaluations. Ces énoncés permettent de comprendre un phénomène; ils en illustrent le contexte, le lient à des expériences, en précisent le sens. Les critiques de films et la rubrique des propriétés à vendre sont des exemples de données qualitatives. Les images, les vidéos et les enregistrements sonores sont aussi considérés comme des données qualitatives.

Les deux types de données sont complémentaires : en intégrant les deux formes, les analystes raffinent leurs interprétations et peuvent prendre des décisions éclairées, fondées sur des faits observables et sur la compréhension du contexte.

La collecte de données

On peut collecter des données de nombreuses façons. Statistiques Canada, par exemple, emploie principalement trois méthodes de collecte de données :

  • Recensement : Le recensement est un moyen de collecter de l'information auprès de chaque membre d'une population ou d'un groupe en particulier. Il permet de rassembler des données sur divers aspects, comme l'âge, la profession et les conditions de vie, en questionnant l'ensemble des membres de cette population ou de ce groupe. Cette méthode aide à obtenir un portrait complet de la population.
  • Enquête par sondage : Ce type d'enquête permet de collecter de l'information auprès d'un petit groupe de personnes (l'échantillon) pour en apprendre sur un plus grand (la population). Plutôt que de questionner tout le monde, démarche coûteuse et qui demande beaucoup de temps, les analystes sélectionnent un échantillon représentatif de la population. Les réponses obtenues les aident à comprendre les opinions, comportements et caractéristiques de la population entière.
  • Collecte de données administratives : La collecte de données administratives se fait pendant les activités quotidiennes d'une organisation. Ces données comprennent notamment celles sur les naissances, les décès, les impôts, les immatriculations de véhicule et les transactions.

Il existe aussi plusieurs autres façons d'obtenir des données, dont les suivantes :

  • Production participative : Méthode qui consiste à collecter de l'information auprès d'une large communauté d'utilisateurs et utilisatrices en présumant que les personnes du public sont celles qui connaissent le mieux leur milieu. Wikipédia, par exemple, compte sur la collaboration d'une communauté très diversifiée pour créer et réviser des articles sur des sujets variés.
  • Moissonnage du Web : Procédé par lequel on extrait et copie de l'information du Web en vue de l'analyser plus tard. Par exemple, les entreprises de commerce en ligne surveillent les prix de la concurrence de façon à adapter leur propre stratégie de détermination des prix.
  • Captation à distance : Acquisition d'information sur un objet ou un phénomène éloigné. Pensons par exemple à la surveillance de la croissance végétale par imagerie satellitaire, aux systèmes de radars météorologiques qui suivent les tempêtes et aux réseaux de détection sismique qui captent les vibrations de la croûte terrestre.
  • Données ouvertes : Données structurées, lisibles par machine, librement échangées et d'utilisation illimitée.
  • Mégadonnées : Ensembles de données qui contiennent tellement de dossiers et de variables qu'ils excèdent la capacité des logiciels courants à traiter l'information dans un temps raisonnable.

L'organisation des données : données structurées et données non structurées

Les données sont soit structurées, soit non structurées.

Les données structurées sont hautement organisées et facilement analysables. Elles ont une apparence harmonieuse sur une feuille de calcul. En voici quelques exemples :

  • dates;
  • numéros de téléphone;
  • codes postaux;
  • noms de client·es;
  • types d'avantages.

Pour les données non structurées, c'est tout le contraire. Il s'agit d'information brute, non organisée, qui possède parfois sa propre structure interne, mais qui demeure difficile à caser sur une feuille de calcul ou dans une banque de données. Cette information est plus subjective et contient habituellement beaucoup de texte, par exemple des réponses à des questions ouvertes, possiblement distinctes les unes des autres et difficiles à catégoriser. Voici quelques exemples de données non structurées :

  • fichiers audios, vidéos et d'images;
  • documents Word et présentations PowerPoint;
  • courriels;
  • commentaires de client·es;
  • messages textes;
  • notes sur la clientèle et journaux de clavardage;
  • enregistrements d'appels téléphonique

En raison de leur variabilité, les données non structurées sont difficiles à organiser et à analyser. Malgré leur manque de structure, elles peuvent fournir des éclairages et révéler des tendances utiles quand on les examine à l'aide d'outils comme le traitement du langage naturel, la reconnaissance d'images et l'analyse d'opinion. Comprendre la différence entre les données structurées et les données non structurées permet aux organisations de choisir le meilleur moyen de stocker, de manipuler et d'analyser efficacement leurs données.

Fins auxquelles sont destinées les données

Voici différentes fins auxquelles servent les données :

  • répondre adéquatement à des demandes de renseignements;
  • amener à la prise de décisions éclairées;
  • raconter une histoire;
  • appuyer ses conclusions sur des faits;
  • simplifier et clarifier de l'information complexe;
  • révéler des tendances et des liens;
  • comprendre des comportements et les raisons de la survenue d'événements.

Interpréter les données peut aider à élargir les connaissances et à orienter la recherche. Une étude approfondie des événements locaux et internationaux permet d'évaluer leurs incidences potentielles. En analysant les données, nous pouvons prendre des décisions éclairées, déterminer les causes d'un phénomène et trouver des solutions à divers problèmes. L'interprétation des données aide non seulement à comprendre l'actualité, mais aussi à prévoir les tendances et les événements à venir.

Nous devons nous servir des données, et nous devons en exploiter la valeur. Nous devons servir au mieux la population avec les données que nous possédons, mais nous devons protéger les renseignements personnels des gens. Nous devons donc veiller à ce que notre démarche ne menace pas la vie privée.

Sandy Kyriakatos, dirigeante principale de l'information, Conseil national de recherches Canada

Maintenant, vérifiez vos connaissances

Scénario 1 : Sondage sur la satisfaction du personnel

Vous menez un sondage sur la satisfaction du personnel pour mesurer comment les employé·es se sentent à propos de leur milieu de travail.

Quel type de données collectez-vous?

  1. Des données qualitatives seulement
  2. Des données quantitatives seulement
  3. Des données qualitatives et quantitatives
  4. Ni des données qualitatives ni des données quantitatives
Réponse : La bonne réponse est c) « Des données qualitatives et quantitatives ». Le sondage permet de collecter des données quantitatives (données chiffrées) et des données qualitatives (réponses aux questions ouvertes).

Scénario 2 : Gestion des données provinciales sur l'immatriculation des véhicules

Votre équipe doit tenir à jour la base de données provinciale sur l'immatriculation des véhicules. Ces données administratives comprennent les dossiers détaillés de tous les véhicules immatriculés dans la province, comme l'information sur leurs propriétaires, les caractéristiques des véhicules, la date de leur immatriculation et le statut de son renouvellement. Ces données sont collectées pendant les opérations quotidiennes et sont essentielles pour établir des politiques, vérifier la conformité avec les règlements sur le transport et planifier les projets d'infrastructure.

Quelle méthode de collecte utilise-t-on dans ce scénario?

  1. Le recensement
  2. L'enquête par sondage
  3. La collecte de données administratives
  4. La captation à distance
Réponse : La bonne réponse est c) « La collecte de données administratives ». Ce type de données est collecté pendant les opérations courantes, comme la tenue à jour de la base de données de l'immatriculation des véhicules, et demeure primordial pour différentes fins administratives et l'établissement de politiques.

Scénario 3 : Analyse des mouvements de circulation aux fins de planification urbaine

Vous êtes analyste de données au ministère provincial des Transports, et on vous a demandé de fluidifier la circulation dans une grande ville. Votre superviseur vous a aussi demandé d'analyser les données sur la circulation collectées à différentes intersections et sur les autoroutes pendant la dernière année. Vous devrez cerner les points de congestion, synchroniser les feux de circulation et proposer des changements aux infrastructures routières pour améliorer l'efficacité générale du transport.

À quelle fin utiliserez-vous principalement les données?

  1. Répondre adéquatement à des demandes de renseignements
  2. Amener à la prise de décisions éclairées
  3. Raconter une histoire
  4. Appuyer vos conclusions sur des faits
Réponse : La bonne réponse est b) « Amener à la prise de décisions éclairées ». Dans ce scénario, vous vous servirez des données sur la circulation pour amener les autorités à prendre des décisions éclairées sur la gestion de la circulation et l'amélioration des infrastructures.

Ressources


Date de modification :