Ce référentiel existe aussi en version PDF téléchargeable : téléchargez le référentiel.

Avant-propos

La maîtrise de compétences numériques dans le cycle de vie des données : un enjeu métier majeur

Toutes les organisations publiques et privées collectent des données. Que ce soit pour la gestion du personnel et l’administration des salaires, réaliser un suivi d’activité ou une étude, récolter des données clients ou d’usagers sur un site internet, diffuser et exploiter des données en open data... Les données font partie du quotidien de toutes les organisations.

À l’heure de l’intelligence artificielle et de l’émergence de nouveaux outils numériques facilitant l’utilisation de la donnée, la diffusion d’une culture de la donnée et la sensibilisation à une stratégie data est une démarche de plus en plus plébiscitée en interne pour tous les professionnels.

Au-delà des services techniques, de l’IT (Technologie de l’Information) ou de la DSI (Direction des Systèmes d’Information), l’utilisation des données au sein d’une organisation est l’affaire de tous : pour garantir leur qualité et leur cohérence globale, ou pour les standardiser en vue de leur traitement. La montée en compétences sur l’usage des données est donc un enjeu transversal pour les organisations.

Afin d’accompagner tous les professionnels dans l’appropriation des données et en faciliter les usages, Pix a créé le dispositif Pix+ Données. Développée en partenariat avec les acteurs institutionnels spécialistes de la donnée, cette solution propose une approche par compétences pour lever les premiers freins.

Rechercher et produire des données de qualité

Rechercher des données de qualité

  • Identifier, utiliser et analyser une adresse web (URL)*
  • Chercher dans des catalogues spécialisés
  • Exploiter les métadonnées d’un document*
  • Consulter et comprendre les métadonnées d’un jeu de données
  • Connaître la notion d’API dans le service public

Produire des données de qualité

  • Saisir, intégrer et organiser des données dans un classeur*
  • Nettoyer des données structurées en tableau pour en améliorer la qualité*
  • Augmenter la qualité d’un jeu de données
  • Évaluer la qualité intrinsèque et/ou contextuelle des données
  • Choisir un format de document adapté aux exigences de sa diffusion (ouverture, interopérabilité)*
  • Connaître les schémas et appliquer un standard à des jeux de données
  • Interpréter le schéma d’une base de données relationnelle*
  • Agréger des données pour créer un nouveau jeu de données
  • Connaître les supports techniques de la donnée

* Sujets présents dans le référentiel transverse

Ouvrir, protéger, partager, encourager la réutilisation des données

Connaître les enjeux de l’ouverture des données

  • Trouver et exploiter des données ouvertes disponibles en ligne*
  • Connaître les acteurs de la gouvernance des données
  • Comprendre l’impact environnemental de l’ouverture des données et les bonnes pratiques pour le limiter

Protéger et partager des données

  • Connaître les principes clé de la législation européenne en matière de protection des données personnelles : objectif, droits, limites (RGPD)*
  • Connaître les caractéristiques des notions de données à caractère personnel, et les principes de recoupement et d’anonymisation*
  • Protéger les données en respectant les exceptions à l’open data
  • Comprendre les licences des jeux de données et des codes sources

Encourager la réutilisation des données

  • Identifier des mécanismes de circulation des données entre administrations
  • Publier des données en open data et connaître les obligations de publication
  • Connaître le cadre légal des algorithmes publics
  • Connaître les obligations spécifiques aux informations relatives à l’environnement

* Sujets présents dans le référentiel transverse

Utiliser et réutiliser les données

Préparer des données en vue de leur traitement

  • Filtrer des données et utiliser les tableaux croisés dans une feuille de calcul*
  • Trier des données dans une feuille de calcul*
  • Connaître des outils de traitement et de préparation de données
  • Importer et préparer des données structurées en vue de leur analyse
  • Interroger une base de données au moyen de requêtes SQL*

Visualiser des données

  • Réaliser un graphique à partir d’une table de données*
  • Produire une datavisualisation
  • Interpréter des graphiques interactifs et paramétrer leur affichage*
  • Améliorer l’efficacité et la lisibilité d’une représentation graphique
  • Produire une représentation cartographique

Innover grâce aux données

  • Connaître les différents métiers de la donnée en lien avec la sphère publique
  • Connaître le vocabulaire lié aux enjeux de l’utilisation des données dans les politiques publiques
  • Interpréter et calculer des indicateurs pour prendre une décision ou l’évaluer
  • Connaître les principes de différentes techniques de l’intelligence artificielle (IA générative, apprentissage automatique) et leurs facteurs d’évolution*

* Sujets présents dans le référentiel transverse de Pix, consultable sur : pix.fr/competences

Ce projet est co-porté par l’ECOLAB (Commissariat général au développement durable) du ministère de la Transition écologique et de la Cohésion des Territoires et l’ANCT.