Tim Berners-Lee, principal inventeur du Web et des données liées, a suggéré un schéma de déploiement de 5 étoiles pour les données ouvertes. Ce schéma explique quelles sont les étapes pour se rendre au niveau 5. 1 étoile - publiez vos données sur le Web (peu importe leur format) avec une licence ouverte 2 étoiles - publiez-les en tant que données structurées (par exemple, un document Excel au lieu d’une image scannée d’un tableau) 3 étoiles - publiez-les dans un format ouvert et non-propriétaire (par exemple, un CSV plutôt qu’un Excel) 4 étoiles - utilisez des URI pour désigner des choses dans vos données, afin que les gens puissent faire des références à celles-ci 5 étoiles - liez vos données à d’autres données pour y ajouter du contexte

La pandémie de COVID-19 a causé la plus profonde crise économique, sociale et humaine qu’ait jamais connu le secteur des arts, de la culture et du patrimoine. Le secteur du spectacle – dont les modes de production et de diffusion exigent une proximité sociale, des rassemblements et de déplacements – est particulièrement mis à mal.

Depuis le début de la crise, plusieurs organismes de services aux arts et autres associations ont mené des sondages auprès de leurs membres afin de quantifier les impacts de la crise. Pourtant, même si des milliers d’organismes et travailleurs culturels ont déjà répondu à de tels sondage, on est toujours loin d’avoir un portrait exhaustif et précis de la situation. Pourquoi? Parce que ces sondages ne sont généralement pas conçus dans le but de dépeindre un portrait complet. Les sondages sectoriels ne permettent généralement ni l’agrégation de données (c’est-à-dire regrouper des données similaires), ni l’intégration de données (c’est-à-dire colliger et mettre en relation des données complémentaires). Entre autres choses, peu de sondages recueillent des données susceptibles de jouer le rôle d’identifiant unique. Or, sans identifiants uniques, la moindre différence de saisie dans le titre d’un spectacle rend impossible le repérage automatisé de doublons dans les jeux de données. Dans un tel contexte, il est difficile de déterminer si des annulations recensées auprès des compagnies de production, des agents de tournée et des diffuseurs ne se rapportent pas, en réalité, aux mêmes événements.

Comment pourrions-nous valoriser nos données d’industrie à propos des événements, des productions et des organisations? Et comment faire en sorte que cette valeur ajoutée profite à l’ensemble des intervenants de la chaîne du spectacle?

L’amélioration de nos pratiques de collecte de données pourrait notamment s’appuyer sur les éléments suivants :

  1. Des politiques de confidentialité flexibles facilitant la réutilisation des données;
  2. Des classifications normalisées pour différencier les groupes de répondants (par exemple, des classifications d’industries, des classifications d’occupations ou des classifications démographiques);
  3. Des indicateurs d’impacts communs pour chaque classe d’organisme ou de travailleurs culturels;
  4. Des identifiants uniques permettant de dédoubler et de recouper les réponses de différents sondages (à défaut d’un identifiant commun, l’URL du site officiel d’un organisme peut jouer ce rôle).

De fait, plusieurs initiatives relevant de la transformation numérique du secteur des arts abordent déjà de tels enjeux :

  • Mutualisation de données;
  • Ontologies et référentiels précisant les classes et propriétés à utiliser à l’intérieur d’un domaine de savoir;
  • Identifiants uniques pérennes et URI.

Alors? Que peut-on faire de concret aujourd’hui, en pleine crise? Il serait ardu d’attribuer à la presse des identifiants uniques ou de solliciter de façon rétroactive un consentement à partager des réponses déjà fournies. Cependant, nous pouvons à partir d’aujourd’hui faire le choix de la collaboration dans la conception et la mise en oeuvre des nos activités de collecte de données. Après tout, si les arts et la culture apportent des bienfaits individuels et collectifs et méritent à ce titre un appui de nos gouvernements, peut-être pourrions-nous alors aussi considérer les données sur les arts et la culture comme un actif susceptible de contribuer au bien commun. Si nous ne le faisons pas aujourd’hui – alors qu’une crise sans précédents appelle des moyens sans précédents – alors quand?

1 reply
  1. Frédéric Julien
    Frédéric Julien says:

    Depuis la publication de ce billet, j’ai collaboré avec Synapse C et d’autres organismes de services aux arts afin d’élaborer un cadre de mesure des impacts de la COVID-19. Nous y abordons des sujets tels les politiques de confidentialité, les identifiants, les classifications normalisées et les indicateurs d’impact. Bien qu’il ne s’agisse que d’un document de travail et qu’il ne soit que partiellement traduit en français, nous souhaitons le mettre dès maintenant à la disposition de quiconque entreprend une collecte de données dans le secteur des arts. Les commentaires et contributions sont aussi les bienvenus.

    Reply

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Leave a Reply

Your email address will not be published. Required fields are marked *