Tablette montrant un graphique du nombre et des sources d'événements dans Artsdata, à côté du logo IANL et du « Rapport annuel 2022-2023" ». En arrière-plan, il y a des formes de diamant reliées entre elles.

L’initiative Un avenir numérique lié a été lancée en 2018 afin de favoriser la découvrabilité du spectacle. Après un peu plus de quatre années, est-ce que l’enjeu de la découvrabilité du spectacle demeure tout aussi crucial ? Ou est-ce que l’Intelligence Artificielle, qui « apprend » très rapidement, a résolu ce problème pour nous ?

Nos collègues de Tandem et du Performing Arts Information Representation Community Group ont tenté de répondre à cette question lors de l’événement Beyond Words: How ChatGPT And Computational Tools Are Shaping The Future Of Discoverability In The Arts, tenu le 24 avril. Les conférenciers y ont tour à tour interrogé ChatGPT afin d’obtenir des informations sur les pièces de théâtre ou les spectacles d’artistes autochtones à venir. L’application d’IA n’a pas été plus fine que ses cousins, les moteurs de recherche : elle n’a pas su fournir autre chose que des listes des pièces ou des artistes les plus célèbres. Encore une fois, la recommandation algorithmique s’est appuyée sur le critère de la popularité. Ceci nous permet de conclure que l’IA n’est pas encore en mesure de repérer l’offre de spectacle parmi les milliards de gigaoctets produits sur le web chaque jour, ni d’interpréter son sens et sa valeur pour l’être humain.

Ainsi, les mesures de découvrabilité mises de l’avant dans le cadre d’Un avenir numérique lié (notamment la mise en œuvre de données structurées Schema) demeurent toutes aussi pertinentes qu’il y a quatre ans. Peut-être davantage, d’ailleurs, en ce sens que nous avons pu en mesurer l’efficacité grâce un projet réalisé par Gradient pour nos collègues du projet dia-log. Lors de la matinée numérique, organisée le 11 avril, nous avons en effet appris que les organisations ayant intégré des données structurées à leurs pages web d’événement ont vu l’achalandage de ces pages doubler, voire tripler !

Ces expériences soulignent l’importance pour le secteur du spectacle de poursuivre sa transformation numérique axée sur les données. Ils offrent par ailleurs un beau préambule à la présentation du rapport annuel d’Un avenir numérique lié.

Rapport annuel d’Un avenir numérique lié

Au cours de la dernière année, l’équipe et les partenaires d’Un avenir numérique lié ont mis à nouveau l’accent sur la production de données d’événement. Ils ont de plus complété des activités de prototypage et de formation axées sur les métadonnées de lieux, de personnes et d’organisations. Voici les faits saillants pour la période d’avril 2022 à mars 2023 :

  • Nous avons collaboré avec 9 fournisseurs de données sur les artistes, les organisations et les lieux. Cela porte le nombre de nos partenaires de données à 13 depuis que nous avons commencé à intégrer ces types de jeux de données en 2020.
  • Au cours des deux dernières années, le nombre de personnes, organisations et lieux dans Artsdata a triplé, passant de 11 100 à 35 000 (représentant une augmentation de 233 %).
  • Des efforts considérables ont été déployés pour transformer Wikidata en la base de données la plus complète sur les lieux des arts de la scène, y compris un datathon, deux versements de données et des saisies manuelles par le personnel de l’IANL. Le nombre de lieux dans Wikidata est monté de 276 à 549 (une augmentation de 99%). C’est presque autant que le nombre de lieux des arts de la scène dans La Base de données ouvertes sur les installations culturelles et artistiques par Statistique Canada (580).
  • Grâce aux programmes de découvrabilité numérique dirigés par dia-log et CAPACOA, le nombre cumulatif de sources de données sur les événements dans Artsdata a atteint 73. Le nombre d’organisations qui mettent en œuvre des données structurées est en croissance. Elles comptent désormais pour 20 % des événements à venir dans Artsdata. Au cours du dernier trimestre, le nombre d’événements à venir disponibles dans Artsdata a fluctué entre 3 000 et 4 000.
  • Les activités de prototypage avec Scène Pro, l’Indigenous Performing Arts Alliance, CAPACOA et autres partenaires de données ont fait la démonstration que l’échange et la réutilisation des données peuvent apporter des bénéfices tangibles aux gestionnaires de plateformes et leurs usagers.
  • Les publications de la Mid-Level Ontology for the Performing Arts et du Référentiel des métadonnées du spectacle du Québec sont prévues prochainement. Il s’agit de développements majeurs pour l’harmonisation des modèles de données dans les arts de la scène.
  • Les explorations et consultations sur les savoirs autochtones ont débouché sur la publication du rapport Les artistes autochtones et Wikidata. Ce rapport définit comment les informations sur les artistes autochtones peuvent être représentées de manière exacte et respectueuse en tant que données ouvertes liées. 
  • Au cours des deux dernières années, les membres de l’équipe IANL ont fourni des services de littératie de données à pas moins de 26 organismes de services aux arts, syndicats et organismes de prix. Ils ont tous reçu des conseils individuels et des ressources supplémentaires pour améliorer leurs pratiques de gestion de données. Près de la moitié d’entre eux ont par la suite fourni des données à Artsdata et Wikidata.
  • L’IANL a relancé le programme de découvrabilité numérique et a élargi la portée de services pour inclure également des audits de SEO et Wikidata. 20 organisations ont participé au programme. 7 d’entre elles ont mis en œuvre une ou plusieurs recommandations pour améliorer leur découvrabilité ou pour rendre leurs données d’événements réutilisables via Artsdata.
  • La demande pour des services de littératie de données est restée forte. Entre l’avril 2022 et le mars 2023, les membres de l’équipe IANL ont organisé 34 présentations et ateliers pour 753 participants. Ce chiffre est plus élevé que dans toutes phases passées de l’initiative. Les commentaires positifs des participants ont confirmé que ces types de services sont toujours utiles et nécessaires, même après cinq ans d’activités de l’initiative Un avenir numérique lié

Prochaines étapes pour Artsdata, le secteur des arts de la scène (et l’IA)

Plus le graphe de connaissances Artsdata accumulera des données de sources diverses, plus il deviendra important de « réconcilier » et de nettoyer ces données afin de les rendre utilisables par des tiers comme des calendriers culturels. Cela nécessitera notamment :

  1. De repérer les doublons parmi les différentes sources de données primaires ; 
  2. De créer pour chaque événement une entité unique dotée d’un identifiant Artsdata pérenne ;
  3. D’assembler de façon programmatique une donnée plus complète et de meilleure qualité que les différentes données de sources primaires.

Ce travail de réconciliation sera grandement facilité si l’information qui entre dans Artsdata est suffisamment exhaustive pour être désambiguïsée (par exemple, si elle est structurée selon le modèle de données d’Artsdata et qu’elle intègre des identifiants passerelles). Les organismes qui réaliseront des efforts afin de structurer leurs données s’en verront récompensés : leurs données d’événements apparaîtront dans un plus grand nombre de calendriers, ce qui ne manquera pas de capter l’attention des robots d’indexation, puis des intelligences artificielles gourmandes de données.

Est-ce que l’IA aura alors acquis la capacité d’interpréter le sens et la valeur d’une représentation de spectacle? Peut-être que oui; peut-être que non. Dans tous les cas, les données d’événement partagées par le biais d’Artsdata seront visibles sur un plus grand nombre de sites web partenaires – comme, par exemple, La Vitrine – ce qui contribuera à leur découvrabilité par des amateurs de spectacles.

Dans les sciences de l’information, la réconciliation d’entités implique la comparaison d’informations descriptives et la mise en relation d’identifiants. Si un même identifiant passerelle est utilisé dans deux jeux de données, alors le processus de réconciliation peut être entièrement automatisé.

Ressources utiles pour publier des données structurées de qualité

 Initialement publié le 29 mai 2023. Mis à jour le 10 juillet 2023.

0 replies

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Leave a Reply

Your email address will not be published. Required fields are marked *