L’année 2021-2022 s’est soldée de belle façon pour l’initiative Un avenir numérique lié.
Malgré la pandémie (ou peut-être grâce à elle), nous avons réalisé des progrès importants au chapitre de la production de métadonnées ouvertes sur les entités nommées. Le nombre d’artistes répertoriés dans le graphe de connaissance Artsdata a augmenté de 108 %. Le nombre d’organismes, de 163 %. Et ce n’est pas fini. Plusieurs chantiers sont en cours afin de bonifier la quantité et la qualité des données sur les lieux culturels. De plus, puisque le secteur du spectacle est maintenant rouvert après un hiatus de deux ans, nous allons enfin à nouveau faire porter nos efforts sur le production de métadonnées d’événements.
Les métadonnées sont des « données à propos des données ». Dans le domaine du spectacle vivant, les métadonnées fournissent des informations descriptives essentielles à propos des artistes, des organismes, des lieux et des représentations de spectacles.
Un travail d’équipe
Chaque partie prenante du secteur du spectacle a un rôle à jouer dans la transformation numérique axée sur les métadonnées. C’est d’ailleurs dans cette optique que l’équipe de l’initiative Un avenir numérique lié a défini une liste d’étapes essentielles pour encourager les intervenants du secteur à prendre en charge leur métadonnées. Cependant, les actions individuelles et isolées n’auront jamais autant d’impact que des actions coordonnées. De même, les approches centralisées ne suffiront pas non plus. La solution à l’enjeu de la découvrabilité numérique passe plutôt par des approches distribuées.
Prenons les moteurs de recherche en exemple. Comme l’indique ce billet de blogue, les moteurs de recherche n’accordent leur attention à une information que si celle-ci satisfait à certaines exigences.
- En outre, les moteurs de recherche aiment les entités clairement identifiées;
- La réponse à cette exigence implique que chaque intervenant du secteur accepte une responsabilité individuelle et exerce un contrôle sur ses métadonnées.
- Les moteurs de recherche ont de surcroît une préférence pour les informations qui sont validées dans de nombreuses sources.
- La réponse à cette préférence implique une responsabilité partagée – elle passe par une multitude d’actions individuelles, collectives et décentralisées.
Examinons ceci plus en détail.
Avant même de pouvoir valider une information dans d’autres sites web, un moteur de recherche doit d’abord indexer une page web, c’est-à-dire qu’il doit clairement identifier l’entité qui est décrite sur une page web. Ce travail d’indexation exige deux choses : qu’un identifiant (et/ou un URL) soit associé à l’entité et que suffisamment de données descriptives permettent de déterminer de quel type d’entité il s’agit (s’agit-il par exemple d’une personne, d’un organisme ou d’un événement?). L’utilisation d’identifiants et la production de métadonnées descriptive constituent une responsabilité individuelle qui incombe à chaque intervenant du secteur du spectacle.
Une fois l’entité identifiée, les moteurs de recherche doivent ensuite réconcilier l’entité – ils doivent chercher la même entité dans d’autres pages web ou dans d’autres jeux de données et établir sans ambiguïté qu’il s’agit bel et bien de la même entité. Là encore, les identifiants et les métadonnées descriptives sont d’une importance primordiale.
Dans le cas des entités nommées (personnes, organismes, lieux, etc.), la réconciliation peut s’appuyer sur le nom de l’entité et sur d’autres métadonnées géographiques, comme par exemple sa situation géographique. La réconciliation d’entités nommées est grandement facilitée lorsque des associations, des syndicats et d’autres responsables de jeux de données acceptent de partager leurs informations sous forme de données ouvertes dans Wikidata (comme l’on fait l’Association RIDEAU et Orchestres Canada, ce printemps). Il devient alors possible de répertorier chaque entité sous plusieurs noms alternatifs et dans plusieurs langues. Ceci constitue un exemple de responsabilité partagée et d’action collective.
Dans le cas des événements, la réconciliation s’avère un peu plus compliquée. Tout d’abord, même si chaque page web d’événement se voit attribuer un nom, il n’existe pas de convention de nommage pour s’assurer que la même représentation ou la même production en tournée portera le même sur chaque site web où elle apparaît. Ensuite, l’usage des données structurées Schema permettant d’identifier sans ambiguïté la date et l’heure d’un événement est encore loin d’être généralisé. Enfin, le secteur n’a pas encore adopté d’identifiant passerelle pour les événements.
Heureusement, le graphe de connaissances Artsdata a été conçu expressément dans l’objectif de combler ces lacunes. Le graphe de connaissances dispose de nombreux outils permettant de réconcilier les événements provenant de sources diverses et il peut aussi attribuer à chaque événement un identifiant unique pérenne. Artsdata est une solution collective basée sur des principes de responsabilité partagée, de décentralisation et de bienfait collectif.
Dans le monde des machines, chaque personne ou chose est une entité.
La réconciliation d’entités en sciences de l’information s’apparente à la réconciliation en comptabilité. Dans les deux cas, le processus implique la comparaison d’informations descriptives et la mise en relation d’identifiants. Si un même identifiant passerelle est utilisé dans deux jeux de données, alors le processus de réconciliation peut être entièrement automatisé.
Une entité nommée est une « chose » avec un nom en langage humain servant à distinguer cette chose des autres choses du même type. Les personnes, les organisations et les œuvres sont des exemples d’entités nommées. Dans les fichiers d’autorité, ce nom sera associé à un identifiant unique pérenne. Dans les données liées, cet identificateur et ce localisateur sont appelés des identificateurs de ressources uniformes (ou URI).
Au cours de la prochaine année, CAPACOA, le projet dia-log, la Culture crée et les autres partenaires d’Artsdata mettront un accent renouvelé sur la cueillette et la réconciliation de métadonnées d’événements. Cependant, nous n’y arriverons pas sans aide. Il est plus que jamais nécessaire que chaque organisme des arts de la scène adopte de meilleures pratiques en matière de données, notamment en ce qui concerne l’utilisation des données structurées. Nous avons besoin que les gestionnaires de bases de données et de plateformes adoptent des pratiques décentralisées, qu’ils réconcilient leurs événements avec d’autres événements et qu’ils leurs assignent un identifiant Artsdata. En bout de ligne, il faut que cesse la saisie multiple des mêmes métadonnées d’événements et que commence plutôt la réutilisation et la valorisation des métadonnées existantes.
Cet idéal inatteignable il y a quelques années seulement nous semble plus que jamais accessible. Si vous souhaitez faire partie de changement, contactez-nous.
Faits saillants du rapport 2021-2022 de l’initiative Un avenir numérique lié
Voici un survol de ce que nous avons accompli entre avril 2021 et mars 2022 :
- Nous avons poursuivi le développement de partenariats de données.
- En plus de nos partenaires associatifs existants, nous avons rencontré 21 associations disciplinaires, fédérations et syndicats et nous leur avons proposé un accompagnement dans la publication de données ouvertes à propos de leurs membres. 7 associations ont déjà accepté de publier leurs métadonnées.
- CAPACOA et Indigenous Performing Arts Alliance ont développé des politiques de données ouvertes et ont adapté leur formulaires d’adhésion de façon à recueillir des métadonnées de qualité et à obtenir le consentement de leurs membres.
- Grâce à ces activités, le nombre de personnes répertoriées dans Artsdata s’est accru de 108 % et le nombre d’organismes, de 163 %.
- Nous avons tiré de précieuses leçons de ces stratégies de production de données.
- En plus des activités de production de données, nous avons aussi entrepris des activités de prototypage visant la consommation de données. Notamment, La Culture crée et le développeur web Ryan Hutchinson ont conçu un plugiciel Artsdata pour les sites WordPress. Ce plugiciel permettra d’alimenter des répertoires de membres avec des données ouvertes.
- En ce qui concerne la modélisation des données, nous avons soutenu le développement d’une ontologie harmonisée des arts de la scène par le biais du Performing Arts Information Representation Community Group. Nous avons aussi développé des vocabulaires contrôlés pour différencier les types d’événement et les types d’organismes.
- Nous avons poursuivi des activités de recherche et de consultation sur la représentation des artistes autochtones dans Wikidata. Un rapport sera publié cet automne.
- En matière de gouvernance des données, Nord Ouvert a publié le rapport Une voie prometteuse pour la gouvernance des données dans le secteur des arts de la scène. Les partenaires d’Artsdata ont par ailleurs développé et adopté un cadre de gouvernance qui définit les processus pour les prises de décision collectives à propos du graphe de connaissances.
- Le groupe de travail LODEPA consacré à Wikidata/Wikipédia s’est réuni à cinq reprises. Le groupe de travail a créé trois propriétés, défini une nouvelle classe d’éléments et résolu des problèmes conceptuels avec la classe « lieu pour des événements ». Les meilleures pratiques ont été documentées dans le WikiProjet Arts de la scène et le WikiProjet Lieux culturels.
- Le WikiProjet Arts de la scène s’est vu décerner le Prix écosystème lors de WikidataCon 2022.
- CAPACOA et le Conseil québécois du théâtre ont à nouveau uni leurs efforts pour présenter une série de 8 ateliers pratiques sur Wikidata. En plus de ces ateliers Wikidata, les membres de l’équipe IANL ont animé 15 présentations et ateliers en 2021-2022. Ces activités ont rejoint un total de 588 participants.
- Les membres de l’équipe IANL ont publié 8 billets de blogue pour partager des informations et des ressources de littératie numérique. Le site web a enregistré 15 500 pages vues.
- Nous avons créé le bulletin électronique Un avenir numérique lié afin d’accroître la portée de nos activités de communication. Nous avons envoyé deux éditions du bulletin à 600 abonnés.
Leave a Reply
Want to join the discussion?Feel free to contribute!