Image montrant une page web d'une représentation et les données structurées associées à cette page.

Il y a deux ans, Nesta et Satori Lab publiaient un rapport encourageant les organismes artistiques à publier des données ouvertes à propos de leurs évènements. Faute d’une norme de données propre au domaine du spectacle, les auteurs recommandaient notamment l’utilisation de Schema.org. Soit. Mais comment utilise-t-on Schema.org? Voici quelques pistes. 

Qu’est-ce que Schema.org

Fondé par Google, Microsoft, Yahoo et Yandex, les vocabulaires Schema.org sont développés par un processus communautaire ouvert dans un objectif de partager un langage commun. 

Schema.org est un ensemble de micro-données (que l’on appelle couramment des « markup » en anglais ou tout simplement des données structurées en français) utilisées dans le Web pour décrire des contenus à l’intention des robots d’indexation. Les données structurées Schema.org décrivent à la fois la nature d’un contenu (avec les balises @type) ainsi que les attributs de ce contenu, les actions qui y sont associées et ses relations avec d’autres entités (à l’aide des propriétés). Ces données structurées permettent ainsi aux robots de saisir plus précisément le sens des contenus présents dans les pages indexées. Cette « construction de sens » permet ensuite à ces robots de présenter des résultats plus riches et plus ciblés à de multiples requêtes d’internautes. (source : Schema.org et Wikipédia).

Comment ajouter des données structurées Schema.org à ses pages Web

Les données structurées Schema.org sont présentes sous forme de balises intégrées dans le code de la page Web, par convention dans l’en-tête de la page (<head>). Le vocabulaire Schema.org peut être utilisé avec de nombreux encodages. Cependant, les robots tels que Google recommandent expressément le codage JSON-LD car ce codage est celui qui permet la production de résultats mieux enrichis et plus visuels sur leurs pages de résultat. Peu de travailleurs culturels disposent des connaissances techniques nécessaires pour aller encoder eux-mêmes leurs données structurées. Aussi, il peut être avantageux de s’appuyer sur des plugiciels qui prennent en charge la production des données structurées.

Selon une analyse comparative réalisée par Jai Djwa en 2020, le plugiciel The Events Calendar et certains plugiciels consacrés à l’optimisation et aux données structurées sont en mesure de produire un minimum de données structurées Schema.org. D’autres plugiciels ont pu avoir intégré les données structurées depuis la publication de cette analyse.

Pour vérifier si votre gestionnaire de contenu Web ou vos plugiciels produisent des données structurées – et savoir lesquelles – il est recommandé d’utiliser les outils d’évaluation des données structurées : Test your structured data | Search Central. Ces deux espaces de test produits et soutenus par toute la communauté Schema.org sont très utiles car ils permettent d’identifier les erreurs de codage ou une utilisation faible des balises Schema.org. 

Schema Markup Validator

Outil permettant d’évaluer toute la gamme de données structurées Schema présentes sur une page.

Objectif : S’assure que les informations présentes soient interopérables et donc

a) moissonnables par des robots spécialisés dans la construction de graphes de connaissances comme Artsdata (qui est soutenu par l’initiative Un avenir numérique lié); et,

b) réutilisables afin d’alimenter des calendriers culturels (ainsi que le recommandent les auteurs du rapport de Nesta et The Satori Lab) ou toute autre application nécessitant des données sur les représentations.

Rich Results Test

Outil permettant d’évaluer les données structurées nécessaires pour la production de résultats de recherche enrichis.

Objectif : S’assurer que les contenus et les données structurées répondent aux exigences des robots d’indexation traditionnels afin de présenter des réponses enrichies et dynamiques pour tous les internautes.

Les données structurées essentielles

Le vocabulaire Schema.org comprend plusieurs types (c’est-à-dire des classes ou des regroupements de choses similaires) et des propriétés associées à chaque type.

Au strict minimum, des données structurées pour une représentation de spectacle devraient inclure ce qui suit.

  • @type: Event
    Le type « évènement » devrait être utilisé pour préciser que le contenu d’une page Web décrit un évènement. Si cette donnée n’est pas présente, c’est la première chose à régler.
  • Name
    Le nom de l’évènement apparaît sur toute page d’évènement. Est-il aussi présent dans les données structurées?
  • startDate
    Le temps est un attribut fondamental du spectacle. La date et l’heure de début doivent apparaître dans les données structurées en respectant le format prescrit dans la norme ISO 8601.
  • location
    Avec le temps, l’espace est un autre attribut fondamental du spectacle. Le lieu (Place) est un type distinct dans Schema mais ses données structurées peuvent et doivent être intégrées à celles de l’évènement. Malheureusement, les plugiciels produisent assez peu de données structurées à propos des lieux associés aux évènements. Si votre plugiciel ne prend pas en charge les données des lieux mais qu’il permet à tout le moins de saisir une URL associée au lieu, utilisez ce champ pour rediriger les robots vers l’élément Wikidata décrivant ce lieu. Wikidata peut fournir à ces robots bien plus d’informations sur vos lieux que ne le peuvent les données Schema (pour autant que ces informations soient saisies dans Wikidata, bien entendu). 
  • url
    Dans les données structurées, la propriété URL désigne plus que l’endroit où se trouve une ressource telle un évènement. L’URL d’un évènement est en quelque sorte son nom en langage machine. C’est un identifiant unique (d’où l’importance d’avoir un seul évènement par page). Si vous êtes l’organisateur de l’évènement et que vous le publiez sur votre propre site web, vous n’avez rien à faire. L’URL de la page sera automatiquement assignée comme valeur de la propriété URL. Si vous gérez un calendrier culturel avec des évènements qui disposent déjà d’une URL sur le site web de l’organisateur, il est alors recommandé d’inclure la propriété sameAs dans les données structurées et de s’assurer que l’URL officiel de l’évènement y apparaît. Cela indique aux machines que les données structurées des deux pages décrivent le même évènement. Ceci pourrait par exemple permettre à des algorithmes d’assembler les données structurées sur les deux pages et d’ainsi compléter ce qui pourrait manquer sur l’une ou l’autre.
Vous pouvez voir plusieurs propriétés Schema utilisées dans ce résultat de test pour une série de représentations de Ballet BC présentée par le Centre National des Arts.

Il y a aussi plusieurs autres propriétés d’évènements recommandées par Google, dont certaines qui sont particulièrement pertinentes pour des représentations de spectacles :

La SPEC du Haut-Richelieu est l’un des diffuseurs de spectacles ayant participé au programme de découvrabilité numérique avec l’initiative Un avenir numérique lié en 2019. Ses efforts ont porté fruit, puisque la SPEC publie aujourd’hui une quantité remarquable de données structurées sur ses pages d’événement (voir cet exemple).

Plusieurs plugiciels prennent en charge l’offre et l’organisateur. Et certains permettent la saisie de l’artiste interprète, du groupe ou de la compagnie présentée dans le cadre du spectacle. Si votre plugiciel permet la saisie de ces données structurées, profitez-en. Comme pour les lieux, ne négligez pas d’associer une URL à l’organisateur ou à l’interprète. Cela peut être l’URL du site web officiel, de la page Wikipédia ou de l’élément Wikidata associé à l’organisateur ou à l’interprète. Peu importe l’URL que vous utilisez, en créant du lien, vous créez du sens et vous ajoutez de la valeur à vos données structurées.

Qu’en est-il des types spécifiques d’évènement?

Schema déclare plusieurs sous-types d’évènements associés aux arts de la scène comme, par exemple, schema:TheatreEvent, schema:MusicEvent et schema:DanceEvent. Cependant, les définitions des ces sous-types sont ambiguës et incohérentes. Si TheatreEvent est clairement défini comme une représentation, MusicEvent n’offre aucune autre définition que le libellé du type. S’agit-il alors d’un concert ou d’un événement à propos de la musique? Quant à DanceEvent, la définition est ici plus précise – une danse sociale – mais elle représente un concept tout autre que la représentation d’un spectacle. 

Comment peut-on alors décrire une représentation de danse ou de cirque dans Schema.org? À l’heure actuelle ce n’est malheureusement pas possible. Le concept essentiel qui manque cruellement à l’ontologie Schema est le concept d’une « représentation de spectacle », sans égard à sa discipline ou à son genre. C’est une importante lacune qui fait entrave au traitement automatisé des données sur les représentations et qui nuit à la découvrabilité des arts de la scène.

Le Performing Arts Information Representation Community Group, un groupe communautaire associé au W3C et consacré à la modélisation des arts de la scène, a entrepris de combler cette lacune. Le groupe œuvre à définir une ontologie harmonisée des arts de la scène, qui inclura selon toute vraisemblance une classe désignant les représentations, quoique le nom et la définition soient encore sujets à discussion. Le groupe considère aussi soumettre une proposition à Schema.org pour l’ajout d’un type d’événement désignant toute exécution devant public d’une œuvre des arts de la scène, indépendamment de la discipline ou du genre.

En parallèle, Culture Creates et CAPACOA ont mis en œuvre dans le graphe de connaissance ArtsData une classe dénotant les représentations. ado:PerformanceEvent est situé comme une sous-classe de schema:Event et une super-classe de toutes les classes plus spécifiques associées aux arts de la scène dans le vocabulaire contrôlé de l’ontologie Artsdata

Jusqu’à ce qu’un nouveau type soit intégré à Schema.org pour désigner toutes les représentations, les développeurs Web qui veulent donner plus de précision à leurs données structurées peuvent utiliser la propriété schema:additionalType et y saisir ado:PerformanceEvent. (note : Ce vocabulaire est toujours en évolution. Une version 2 devrait paraître bientôt)

Pour en savoir plus

Plusieurs formations offertes en novembre aborderont l’utilisation des données structurées dans les arts de la scène.

Wikidata Workshop: The Basics

Contexte : Série d’ateliers Wikidata offerte par CAPACOA et les partenaires Un avenir numérique lié
Date et heure : mercredi, 3 novembre, 15h30 à 17h00 HAE

B2B Digital Collaborations: A New Frontier in the Performing Arts

Conférence : Building a Digital Arts Nation Conference: What’s Next?
Date et heure : mardi, 9 novembre, 12h00 à 14h00 HNE

Votre présence numérique : Améliorons-là !

Conférence : Conférence CAPACOA 2021
Date et heure : jeudi, 18 novembre, 13h30 à 14h30 HNE

Auteur : Frédéric Julien, avec la contribution de Véronique Marino

0 replies

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Leave a Reply

Your email address will not be published. Required fields are marked *