IRMA

Centre d'information et de ressources pour les musiques actuelles

Connexion / inscription

Le panierVotre panier est vide

PUBLICITE
Accueil du site
Accueil du site > Documentation > Focus > L’ENJEU DES MÉTADONNÉES MUSICALES La musique n’est pas qu’un fichier son

Article mis à jour le vendredi 11 avril 2014
Article créé le lundi 4 avril 2011

 
Version imprimable de cet article Version imprimable  
Article

L’ENJEU DES MÉTADONNÉES MUSICALES
La musique n’est pas qu’un fichier son

Payante ou gratuite, la musique circule plus que jamais sur le flux numérique ou en se fixant sur les disques durs. Mais la dématérialisation lui a fait perdre ses données associées. Généralement, on a le nom du morceau et celui de l’interprète, mais rarement plus. Sans parler du besoin d’identification pour les ayants droit. C’est tout l’enjeu des métadonnées pour la musique et c’est le thème d’une live-conférence organisée à la Mix Box le jeudi 28 avril [voir encadré].

PNG - 4.6 Mo

Autrefois, nombre d’informations utiles apparaissaient dans les livrets des CD qui comportaient souvent des photos, éléments de biographie, paroles de chanson, etc. Paradoxalement, le numérique, qui pourrait permettre d’accéder à encore plus d’informations sur les fichiers musicaux — ce qu’on désigne donc comme métadonnées — a souvent tendance à appauvrir leur mise en contexte.

Métadonnées

Une première raison d’être des métadonnées pour la musique est l’identification des œuvres et de tous ceux qui ont contribué à sa création et à sa production. Mais, elles concernent aussi les biographies, les photos… Elles peuvent également décrire le titre lui-même (son genre musical, son rythme, sa couleur, son style…), voire sa disponibilité commerciale, sa date de sortie, organiser des liens vers les dates de concert de l’interprète, les objets de merchandising…
Ainsi, certaines métadonnées permettent d’identifier, d’autres de qualifier, d’autres d’aller plus loin. Certaines sont immuables (les identifiants), d’autres peuvent évoluer dans le temps ou dans l’espace (comme les dates de concert). Certaines sont objectives, d’autres pas (comme le genre musical). Certaines sont libres de droits (nom de l’interprète), d’autres sont liées à des droits (photo de la pochette, biographie de l’artiste…). Certaines sont stratégiques ou commerciales (à qui appartiennent les droits ? quel est le tarif ?…).

Au-delà de l’émotion, l’information. Souvent elle existe, mais elle est fragmentée, dispersée sur différentes bases de données, sites Internet, plateformes en ligne… et encodée dans différents formats. Autant les métadonnées sont importantes, autant l’enjeu de leur interopérabilité devient encore plus crucial, alors que la musique circule sur tous types d’appareils.

Certes, la musique n’a pas besoin de métadonnées pour nous émouvoir. Pas besoin d’un “code ISRC” [voir encadré] pour danser ! Mais sans lui, comment reconnaître le titre ?
Pour pouvoir renseigner la musique, il est nécessaire d’identifier, de tracer. Il s’agit de rémunérer les ayants droit bien sûr, mais aussi d’améliorer l’expérience musicale de l’auditeur, de donner du contexte à ce qui n’est pas qu’un simple fichier son, de connecter des services pour enrichir le contenu, pour mieux monétiser… Les enjeux sont nombreux et concernent des acteurs très divers.

L’intérêt n’est pas forcément de livrer les métadonnées avec le fichier musical puisqu’on peut les rendre accessibles via des bases de données. Encore faut-il qu’elles puissent l’identifier et soient capables de communiquer entre elles. Ainsi organisées, les métadonnées pourraient alors rendre des services immenses, au point que certains ont pu dire : "si le contenu est roi, les données sont les empereurs".

Avant les réseaux

JPEG - 4.5 ko

Wolfgang Schmieder n’a pas attendu Internet pour classifier les œuvres de Jean-Sébastien Bach avec son fameux BWV [1], accompagné de chiffres qui permettent d’identifier, dans toutes les langues, les œuvres du maître. Pouvait-il imaginer — il est mort au début des années 1990 — qu’aujourd’hui, le terme “BWV 846” tapé sur un moteur de recherche donne accès à plus de 600 000 occurrences avec des liens vers les partitions, disques, livres, downloads ou vidéos du “Prélude 1 en do majeur du clavecin bien tempéré”.
La même requête avec ces mots : "le clavecin bien tempéré" + "prélude 1 en do majeur" ne donne qu’un seul résultat. Cela montre tout l’intérêt d’identifier les œuvres, les titres, les artistes, afin de permettre à tous d’échanger non seulement sur l’œuvre elle-même, mais sur tout ce qui la fait exister.

De leur côté, les inventeurs du format MP3 n’ont pas pensé à intégrer dans les fichiers d’autres données que la musique elle-même. Idem pour le format CD. Là, seul l’index [2] du disque comporte les codes ISRC qui permettent, après interrogation d’une base de données [3], de récupérer les informations (noms de l’album, du titre et de l’interprète).

Depuis plus de dix ans, de grands chantiers sont en cours — en France, en Europe et dans le monde — dans le but de mettre en place des identifiants communs. Les plus connus, ISWC pour les œuvres et ISRC pour les phonogrammes, seront bientôt rejoints par l’ISNI, un identifiant commun pour les identités d’artistes (noms d’interprètes, d’écrivains, d’auteurs…). Ces codes ne sont pas tous parfaits — notamment l’ISRC qui est en cours de révision —, mais ils ont l’avantage d’être partagés par tous sur la planète au sein de la fameuse organisation internationale des standards, plus connue sous l’acronyme ISO [4].
Ces codes d’identification ont d’abord un intérêt professionnel. Ils permettent de mieux gérer la collecte et la répartition des droits, suite aux “transactions musicales” que sont la diffusion ou le téléchargement d’un titre et ce, dans le monde entier. Mais ils sont également utiles aux internautes à qui ils permettent de mieux partager des playlists, de relier la musique à d’autres musiques, mais aussi à des informations sur leurs auteurs et artistes, leurs concerts… des recherches qui pourraient ainsi être faites en temps réel et en profondeur.

Be connected

JPEG - 5.8 ko

Car le consommateur veut tout, indifféremment, que les œuvres soient tombées ou non dans le domaine public, qu’elles rapportent ou non de l’argent. Des services orientés utilisateur, comme MusicBrainz, Lastfm, FreeDB ou BBC, essaient de pointer vers le maximum d’autres bases susceptibles de concentrer le maximum d’éléments d’informations. Elles sont parfois collaboratives, généralement incomplètes et toujours en anglais… mais ont le mérite d’exister.

En France, deux grandes bases de données discographiques cohabitent dans les services publics, celle de la BNF qui bénéficie comme pour le livre du dépôt légal et celle de Radio France, qui sert à alimenter les radios du groupe. On peut aller sur la base de la BNF, on aura quelques infos, généralement centrées sur les disques eux-mêmes. Celle de Radio France est pour l’heure réservée en intranet. Malheureusement, ces bases ne communiquent pas entre elles et pas avec les autres. "C’est dommage, chacun remplit sa base dans son coin en écrivant les mêmes informations, c’est une perte de temps et d’argent", regrette Pascal Cordereix, chef du Service des documents musicaux au département audiovisuel de la Bibliothèque Nationale. Il n’existe à ce jour pas de projet de créer une base d’information publique sur la musique en France. "Cela pourrait tout à fait s’inscrire dans le plan de numérisation du patrimoine, il suffirait d’un déclic".

Par ailleurs, alors que les œuvres et les productions sont naturellement protégées par des droits, rien ne permet de connaître la liste de ce qui est dans le domaine public, et de l’écouter. Ainsi, la BNF dispose d’une collection de 300 000 galettes 78 tours parmi lesquelles un certain nombre pourraient être en écoute totalement libre. Mais elles ne sont pas numérisées. "Nous n’avons pas les moyens de le faire seul, nous recherchons donc des partenaires, publics ou privés, pour pouvoir développer ce type de services", explique Pascal Cordereix. "Nous cherchons également à faire évoluer notre base de données afin de faire remonter les informations dans les moteurs de recherche. Le web sémantique [5] est aussi une solution qui permet de croiser les données, sans pour autant développer des bases complexes", ajoute-t-il. C’est aussi ce que pense Vincent Castaignet, cofondateur/CEO de Musicovery, une smart radio permettant de choisir la musique que l’on souhaite écouter à partir de l’ambiance que l’on souhaite créer. "On ne peut pas attendre dix ans que les ayants droit aient construit leur système d’information interopérable pour développer des services musicaux innovants" ajoute-il, reconnaissant que des passerelles entre univers professionnel et grand public sont nécessaires afin de faciliter l’accès à l’information musicale, et donc à sa “consommation”. "La qualité et l’interopérabilité des métadonnées sont une des pièces du puzzle de la monétisation de la musique" estime-t-il.
En attendant, le magazine Billboard rapportait encore récemment que, au cours d’un débat lors du dernier SXSW [6], un représentant de SoundExchange — l’organisme de gestion collective américain en charge de la perception et de la répartition des revenus du streaming des webradios — a lancé : "Plusieurs millions de dollars dorment à la banque en attendant d’être redistribués à “Piste 6, artistes divers label inconnu”", ajoutant "Il y a 117 orthographes différente pour le groupe INXS".

Tracer les usages

JPEG - 4.5 ko

Pour les ayants droit, l’identification est essentielle. C’est à la fois le moyen de tracer l’utilisation qui est faite de leurs œuvres ou de leurs productions, et de redistribuer les revenus générés en fonction des utilisations. Leurs sociétés ont investi lourdement dans des systèmes d’échange de données impliquant la création de bases et la mise en place d’identifiants, de protocoles et de plateformes communes. Les premiers à s’être engagés dans cette voie ont été les auteurs, via la Cisac, Confédération internationale des sociétés d’auteurs et compositeurs.

Dans les années 1990, la Cisac a créé le Common Information System (CIS). Un outil qui permettait l’échange d’information sur les titres, les auteurs et les compositeurs. Il est aujourd’hui largement inadapté à la musique en ligne. La multiplication du nombre de transactions et la baisse des rémunérations pour chacune d’entre elles implique désormais de mettre en place des outils beaucoup plus efficaces, automatisés, rapides… C’est la raison d’être du Digital Data Exchange ou DDEX, qui rassemble plateformes de vente en ligne, producteurs et distributeurs de phonogrammes et sociétés d’auteurs. L’enjeu est de standardiser les échanges commerciaux entre ces différents opérateurs à l’échelle mondiale : avoir un protocole commun qui permette aux ordinateurs de gérer les achats et les ventes, qu’il s’agisse de streaming ou de download, et de répartir ainsi les droits générés. Un seul protocole qui permet d’échanger des transactions électroniques et qui soit compréhensible et exploitable par toutes les machines. Il devient par exemple possible de croiser des rapports de vente issus de différentes plateformes. "Aujourd’hui, la plupart des services de musique en ligne a adopté ce protocole" indique Michel Allain, directeur de l’organisation du système d’information de la Sacem, partie prenante de DDEX. "Même un site comme Youtube a vocation, à terme, à fournir aux ayants droit ses statistiques de diffusion sous ce protocole".

Autre vocation de DDEX, pas encore opérationnelle, la création d’une identité pour toute sortie numérique. "Mais là nous sommes coincés par le code ISRC qui n’est pas assez précis. Les producteurs phonographiques travaillent sur une évolution, un ISRC 2, qui sera beaucoup plus efficace". Les ayants droit ont un intérêt évident à coopérer, ce n’est qu’à cette condition qu’ils pourront faciliter la circulation de la musique légale tout en conservant la capacité de faire remonter les droits.

Immatriculé au GRD ?

L’Europe demande également plus de standardisation. Elle souhaite la mise en place d’une licence paneuropéenne pour la musique en ligne. Une seule licence qui implique que les sociétés d’auteurs de chaque pays puissent gérer ensemble une base commune. Un système de mise à jour doit permettre à tout instant, sur le principe des carte bancaires, de savoir qui, combien, où, comment…
Pour explorer ces solutions, un nouveau consortium a été créé, le GRD (Global Repertoire Database). Cette base devrait référencer toutes les œuvres. Pourtant, au niveau mondial, un autre projet est en route, piloté par l’OMPI [7], et vise à aboutir à la base ultime des œuvres et dans tous les pays, sans considération de problèmes de langues ou de caractères alphabétiques, qu’ils soient russes, chinois, arabes ou latins. "Évidemment, les membres des groupes de ces deux projets se parlent, afin de proposer des solutions compatibles", explique François-Xavier Nuttall, consultant à la Cisac, qui participe aux deux groupes de travail. "Ce sont des projets complexes et cela prendra du temps… Il y a dix ans, je pensais qu’on s’en sortirait en cinq ans", plaisante-t-il.

Mais d’autres dossiers avancent à grands pas comme la création d’un identifiant unique pour les noms des personnes qui créent des contenus. Le lSNI permettra d’identifier, une fois pour toute, un patronyme et donc de retracer toutes les œuvres qu’une même personne aura écrite sous le même nom. Mais aussi, toutes ses prestations dans différents domaines, cinéma, presse, livre, photo, musique, audiovisuel.… que ce soit en tant qu’auteur ou interprète. "Pour le public, l’ISNI sera très utile car il permettra de mettre l’individu au centre de toutes ses créations. La recherche s’en trouvera facilitée, à condition que chacun l’utilise" explique François-Xavier Nutall. Il devrait être implémenté dès cette année.

Open Data ?

Ces travaux de normalisation sont réalisés essentiellement pour répondre à des questions économiques — répartition des droits ou paiement de transactions — sans qu’il n’y ait d’objectif vers le grand public. Chaque opérateur reste propriétaire de ses données et rien n’est proposé pour les rendre accessible à tous, facilement. Mais certaines sont quand même accessibles librement. Ainsi, la Sacem met à disposition un accès à sa base de plus de 4 millions d’œuvres. "C’est notre intérêt de rendre public les informations sur les auteurs et compositeurs des œuvres, avec le code ISWC" souligne Michel Allain. Par contre, les codes ISRC (vers les enregistrements) ou ISMN (vers les partitions) ne figurent pas dans cette base. À l’inverse, pour rechercher un titre à partir de son code, il faudra aller sur la base de la Cisac, celle de la Sacem ne rendant pas ce service… De plus, lacune importante, même si elle est disponible sur mobile Iphone et Android pour montrer la volonté d’ouverture de la société des auteurs, cette base ne contient pas ou peu d’œuvres du domaine public. Mon “clavecin bien tempéré” n’a pas de code ISWC, seuls les arrangements réalisés récemment en ont, et si l’on tape “BWV 846” dans la base de la Sacem, il n’y a pas une seule réponse. Ainsi, quelle que soit la bonne volonté des uns et des autres, l’interopérabilité et l’exhaustivité restent un objectif bien lointain.

Vincent Castaignet, qui pilote le Groupe Musique de Cap Digital, le pôle de compétitivité des industries numériques en Ile-de-France estime que "Les métadatas sont un enjeu essentiel. Certes la question de l’identification des œuvres est importante, mais l’objectif est au-delà : avoir les biographies des artistes, les informations en temps réel en fonction de la géolocalisation, des tarifs, etc., toutes ces technologies associées aux contenus apportent un supplément à l’expérience musicale et sans doute une meilleure manière de la monétiser". Mais voilà, construire la base idéale est hors de portée, du moins à court terme. Une des pistes selon Vincent Castaignet serait de créer un observatoire des données musicales. "Au moins, cela permettrait de savoir ce qui est disponible, où et comment. Il est également envisageable de construire des bases d’information en faisant appel aux utilisateurs sur le principe des UGC (user generated content) et, quand cela est possible, de croiser avec des bases de la profession."
Avoir une base française est un enjeu crucial pour les artistes et pour la création, pour le public et pour toutes les jeunes entreprises innovantes qui cherchent à valoriser la musique sur les réseaux et à travers de nouveaux services. Il y a fort à parier qu’on en reparlera de tout cela le jeudi 28 avril à la Mix Box.

Rémi Bouton

[1] Bach-Werke-Verzeichnis… ce qui, en allemand, veut dire catalogue des œuvres de Bach.

[2] L’index est un petit fichier qui contient la liste de tous les titres gravés sur un CD.

[3] GraceNote par exemple.

[4] L’International Standard Organisation élabore des normes partagées par tous.

[5] Un ensemble de technologies qui permettent d’enrichir et de partager tous types de données de manière structurée (source : wikipédia), et donc reposant sur les métadonnées…

[6] South by Southwest (SXSW) est un festival de musique qui se tient chaque année à Austin, Texas, États-Unis. Il est de plus en plus consacré à Internet et aux nouvelles technologies et a beaucoup compté dans l’émergence de Twitter.

[7] Organisation mondiale de la propriété intellectuelle.

PUBLICITÉ

Ils ont (méta)donné leur avis

"Plusieurs millions de dollars dorment à la banque en attendant d’être redistribués à “Piste 6, artistes divers label inconnu”", un représentant de SoundExchange lors du dernier SXSW (source Billboard).

- Vincent Castaignet, co-fondateur/CEO de Musicovery, “pilote” du Groupe Musique de Cap Digital,
- François-Xavier Nuttall, consultant à la Cisac
- Michel Allain, directeur adjoint de la Sacem
- Jean-François Bert, dirigeant de Transparency
- Maÿlis Dupont, fondatrice de CommOnEcoute
- Jean-François Dutertre, délégué général de l’Adami ont répondu à nos questions.

Lire les interviews


Noms de codes

- ISRC (International Standard Recording Code) : identifie un enregistrement audio ou vidéo (clip)
- ISWC (International Standard Musical Work Code) : identifie une œuvre
- ISNI (International Standard Name Identifier) : identifie un nom d’artiste
- ISMN (International Standard Music Number) : identifie des publications musicales imprimées (partitions)
- IPI (Interested Parties Information) : attachées aux numéros ci-dessus, identifie les parties intéressées (ayants droit)
- GRID (Global Release Identifier) : identifie les sorties numériques (c’est le code barre virtuel). Développé par les producteurs (mais n’est pas un standard ISO).


Live-conférence à la Mix Box

Le jeudi 28 avril, Paris Mix, l’Irma et Mondomix organisent une live-conférence à la MixBox intitulée "Jamais sans mes métadatas !". Cette conférence, streamée en direct, est le “numéro 0” d’un cycle d’émissions régulières — “La musique demain” — consacrées au monde musical et à l’innovation.
Préparée et animée par Rémi Bouton, cette première édition portera sur les sujets abordés dans ce focus.

Cette rencontre débutera à 17h30, au 146 rue des Poissonniers pour les participants présents (sur inscription, nombre de places limité). Elle sera accessible sur le site dédié — www.lamusiquedemain.com — pour les participants en ligne. Faisant intervenir plusieurs professionnels (voir programme sur le site dédié), elle bénéficiera d’une interactivité via un “mur de tweets”.


- Pour s’inscrire : remplissez le formulaire en ligne
- Voir le site dédié


Ne m’appelez plus DRM ?

Voilà un terme qui a donné beaucoup de sueurs froides aux acheteurs de CD qui n’arrivaient pas à les lire sur leur autoradio ou à ceux qui, ayant acheté le fichier à la Fnac ne pouvaient pas le lire leur iPod. En fait, c’est plutôt les verrous anti-copie et l’absence d’interopérabilité des formats qui en étaient en cause. L’acronyme DRM signifie Digital Right Management donc gestion des droits numériques. Certaines métadonnées, si elles sont incluses dans le fichier musical, agissent comme des DRM dans le sens où elles permettent l’identification et donc la traçabilité, indispensable pour rémunérer les ayants droit. L’absence d’interopérabilité et l’aspect intrusif des DRM ont conduit les maisons de disques à les abandonner pour la vente de CD ou de fichiers (mais elles les conservées pour l’écoute en streaming).

Pour l’identification, la prise d’empreintes sonores permet facilement de s’en passer. Des outils comme Shazam ou Yacast savent reconnaître un enregistrement et de là, de remonter toute la chaîne d’information si les bases de données sont bien renseignées.


Liens utiles

- All Music Guide
- BNF
- Cisac
- FreeDB
- GraceNote
- GRD
- IMR
- MusicBrainz
- Sacem
- SCPP
- SPPF

IRMA : Centre d'information et de ressources pour les musiques actuellesInformations légalesRégie publicitaireNous contacterPlan du siteRSS 2.0