Expérimentations et business des métadonnées musicales

Publié le mercredi 6 avril 2016


VINCENT CASTAIGNET

Musicovery


« Musicovery cherche toujours à optimiser le processus de personnalisation. Actuellement nous testons de nouveaux modèles mathématiques pour adapter plus tôt la personnalisation à partir des données comportementales et de la mesure de la qualité de chaque playlist générée à chaque auditeur ».

Dans le monde des métadonnées musicales, en constante évolution, Musicovery compte parmi les pionniers. Vincent Castaignet, son fondateur (et également responsable du groupe Musique de Cap Digital), faisait d’ailleurs partie des experts interviewés en 2011 par l’Irma, et du panel de la première édition de La Musique Demain sur le sujet. Depuis sa création en 2006 (la préhistoire !), le métier de Musicovery, c’est de composer automatiquement des playlists personnalisées. Et pour cela, disposer de métadonnées sur les contenus est une nécessité.

Musicovery utilise des métadonnées descriptives sur les artistes et les titres (genres, orchestration, rythmique, ambiance, ère chronologique…) et a ainsi conçu un modèle qui permet à chaque auditeur d’explorer l’univers de la musique à partir de ce qu’il aime et connaît, et de naviguer au-delà, de la manière qui lui convient le mieux, en fonction de son appétence pour la découverte, la nouveauté, sa capacité à mémoriser… Comment ? En utilisant les métadonnées récoltées pour tous les calculs de recommandations et playlists, mais également pour aider l’auditeur à comprendre les recommandations qui lui sont faites (genre, ambiance, contexte…) et à situer les artistes/titres qui sont proposés (similaire à tel artiste, titre…). L’automatisation de l’indexation de l’ambiance a été réalisée avec l’Ircam dans le cadre du projet de recherche Bee Music. Sur ce dernier, qui a abouti à la formalisation de la nouvelle base BIPP, Musicovery est intervenu en sous-traitance. Le modèle de recommandation de Musicovery ne repose que partiellement sur de la similarité entre objets. Comme l’explique Vincent Castaignet, « les métadonnées d’identification sont aussi cruciales pour permettre à nos partenaires d’interroger l’API de Musicovery avec les identifiants (titres et artistes) dont ils disposent ». Aujourd’hui, Musicovery traite 100 millions de datas comportementales, et compte parmi ses clients des entreprises comme IHeartRadio (n°2 des smartradios aux États-Unis) ou Kantar Média.

Pour illustrer l’importance des métadonnées pour une bonne indexation de la musique, Vincent Castaignet raconte : « des parents cherchaient à lancer une playlist à partir du nom d’un artiste de musique pour enfants. Malheureusement il porte le même nom qu’un groupe de métal très violent. Les données de ces deux artistes avaient été fusionnées dans la base de Musicovery. À la lecture des plaintes des parents, ce n’était pas exactement la programmation qu’ils souhaitaient pour leurs enfants… Nous avons corrigé le problème d’homonymie, mais cela illustre les problèmes d’identifiants récurrents de la filière ».

>>En savoir plus sur Musicovery


Matthias ROBINE

Simbals


« On présente Simbals par l’intelligence des données musicales, parce qu’à partir de la nébuleuse de données à notre disposition on doit répondre simplement aux questions complexes de nos clients »

Simbals, c’est d’abord une histoire de chercheurs. Ou comment la rencontre, en 2004 dans un labo, entre personnes travaillant sur des domaines différents, aboutit à une idée qui se transforme peu à peu en business. Pierre Hanna, spécialiste du traitement du signal sonore et musical, et Pascal Ferraro, bio-informaticien, sont rejoints par Julien Allali et Matthias Robine. Le pari des 4 chercheurs : appliquer des techniques développées pour la bio-informatique et la comparaison de génomes humains à des problématiques de recherche musicale. Vaste programme ! Et qui s’avère payant, mettant à profit plus de 10 ans de recherche.

Aujourd’hui, la technologie développée les positionne comme experts du big data musical, et leur permet de proposer des solutions pour l’identification des contenus musicaux, la recommandation musicale et le suivi prédictif des tendances, pour le streaming et les médias. Avec pour objectif, selon Matthias Robine, de « répondre simplement aux questions complexes de nos clients ». Universal (complétion de métadonnées, listing d’ISRC…), Yacast (pour l’identification des diffusions musicales en télévision, radio et club pour la Sacem : plusieurs émissions TV de France 3, France 5 et Canal + sont synchronisées avec des applications mobiles grâce aux technologies audio Simbals) ou encore Deezer (pour l’enrichissement de playlists et de radios) ont recours aux services de la startup.

Les métadonnées utilisées par Simbals sont nombreuses. Avec une distinction entre usages BtoB et BtoC. Pour le BtoB, ce sont les codes d’identification usuels : ISRC, UPC, Grid, nom des artistes, des titres… « Pour le BtoB, nous utilisons des informations peu nombreuses, mais qui doivent être sûres et fiables », précise Matthias Robine. Pour le BtoC, ces données sont complétées par de multiples sources de métadonnées hétérogènes que Simbals va croiser et mettre en cohérence : descripteurs sémantiques (styles, ambiance, tempo, rythmique…), données sur les utilisateurs et les comportements d’écoute… Ces données "subjectives" sont principalement récoltées auprès des plateformes de streaming partenaires.

En analysant toutes les données disponibles sur un titre, Simbals s’est ouvert de nombreux horizons : gestion collective des droits, analyse fine des comportements utilisateurs pour les services de streaming et leurs régies publicitaires (acquisition et fidélisation), solutions pour le second screen pour les médias, suivis de titres ou de programmations musicales à la radio, établissement de metrics d’utilisation, ou de critères de popularité… Actuellement, Simbals travaille au renforcement de ses solutions, et sur de nouveaux projets, encore secrets, mais qui ne devraient pas tarder à faire parler d’eux.

>> En savoir plus sur Simbals


Denis GAUCHER

Kantar Media- BIPP


« À partir du moment où l’on envisage quelque chose autour de la musique, BIPP peut être utilisée (reconnaissance de pochettes, de sons, enrichissement de contenus…). C’est un outil qui va fluidifier le fonctionnement de la filière musicale, tant pour la collecte de droits que pour la vente ou la distribution, physique ou numérique »

2016 est une année capitale pour les métadonnées musicales en France. Pour quelle raison ? Parce que la nouvelle base BIPP, formalisée à l’issue des 3 années de recherche et développement du projet Bee Music, est opérationnelle. BIPP, c’est la base de données qui recense toute la production musicale disponible sur le sol français. Propriété du Snep, elle est confiée en gestion depuis 2008 à Kantar Media, qui a conduit Bee Music. Et a bénéficié de l’expertise et du travail d’un consortium composé de l’Ircam, d’Idol, de Sinequa, LTU Technologies et Arkena. Le résultat : une base de données de référence pour la filière musicale, exhaustive et homogène, avec une indexation riche et automatique. Et disponible via API, interface web et tablette, permettant d’interroger la base et d’extraire les données souhaitées. De même, la base peut être intégrée dans tous les systèmes d’information ou les logiciels de gestion.

Que trouve-t-on dans BIPP ? Plus de 7 millions de titres, sans aucun doublon, des extraits de 30 secondes et des full tracks, le tout décrit et référencé selon une centaine de métadonnées différentes, et 36 milliards de fingerprints ! De quoi garantir une identification simple et rapide.

Le point de départ du projet Bee Music, c’est un constat simple : l’omniprésence et l’importance des métadonnées. « Ce constat est valable pour tous les secteurs. On voit bien que les opérateurs et les annonceurs ont besoin de disposer des métadonnées les plus riches et les plus propres possibles, pour être plus efficaces. C’est une transformation en profondeur qui s’installe dans l’industrie », explique Denis Gaucher, directeur général Europe de Kantar Media et Kantar Music. Et, au démarrage du projet, l’environnement n’était pas propice : des bases de données musicales multiples et non interopérables, séparant le physique et le numérique, une faible qualité́ des métadonnées, entraînant une mauvaise expérience utilisateur et une répartition des droits approximative et tardive. Mais 3 ans plus tard, le chemin parcouru est immense, et ouvre un avenir plein de promesses. « Ce fut une belle aventure humaine, qui nous a appris énormément sur la gestion de projet, la collecte et le traitement d’un très grand nombre de données, la création/intégration de technologies dans un environnement industriel », confie Denis Gaucher. En plus de sa commercialisation, il s’agit désormais d’exporter BIPP, car «  in fine, valoriser cette base, c’est mettre en avant la filière musicale française », poursuit le directeur général, qui envisage aussi de décliner le savoir-faire acquis dans d’autres secteurs d’activités, notamment la publicité.

>> En savoir plus sur BIPP


Jean-Luc BIAULET

Music Story


« La musique est une somme d’acteurs et une chaîne de valeur extrêmement complexe : auteurs, compositeurs, interprètes, producteurs, éditeurs, SPRD… Et peut-être que la data est le seul élément qui constitue un véritable liant. C’est pour cela qu’elle est stratégique »

Pour Jean-Luc Biaulet, ingénieur de formation, la musique est un peu une deuxième carrière. Spécialiste de la business intelligence, sorte d’ "ancêtre" de la data, il a d’abord officié dans l’industrie et la grande distribution, un secteur pionnier dans le domaine. Mais son affinité originelle avec le secteur musical, qui, selon ses mots, « a traversé une crise comme peu d’autres secteurs l’ont connue », l’a amené à mettre au service de la filière les connaissances et l’expertise acquises durant les années passées à travailler pour le commerce. En 2008, il crée Music Story, société spécialisée dans le traitement des métadonnées liées à la musique, qui offre un nettoyage et un enrichissement éditorial des catalogues à travers l’agrégation de données. Avec pour objectif de faire une smart curation : une curation la plus précise et intelligente qui soit pour produire la meilleure qualité de données possible.

Aujourd’hui, Music Story traite toutes les métadonnées disponibles sur la musique (identifiants standardisés ISRC, ISWC…, titres, albums, artistes, photos…), avec une double approche : un traitement automatique (rapprochement sémantique avec des moteurs de matching) et un traitement humain par des documentalistes qui savent gérer et définir des périmètres de catalogues et une équipe éditoriale qui assure une qualification fine (Plus de 120 profils artiste traités par semaine). Le tout sur une base de données de 15 millions de titres. Des poids lourds du secteur font aujourd’hui confiance à Music Story, qui compte deux types de clients. Tout d’abord des plateformes de streaming comme Deezer et des retailers comme Amazon, pour qui l’entreprise fournit des services d’enrichissement de catalogue ou de matching. Ensuite, des médias (chaînes ou radios musicales), sur des playlists définies, pour qu’elles aient accès à des données fiables sur les titres. Des clients qui, comme l’explique Jean-Luc Biaulet, « sont de plus en plus vigilants et exigeants sur les données. On observe une demande croissante de qualité, y compris et surtout sur des données de base. Avoir 1 titre, 1 album et la bonne pochette, ça n’a l’air de rien, mais agréger des API sur Internet ne suffit pas pour répondre aux besoins des plateformes et des médias digitaux ».

D’où l’objectif constant de Music Story d’avoir une qualité de couverture optimale sur l’ensemble des données de base, tout en continuant à intégrer de nouvelles sources. « Les données de base des catalogues ne sont toujours pas clean. Il n’y a qu’à penser à la question des featurings par exemple. Ce qui apparaît comme le travail premier de l’établissement et du nettoyage des métadonnées est loin d’être achevé », insiste Jean-Luc Biaulet. De quoi envisager l’avenir sereinement.

>> En savoir plus sur Music Story


François MILLET

Vital Song / Boem


« En l’absence d’offre légale, des réponses illégales apparaissent pour répondre aux besoins des consommateurs. Le guichet unique était la seule solution crédible et viable vis-à-vis du public et des exploitants de paroles »

Octobre 2007. Les iPods (lancés en 2001) et autres lecteurs MP3 ont trouvé leur place dans les poches des adeptes de musique. Le smartphone, qui n’est pas encore devenu le single device for all uses, est en pleine montée en puissance. Un constat qui n’échappe pas à François Millet, fondateur et dirigeant de la société d’édition Vital Song. Lors d’une réunion à la CSDEM, dont il est alors vice-président, il interroge ses confrères, brandissant son téléphone : « comment va-t-on faire demain pour être rémunérés sur les usages liés aux smartphones, notamment sur les gens qui cherchent les paroles des chansons pour chanter au concert de leur star préférée ? ». François Millet se voit confier le soin de dresser un état de l’art et d’envisager des solutions. Il en résulte un mémo pour la mise en place d’une offre d’exploitation des textes des chansons via un guichet unique, en BtoC et en BtoB. Cette intuition d’un éditeur sensible depuis toujours à l’innovation et au digital, c’est le point de départ du projet Boem (Base oeuvres de l’édition musicale). Le timing est parfait, la mission Zelnik pose dans le même temps le constat que l’absence d’offre légale encourage les usages illicites. En 2010, Boem est opérationnelle.

Boem, c’est une interface qui permet aux éditeurs membres de la CSDEM d’intégrer dans une base de données les paroles des chansons dont ils sont cessionnaires, avec les métadonnées associées : titre de l’œuvre, noms des ayants droit (auteurs, compositeurs, éditeurs), codes IPI, ISRC, ISWC, les clés de répartition entre les différents coéditeurs, les principaux artistes interprètes, la langue et enfin des tags. Une fois ces données intégrées, la fiche de l’œuvre est créée. Tous les textes et les métadonnées d’identification des œuvres sont ensuite mis à disposition des clients de Boem. Des clients aujourd’hui très variés : pures players paroles, plateformes d’environnement musical (clips, paroles…), mais également des groupes de presse, notamment de presse people, qui s’en servent pour marketer leurs contenus et faire de la recommandation.

La base, disponible en API, est administrée techniquement depuis 2011 par Music Story, la CSDEM s’occupant de la gestion de l’interface et des accès. Comme l’explique François Millet, « nous avons la chance en France d’avoir des entreprises et des professionnels de qualité. Nous sommes dans les leaders mondiaux de la métadonnée. Nous avons des algorithmes, des data scientist, des ingénieurs et informaticiens de pointe. Les problèmes ne sont pas techniques. La vraie question, c’est la quantité et la qualité des données ». Les bases de données ne sont aujourd’hui toujours pas parfaitement propres et intéropérables, et la situation particulière de l’édition musicale (transferts de catalogues, sous-édition, multiplicité des éditeurs sur une même oeuvre, correspondance entre ISRC et ISWC…) rend les choses plus complexes que pour les producteurs, propriétaires uniques des masters. Et l’échec du projet de GRD (Global repertoire database) ne facilite pas les choses.

La suite immédiate pour Boem, ce sont des logiques de partenariat et de synergie avec des grands acteurs internationaux comme Lyricfind ou Musixmatch, qui présentent l’avantage d’avoir un catalogue international, pour associer les paroles d’œuvres françaises dans leurs deals commerciaux.

>> En savoir plus sur Boem


Jean-Robert BISAILLON

TGiT


« 2016 va certainement être l’année des grands déblocages. La base ISRC a été rendue publique, sous peu la base ISWC Fast track va aussi l’être pour tous les ayants droit. Le projet Cis-net for right holders devrait permettre de rendre publiques et interrogeables les informations sensibles liées aux identifiants uniques. Le problème de la mise à disposition des informations de base devrait être solutionné au moins en partie au cours de cette année »

« Les métadonnées sont comme le pain d’un sandwich au fromage fondu, la fibre qui permet de contenir cette liquéfaction, qui permet une consommation optimale et durable de la musique numérisée. Si nous privons la musique numérique des informations qui la décrivent, l’auditeur ne sait pas ce qu’il écoute et les créateurs ne sont pas payés pour leur travail. Si nous privons le grilled-cheese du pain, ce n’est plus un sandwich au fromage fondu, c’est un dégât ». Voilà comment Jean-Robert Bisaillon, "musicien gastronome" québécois, résume de façon limpide l’enjeu des métadonnées musicales. Outre-Atlantique, il est d’abord connu pour sa carrière musicale. Au sein des groupes de new wave Red Shift et Disapointed A Few People puis du groupe francophone French B, il utilise depuis les années 80 synthés et ordinateurs pour créer. Très tôt sensibilisé et intéressé par les problématiques de diffusion (création de la Sopref), c’est après un retour par la case études qu’il embrasse la cause des métadonnées, à partir d’une double réflexion : le passage de l’analogique au numérique entraîne une perte importante d’informations, et l’ensemble des acteurs de l’industrie de la musique travaille en silos, sans communication entre les différentes familles d’ayants droit et d’acteurs de la chaîne de valeur, entraînant des problèmes d’interopérabilité des données associées à la musique.

Il se lance dans un travail de recherche-action approfondi, qui l’amène à imaginer la création de TGiT (première version lancée en décembre 2014), pour répondre à l’absence d’outil à la portée des créateurs pour saisir les données d’indexation au moment de la création ou de l’enregistrement sonore, en amont de la chaîne de droits. Les outils d’asset management, logiciels ou plateformes, sont extrêmement coûteux et donc pas à la portée des créateurs, ni même des petits labels et éditeurs qui gèrent leurs catalogues de façon intuitive sous Excel ou Filemaker. Conséquence : « les œuvres dématérialisées se mettent à circuler dans les réseaux commerciaux, avant que les infos ne soient consignées. Et une fois que les enregistrements sonores sont partis dans la nature, il est trop tard pour les réindexer », explique-t-il.

TGiT est un logiciel développé en open source en langage Python. Il propose un music tagger simple et intuitif, gratuit, qui permet de saisir une cinquantaine de champs de métadonnées et de les encapsuler directement dans les fichiers audio (MP3 ou Flac), tout en sauvegardant des copies de protection. TGiT se prolonge d’un service payant : une plateforme d’exportation et de transmission des données à des tierces parties (sociétés de gestion collective, agrégateurs, plateformes download et streaming, bibliothèques/médiathèques, sociétés de big data, entreprises d’enrichissement de contenus, entreprises de sondages ou tracking comme Yacast…). Si l’outil est puissant, les freins viennent plutôt de l’organisation de l’écosystème musical : « tous les acteurs de la chaîne voudraient que les ayants droit saisissent les informations descriptives chacun dans leur interface web propriétaire. Ils imposent tous de refaire ad nauseam le même processus de saisie des informations ». TGiT a ainsi répertorié, de façon non exhaustive, une cinquantaine de tierces parties auprès desquelles il serait envisageable de devoir transmettre ces informations. Le travail des prochains mois pour TGiT, c’est de faire tomber ces murs, pour faire en sorte que toutes ces tierces parties offrent des mécanismes automatiques d’ingestion par API ou par transmission FTP, pour que l’information puisse circuler de façon simple et fluide entre tous les acteurs.

>> En savoir plus sur TGiT


Julien PHILIPPE

Agrégateur Youtube


« Les débuts de Youtube, c’était le « far west » en termes de droits et de monétisation. Les choses se mettent en place pour une bonne régulation. La monétisation Youtube est un service forcément limité en terme d’offre, puisqu’il faut un contrat spécifique avec la plateforme »

Julien Philippe, c’est en quelque sorte un couteau suisse des métadonnées pour la gestion de la monétisation sur Youtube. Pendant 3 ans chez Believe, à différents postes (validation des métadonnées, promotion internationale, sorties et mises en avant sur les plateformes comme iTunes ou Deezer, gestion des droits voisins), il affine son profil de digital right manager, en s’occupant des problématiques de conflits des réclamations liées à l’exploitation de catalogue et des questions de rémunération des droits de reproduction mécanique sur les exploitations digitales aux USA. Il passe ensuite une année chez Melberrries à travailler la monétisation du catalogue de TuneCore.

Aujourd’hui, il se positionne, à côté de son activité de label manager, comme agrégateur Youtube et gestionnaire de monétisation pour des labels. Comprenez par là, s’assurer que la monétisation des contenus dont il est propriétaire ou qu’il représente est bien faite, et qu’elle soit fléchée sur les bons ayants droit. Et la matière première de ce travail, ce sont de bonnes métadonnées. « Il n’y a pas besoin de beaucoup de données, mais les quelques données nécessaires doivent être parfaitement clean », explique-t-il. Pour la monétisation sur Youtube, les informations primordiales sont, en plus du fichier audio de référence pour le matching avec les vidéos, le nom de l’artiste, le titre du morceau, l’ISRC, le nom du label, et éventuellement l’UPC pour la gestion d’albums complets. Les labels clients fournissent donc ces informations, et la monétisation peut être activée. Les métadonnées contextuelles ne sont pas nécessaires. Ensuite, tout se passe dans l’interface de Youtube. Et pour avoir accès au CMS (Content management system), il faut être certifié par Youtube et avoir suivi des formations spécifiques délivrées par la plateforme, et renouvelables chaque année. Autant dire qu’actuellement, ils sont peu nombreux en France à pouvoir le faire.

Une activité qui paraît simple, à première vue, mais pour s’assurer de traquer toutes les utilisations, et notamment les fameux UGC (User generated content), il faut être précis, pour qu’à chaque upload par Monsieur Tout Le Monde d’un titre qui lui appartient ou qu’il représente, celui-ci soit notifié, dans son interface, qu’une claim a été signalée. Comprenez : un ayant droit revendique la vidéo. Mais M.Toutlemonde (toujours lui !) n’est pas le problème principal de Julien Philippe, qui détaille : « Monsieur Tout Le Monde qui uploade sa vidéo de vacances ne va même pas se rendre compte que le contenu de sa vidéo a été matché avec le contenu d’un ayant droit. Par contre, de plus en plus d’utilisateurs, dans la vague des Youtubeurs, monétisent : soit en faisant des vidéos, soit en re-uploadant des contenus qui ne leur appartiennent pas. Un ayant droit peut s’opposer à ces utilisations, s’il a un suivi précis de ses contenus ». Mais les problèmes de "conflit de propriété" ne se limitent pas à ces questions. Si un titre a changé de distributeur, plusieurs fois depuis le démarrage de Youtube, et qu’il n’a pas renoncé à la monétisation, ou que le contenu n’a pas été remonétisé par le nouveau distributeur ; s’il fait partie des millions de titres déversés au démarrage sans attention portée aux métadonnées ; si un licencié d’un label s’est arrogé les droits "monde", ou qu’un ancien licencié n’a pas stoppé sa monétisation… Les cas de figure sont nombreux. Sans parler des conflits de chevauchement sur des portions de fichiers. Les besoins de suivi de monétisation ne font que commencer…


Magali CLAPIER

Transparency Rights Management


« Il ne s’agit pas de dire qui fait bien ou mal les choses, il s’agit de réduire les dysfonctionnements entre d’un côté une industrie relativement traditionnelle et de l’autre des acteurs numériques qui raisonnent d’abord en termes de services »

Magali Clapier est selon son propre aveu sur Twitter « in love with metadatas ». Et, comme toutes les histoires d’amour, celle-ci a démarré par une rencontre. Alors en charge de la musique classique au Bureau export, elle mène une opération de promotion à Londres avec HMV pour la mise en avant d’une vingtaine de disques français. On est en 2007, et les distributeurs souffrent, HMV en tête, qui déposera le bilan quelques années après. Elle transforme donc l’opération en une journée d’information pour la filière française intitulée "Et le classique sur le web…", qui traite de la distribution et de la promotion en ligne. Et très vite, inévitablement, se pose la question des métadonnées. Un exemple ? En recherchant sur iTunes La Flûte enchantée, ne ressortent que des remixs ou des titres pour enfants, alors que les catalogues sont sur la plateforme. Le calibrage des métadonnées ayant été initialement fait sur la pop, les choses se compliquent quand il s’agit de musique classique. Elle rejoint en 2012 la mission de préfiguration du Centre national de la musique, où la question des métadonnées est évidemment abordée. Le projet ne voyant pas le jour, c’est au sein de Transparency Rights Management qu’elle poursuit son histoire avec les datas, en tant que business development director.

Créé par Jean-François Bert en 2010, Transparency Rights Management est un tiers de confiance spécialisé dans les droits musicaux. La société certifie, traite et optimise les usages de musique en ligne : « on interface les plateformes et les ayants droit pour faire en sorte que ces derniers puissent récupérer le maximum de droits possible, à contrats équivalents », détaille Magali Clapier. Le premier service proposé, c’est la certification des usages, que l’entreprise a par exemple mené sur Dailymotion pour le compte de la Sacem.

Aujourd’hui, Transparency commercialise également Track’n’Claim, un outil qui n’a pas d’équivalent sur le marché. Son rôle, certifier, non pas les usages, mais la situation des droits sur une vidéo sur Youtube : « avec notre moteur, un créateur peut avoir une vue sur toutes les utilisations qui sont faites de sa composition : en traitant les métadonnées, le moteur fait remonter toutes les vidéos l’utilisant. Le créateur peut ensuite établir si cela lui appartient ou pas », explique-t-elle. La source des informations nécessaires à ce travail, ce sont les données disponibles dans le CMS (Content management system) et la data API de Youtube. Quand on sait que le titre d’une vidéo ne correspond pas toujours (loin de là !) à l’œuvre utilisée, ce n’est pas toujours simple… Track’n’Claim propose deux versions : une "pro", destinée à ceux qui manipulent les CMS et une "lite", pour les créateurs et les artistes, via leurs sociétés d’auteurs ou leurs labels. Les clients de Transparency sont principalement des sociétés d’auteurs compositeurs et éditeurs, comme par exemple la PRS for music, la Sabam et d’autres clients sous "NDA" (accord de confidentialité). En effet, « le publishing est beaucoup plus complexe à gérer en ligne que le recording. Sur ce dernier, la propriété est unique, alors que de nombreux ayants droits peuvent réclamer des pourcentages sur une œuvre ».

L’avenir immédiat pour Transparency, seule entreprise avec MusicBrainz à être identifiée par la Commission européenne comme experte sur les music data, c’est de développer ses outils pour les ouvrir très prochainement à d’autres plateformes (Deezer, Soundcloud…).

>> En savoir plus sur Transparency Rights Management


Xavier FILLIOL

Radioline


« La métadonnée est capitale, c’est la matière première qui nous permet de proposer de nouveaux services et de créer de nouveaux médias. Mixer flux audio et flux vidéo pour créer un nouvel hypermedia ne peut se faire qu’à partir de contenus enrichis »

Musicien et informaticien de formation, passé aussi par le marketing et la musicologie, Xavier Filliol milite depuis longtemps pour les métadonnées : « aujourd’hui, ce que je fais est une synthèse de tout ça. Ce qui apparaissait très déroutant à l’époque pré-Internet est finalement très cohérent. C’était une bonne intuition ! », confie-t-il. Serial entrepreneur, il fonde en 1998 mp3.fr, puis Musiwave en 2000, revendu en 2006, puis Audionamix (entreprise de son sur le 5.1 avec 1 algorithme permettant de faire de la séparation sonore par instrument). Mais c’est avec Baracoda, créée en 2007, qui deviendra Radioline en 2012, que le traitement des métadonnées prend une dimension conséquente.

Depuis 8 ans, Radioline a développé une base de données de plus de 60 000 stations de radio et podcasts et propose à plus de 5 000 radios clientes dans le monde plusieurs niveaux de services. Pour une raison évidente pour Xavier Filliol : « dès lors qu’il y a un écran, et que les gens ne se limitent pas à faire play/pause sur le Net, on ne peut pas se contenter du seul flux de musique ». Tout d’abord, de l’enrichissement éditorial et de la contextualisation de contenus. Radioline récupère, par de nombreuses méthodes, toutes les métadonnées textuelles et visuelles disponibles : celles qui concernent la musique diffusée (titre, artistes, pochettes d’album, photos…), mais également celles relatives aux radios (grilles de programmes, nom de l’animateur, nom de l’émission, nom de la chronique, logos, photos…). Ensuite, Radioline propose de la valorisation en termes de services et de partenariats, « impossible à réaliser sans métadonnées » : possibilité d’exporter les titres en un clic sur les playlists Deezer ou Spotify des utilisateurs, d’acheter une place de concert ou du merchandising correspondants… Et enfin, un troisième niveau de services abolit complètement la frontière entre streaming audio et vidéo, pour formaliser un hypermédia, un multimedia distant : « à partir de la collecte et du traitement des métadonnées disponibles sur un flux audio, nous recréons un flux vidéo correspondant. Nous créons donc un autre service », à partir de vidéos, d’images Isntagram, de tweets liés. Les clients, comme RFI et Canal + en France, Proximus et VOO en Belgique n’ont plus qu’à récupérer l’URL du flux généré pour le streamer sur Dailymotion ou Youtube.

Depuis 2 ans, Radioline a fortement investi un marché en pleine explosion, celui de la TV connectée, qui représente désormais un quart de son audience avec une croissance de +400% sur les 6 derniers mois ! Via l’allemand Foxxum, Radioline alimente ainsi des fabricants de TV connectées comme Sharp, Hayer ou Medion. L’entreprise s’adresse aussi aux OTT (Over the top) comme Netflix qui proposent des contenus pour ces "nouveaux supports". Une orientation de marché confirmée par la dernière enquête Mediamétrie de septembre 2015 sur la global radio : la télévision connectée est le 3e écran utilisé pour écouter la radio. Radioline vient également de développer deux applis TV sous android et html5, qui ont la particularité d’être cliquables, repoussant encore les limites du bon vieux poste. Pour monétiser ses solutions développées pour tous les appareils connectés à Internet, Radioline a signé des accords avec le groupe Mobile Network, Opera Media Works, Advideum et Triton numérique.

>> En savoir plus sur Radioline


Bertrand et Johann SEBENNE, Pierre ANOUILH

Blitzr


« Notre chantier prioritaire pour 2016, c’est d’avoir la BDD la plus complète et la plus exhaustive au niveau mondial. Ensuite, nous serons à même de recroiser notre BDD avec toutes les métadonnées juridiques permettant l’identification et le paiement des droits »

Blizr, c’est d’abord l’aventure de trois musiciens activistes de la région bordelaise. Membres du groupe de rock Year of no Light, créateurs d’un label indé, réalisateurs d’émissions de radio et organisateurs de concerts… « Autant d’activités qui nous ont confrontés aux problèmes de diffusion, de référencement et de récupération des droits sur les plateformes numériques », confie Pierre Anouilh. Ce docteur en sciences sociales, qui a travaillé sur la résolution des conflits armés et la médiation en Afrique subsaharienne, s’est associé à ses partenaires de groupe, Bertrand et Johann Sebenne, tous deux ingénieurs. Croisant leur passion et leurs compétences, ils créent officiellement Blitzr en octobre 2013, après 2 ans d’incubation.

Le projet de la startup est simple et ambitieux à la fois : créer une meta-base de données avec identifiants uniques ad hoc, qui permette de rassembler toutes les données disponibles et d’établir toutes les correspondances entre les différentes BDD et services existants. « Les enjeux sont énormes dans le monde de la musique, autour de problèmes toujours pas résolus à l’heure actuelle : beaucoup de ces métadonnées sont hétérogènes, les bases ne sont pas interopérables et il n’existe pas de normes efficientes, ce qui entraîne erreurs, doublons… » détaille Bertrand Sebenne. Pour se faire, Blitzr va glaner l’ensemble des métadonnées disponibles sur la toile, partout où il y a référencement de contenus liés à la musique : les données des BDD ouvertes comme MusicBrainz, Discog ou encore Wikipedia, les identifiants des plateformes de streaming comme Deezer et Spotify, les identifiants des plateformes de ticketing comme TicketConcert…. Et la « magic sauce » de la startup, c’est de matcher proprement toutes ces données, en les nettoyant et les dédoublonnant. Le spectre est large : métadonnées afférentes aux œuvres, en numérique et en physique, métadonnées liées aux enregistrements, quel que soit le support (nom de l’œuvre, du morceau, de l’artiste, du label, durée des morceaux, ISRC, les code barres, les territoires de diffusion…), données descriptives disponibles sur l’artiste, le titre, l’album, le label… « Au niveau des labels, aucune BDD ne le fait actuellement », précise Bertrand Sebenne. Une fois ce travail d’agrégation et de traitement réalisé, place à l’étape suivante : la création d’outils de découverte et de recommandation. Leur recommandation par similarité est plus large que ce qui se fait usuellement aujourd’hui : sur le genre, la période, l’origine géographique, l’appartenance à un mouvement ou à plusieurs groupes et projets, le catalogue du label… Ce qui donne des résultats qui viennent compléter les approches statistique et d’analyse du signal. Les utilisateurs peuvent également être profilés, pour fournir des données pour de la publicité ciblée.

Si jusqu’à présent, Blitzr était plutôt perçue comme un service grand public de découverte et de recommandation, la startup s’est clairement orientée sur le marché BtoB. Et tourne son regard vers tous les acteurs de la musique et plus largement du divertissement : streaming, TV et radios connectées, objets connectés, services de ticketing, maisons de disques… Avec une priorité pour le marché anglo-saxon. Aujourd’hui, Blitzr teste sa solution avec 1Dlab, et de grosses annonces sont à venir d’ici la fin du printemps, notamment outre-Atlantique.

>> En savoir plus sur Blitzr