Passer au contenu

La parade antipirate des sites de partage vidéo

Pour traiter les grands volumes de données mis en ligne par les internautes, les plates-formes de partage de vidéos testent des logiciels de filtrage à la source.

Le 13 juillet dernier, le site de partage de vidéos en ligne Dailymotion annonçait après YouTube et Sony Music qu’il avait choisi la solution d’identification de contenus Audible Magic. L’enjeu ? Etre en mesure –
enfin ! – de filtrer les vidéos soumises au copyright avant même qu’elles soient mises en ligne.Face à la pression croissante des ayants droit, les plates-formes de vidéo en ligne sont au pied du mur : ‘ Il n’est plus possible aujourd’hui de proposer des contenus sans avoir l’accord des ayants
droit,
considère Nathan Guetta, directeur produit du site Dailymotion. Il en va de la viabilité même de notre modèle économique. ‘Principal problème, le camcording, cette pratique qui consiste à capter les films à l’aide d’un caméscope lors de leur diffusion en salle, puis à les mettre en ligne. Filmée avec une caméra bas de gamme et de
manière décentrée, l’image résultante est décadrée, mouvante et sa résolution est basse. Autrement dit, elle est très difficile à reconnaître de façon automatisée. Et les watermarks, ces
‘ tatouages ‘ incrustés au c?”ur des images pour les protéger, ne résistent pas à ce camcording.

Bloquer les contenus protégés

C’est là que le fingerprinting intervient, une technologie testée actuellement par la plupart des plates-formes de contenu. Cela consiste à confronter les images proposées par les internautes à une base de données
‘ d’ADN ‘ de films. Concrètement, la prise d’empreintes numériques est réalisée en amont par les majors elles-mêmes selon des règles précises. Un certain nombre d’images sont sélectionnées, séquence
après séquence. Il s’agit en général des images les plus stables, celles qui évoluent le moins au cours d’une séquence. Des images qui vont alors être analysées par un algorithme de façon globale : on va calculer une formule qui va décrire, par
exemple, la variation de luminosité des pixels sur un parcours donné au sein de l’image.Ensuite, des points saillants sont définis :‘ coins ‘, contour des visages, bords des objets. C’est l’environnement proche de chacun de ces points qui va alors servir de base au
calcul d’une autre formule mathématique. L’ensemble de ces formules constitue enfin la ‘ signature ‘ du film, unique et reconnaissable entre toutes, qui va être intégrée au sein d’une base de données.
Et cette base de données communiquée aux sites de partage de vidéos. Imaginons que le film ‘ signé ‘ soit proposé par un internaute pour être envoyé sur YouTube. Le système d’empreintes digitales
extrait alors la signature du film pour la comparer à celles présentes dans la base de données, ce qui lui permet de reconnaître et de bloquer immédiatement tout contenu protégé.

Extraire l’ADN des longs-métrages

Reste à déterminer le niveau de robustesse du système. Car plus le nombre de formules extraites par film est élevé, plus le temps nécessaire au processus de reconnaissance sera important. Exemple : s’il faut neuf minutes pour
extraire l’ADN d’un long-métrage d’une heure et demie avec la solution Signatures développée par l’Ina (Institut national de l’audiovisuel), 27 minutes sont nécessaires pour confronter cet ADN à ceux présents dans la base de données de 200 000
extraits déjà analysés par l’Ina. Un dosage subtil s’avère donc nécessaire si l’on souhaite pouvoir reconnaître des films ‘ volés ‘ en salle sans pour autant alourdir le processus de
traitement…

Cinq années pour une Signature

S’il est aisé d’appliquer cette technologie à deux heures d’images, le problème se corse dès qu’il s’agit de traiter de grands volumes de données. Et il faut savoir que chaque jour, ce sont entre 12 000 et 15 000 vidéos qui
sont mises en ligne sur le site Dailymotion. Le temps d’analyse peut alors facilement devenir rédhibitoire. A l’Irisa (Institut de recherche en informatique et systèmes aléatoires), le chercheur Laurent Amsaleg a inventé un algorithme qui permet de
réduire notablement ce temps de traitement en appliquant un système de hiérarchisation aux signatures. Ce qui permet ensuite de les parcourir beaucoup plus rapidement lors de la phase de reconnaissance de l’ADN.Car la performance d’un système d’identification d’empreintes digitales dépend dans une large mesure de son adaptation à une base de données. A l’Ina, c’est au fil de cinq années de recherches sur le fonds d’extraits maison que le
système Signature a pu être développé et affiné. Ce logiciel, qui est utilisé par l’institut pour tracer la façon dont les extraits qu’il commercialise sont diffusés par les chaînes (l’Ina enregistre un flux télé en permanence), est proposé depuis
quelques mois au monde extérieur : ‘ Nous considérons qu’il appartient aux sites de mettre en ?”uvre des solutions efficaces pour protéger les contenus, explique Frédéric Dumas, le chef de produit.
Nous avons donc pris le parti de fournir Signature aux ayants droit selon un modèle presque gratuit. ‘

De nouveaux partenariats

Première à tenter l’aventure des systèmes d’identification : la chaîne Canal +. Pour les plates-formes de vidéo en ligne, ces systèmes peuvent aussi représenter un bon moyen de recruter de nouveaux partenaires en leur offrant,
par exemple, un intéressement sur les recettes publicitaires lorsqu’ils acceptent de laisser leur contenu en ligne.‘ Des majors comme Warner ou Universal n’ont pas attendu que nous mettions en place une solution de fingerprinting pour nouer des partenariats avec nous, rétorque Nathan Guetta. Même s’il y
aura certainement des opportunités daccords commerciaux qui seront déclenchées par le fait de pouvoir identifier les ayants droit des contenus mis en ligne. ‘

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Judith Bregman