Les datas au cœur du sport broadcast

Au-delà de l’aspect broadcast, la mise en scène des compétitions sportives se réinvente grâce aux données statistiques, biométriques et autres qui viennent enrichir le direct.
Datasportbroadcast.jpeg

 

Vues sur les coulisses, habillage virtuel, réalité augmentée, immersion dans le spectacle via des micros, sinon des caméras, équipant les acteurs… De nos jours, concurrence oblige, les diffuseurs, typiquement ceux qui détiennent les droits du sport « premium » (football, rugby, formule 1…), et leurs partenaires technologiques n’ont de cesse d’offrir aux téléspectateurs plus que la simple « compétition », en se livrant notamment à une veille assidue des réseaux sociaux. « Les utilisateurs interagissent en temps réel et postent leurs réactions, ce qui permet d’élaborer des solutions et des contenus plus conformes à leurs attentes », commente Nicolas Bourdon, directeur marketing chez EVS.

Dans ce contexte, les datas sont devenues une pierre angulaire du sport broadcast. Pour preuve, « aujourd’hui, sur chaque chaîne, un spécialiste en la matière participe aux conférences de rédaction et a son mot à dire sur l’éditorial », confirme Matthieu Lille-Palette, senior vice-président d’Opta, l’un des statisticiens leaders du marché. Et ce grâce aux évolutions technologiques de ces vingt dernières années.

Ainsi, l’arrivée du cloud a permis leur exploitation sur l’ensemble des supports et l’augmentation des bandes passantes réseau a rendu possible leur collecte à distance. Par ailleurs, grâce à la miniaturisation des capteurs, la technologie est devenue moins intrusive pour les acteurs de la compétition. Quant à l’étape suivante, « on pourrait utiliser les datas pour sélectionner les meilleurs plans grâce aux données de position ou encore automatiser la création de highlights basés sur les statistiques », espère Matthieu Skrzypniak, directeur général adjoint de Netco Sports (groupe Euro Media).

 

 

Deux types de données

Pour l’heure, les périmètres en la matière sont clairement établis avec, d’un côté, le fournisseur de data et, de l’autre, le prestataire graphique. Ainsi, « notre solution est utilisée sur quelque 900 matchs par an (Ligue 1, Ligue 2, Coupe de la Ligue, Coupe de France, Top 14, ProD2 …) », signale le responsable.

Plus précisément, le prestataire opère avec deux générations d’applications, l’historique Epsis Control et la nouvelle NextCG, laquelle permet d’adresser les workflows de remote production. « Cette plate-forme possède des connecteurs de données que l’on développe en fonction du fournisseur de données, précise-t-il. Celles-ci sont alors sauvegardées dans une base dédiée et mises à disposition dans l’interface utilisateur de l’opérateur. »

De leur côté, pour un coût de service oscillant, marge comprise, de 4 000 à 8 000 euros selon le type de dispositif, des sociétés spécialisées, comme Opta ou Stats, fournissent deux types de données : des données de performance (« events datas ») de différents niveaux (de 1 à 3) et d’autres de position (« tracking datas »).

Les premières (tirs, passes, duels…) sont toujours saisies manuellement. Pour le football en particulier, quelque 2 000 à 2 700 « événements » (actions) par match sont ainsi codés à la volée grâce à la souris et des raccourcis clavier qui vont permettre de géolocaliser les joueurs et de qualifier chaque type d’action.

Chez l’anglais Opta, qui depuis 2013 a rejoint la galaxie de son compatriote, le groupe Perform, « ces “événements” sont répartis en 350 catégories et sous-catégories », glisse Matthieu Lille-Palette. Ainsi, « une catégorie mère comme la passe donne accès à pas moins de seize sous-catégories de passes différentes. »

Les données sont ensuite stockées dans une base dédiée, laquelle permet d’élaborer différents produits destinés à la chaîne hôte et aux acteurs du digital à travers différents modules, et aux journalistes maison de créer des packs d’informations et de statistiques qui, grâce à un chronodatage (« time stamp ») très précis, vont aider les ayants droit dans leur travail de postproduction.

Par ailleurs, les données de performance sont produites à distance, à partir d’un flux broadcast ou d’un streaming vidéo, quand celles de position pour les sports concernés (football et basket-ball en particulier) le sont directement sur site, via un système de tracking optique dont les deux plus connus sont SportVu, de l’américain Stats, et Tracab, de son compatriote ChyronHego.

Le premier opère notamment sur la Série A italienne, avec Netco Sports comme partenaire, la Pro League belge, la Ligue 1 française et quelques autres plus exotiques (Qatar, Chine…), tandis que le second est déployé dans plusieurs championnats européens (Allemagne, Espagne, Angleterre, Danemark, Pays-Bas…) et l’a été lors de la dernière Coupe du monde de football en Russie.

Ici, les flux de plusieurs petites caméras IP (trois généralement) nichées sous le toit des tribunes sont rapatriés sur un PC équipé d’un logiciel propriétaire. Ce dernier va successivement créer une image « stitchée » couvrant tout le terrain, calculer en temps réel la position de chaque joueur et produire des statistiques de niveau 3, comme la vitesse, les kilomètres parcourus ou encore la « heatmap » (zone couverte par le joueur pendant le match).

Si le tracking (plus de 4 millions de positions par match) est automatisé à 95 %, « deux opérateurs sont là pour aider les algorithmes en cas de demande de confirmation par le système ou en cas de problème », précise Antoine David, manager général de Stats pour l’Europe du sud. Typiquement sur un sport comme le rugby, où les regroupements (mêlées ouvertes ou fermées, placages au sol…) et autres interceptions engendrent de nombreuses occlusions optiques.

Pour les « tracking datas », « la captation se fait en temps réel et les diffuseurs peuvent utiliser le stream dans les mêmes conditions pour créer des palettes graphiques utilisant les x/y de tracking », complète Antoine David. Pour les « events datas » dont la saisie en live mobilise, selon le sport (football et rugby en particulier), de un à deux opérateurs pour chaque équipe, plus un superviseur (« data checker »), le délai de mise à disposition de la donnée est de l’ordre de deux minutes. Ainsi, en Europe, les équipes d’Opta, dont l’activité se concentre essentiellement sur le football, opèrent depuis une « data room » basée à Leeds (Angleterre) et une autre à Aveiro (Portugal).

 

 

Une infographie plus ou moins riche

Ce double mode opératoire s’applique à la plupart des sports (football, rugby, basket-ball…), sauf cas particulier, comme le Tour de France cycliste (lire « Le data model du tour de France » dans Mediakwest #29). Ainsi, pour la première fois lors de l’édition 2015 de la Grande Boucle, Euro Media a mis en place une solution de géo-tracking en temps réel baptisée Smacs (Smart Connected Sensors) et développée en partenariat avec Hikob. Grâce à ces centrales inertielles associées à des GPS placés sur les vélos, qui permettent de connaître la position, la vitesse et l’accélération instantanée de chacun, les données sont transmises en HF au car régie stationné près de la ligne d’arrivée, par le même canal que les signaux audio et vidéo des caméras sur les motos.

De son côté, Mac-Lloyd, une start-up française, déploie sur les courses de chevaux un système similaire. « En la matière, il n’y a pas de différence entre les sports, commente l’un des acteurs du dossier. Simplement, il y en a certains, comme le biathlon, qui demandent plus d’espace pour placer l’information ou qui vont nécessiter beaucoup de synthés, et d’autres moins. La variable se situe là. »

De fait, l’infographie sera plus ou moins riche selon les cas. « Cela dépend beaucoup du diffuseur, remarque Matthieu Skrzypniak. Par exemple, sur un match de ligue 1, on va avoir trois stats par mi-temps sur le signal international, contre une vingtaine sur le signal privatif de Canal +. »

Mais cela dépend aussi des choix du réalisateur qui vont avoir une incidence sur leur utilisation. « Un réalisateur qui force la dose de ralentis pendant les phases de jeu, c’est un problème pour nous parce que l’action en direct se poursuit et nous ne pouvons pas la traiter, explique ainsi Matthieu Lille-Palette, aussi nous avons des accords avec les broadcasters ou directement avec les organisateurs qui nous permettent de récupérer le plan large pour collecter les données, sinon procéder à une analyse a posteriori. »

 

 

Interconnexion et intégration

Aujourd’hui, il n’existe pas de contraintes particulières à mêler des datas à de la vidéo. « Pour le football et le rugby, la clé est avant tout la facilité d’accès à ces données, souligne Matthieu Skrzypniak. Il faut que le journaliste ou l’opérateur graphique puisse trouver rapidement la donnée pertinente et l’afficher rapidement. »

Pour autant, certaines sont plus difficiles à produire que d’autres. C’est le cas des données de position qui requièrent un tracking d’objets, ce pour quoi il existe deux techniques : la première par traitement d’image, laquelle nécessite souvent une intervention manuelle pour les cas litigieux (typiquement, lors d’une mêlée où le traitement d’image ne sera pas assez précis) ; la seconde par capteur, la principale difficulté étant ici de disposer d’une infrastructure pour collecter ces données (HF, Bluetooth…).

Pour les solutions basées sur du traitement d’image, plus de résolution c’est plus d’informations. Ce faisant, la précision des données collectées sera sans doute meilleure avec l’émergence de nouveaux standards (4K, 8K…). Mais il faudra, dans le même temps, que les machines montent en puissance, avec des ressources de calcul supérieures pouvant permettre des mesures en direct dans l’image (distance, vitesse, analyse 3D…) et, pour l’affichage, un moteur de rendu compatible.

À terme, « le tracking pourrait être envisagé via les flux broadcast, à la place de systèmes optiques propriétaires dans les stades, et le développement d’algorithmes de reconnaissance optique pourrait conduire à une collecte automatisée des events datas », risque Antoine David.

Chez Euro Media Group, « nous travaillons avec les principaux moteurs de rendu du marché (Vizrt, Xpression…), mais nous utilisons aussi des solutions open source (CasparCG) que nous avons customisées pour pouvoir gérer les habillages graphiques des événements sportifs », signale Matthieu Skrzypniak.

Dans le cas le plus fréquent, l’intégration des données produites à distance s’effectue en live via une API (format xml/json). Quant aux données de tracking captées sur le stade, « elles sont mises à disposition directement depuis le flux de sortie du système et peuvent être routées vers une régie sur site ou à distance », indique Antoine David.

La mise en forme de la data pour le diffuseur hôte est généralement l’affaire du prestataire graphique. En l’occurrence, « notre travail d’intégration consiste à créer des templates graphiques avec des champs textes remplacés dynamiquement par les bonnes données », explique Matthieu Skrzypniak. Mais il peut en être autrement pour d’autres médias. Ainsi, « en digital, nous créons nous-mêmes nos propres graphiques, que ce soit sur des interfaces dédiées (hosted solutions) ou des formats de type widget », précise Antoine David.

Seul le signal international impose une contrainte à la production pour la mise à l’antenne de certaines données pendant les matchs. Ainsi, la Ligue de football professionnel (LFP) demande à Canal + et beIN Sports, qui produisent le signal international, l’intégration de certaines statistiques dans le signal dirty. « Le flux télé utilisé pour le codage peut effectivement altérer la cohérence des données produites, du fait de la diffusion des ralentis », éclaire le représentant de Stats.

Pour la plupart, cependant, les données sont incrustées, tel un synthé classique, dans le programme clean et non pas en fonction des caméras, comme c’était le cas autrefois, où les opérateurs avaient le choix entre deux solutions. La première consistait à caler chaque synthé sur la focale moyenne de chaque caméra. La seconde était de trouver un entraxe moyen correspondant à peu près à l’ensemble des caméras utilisées. Sur l’une, le synthé était ainsi plus en avant de la scène ; sur l’autre un peu plus en retrait, tout en restant lisible par le téléspectateur.

Clairement, la première offrait un meilleur résultat, même si sa mise en œuvre était plus longue. « La technologie permettait de faire de l’incrustation d’images virtuelles (par exemple, la ligne de hors-jeu ou la distance au but pour le football) en temps réel dans un flux broadcast grâce à un tracking de caméras, prolonge Matthieu Skrzypniak.

Aujourd’hui, elle permet aussi d’incruster des datas sur le terrain pour créer de la réalité augmentée, surtout lors d’émissions de plateaux, comme le “Canal Football Club”, où les tableaux de statistiques donnent l’impression de faire partie du décor, et trouve sa place sur les supports digitaux pour engager les utilisateurs, de même qu’en VR, à l’instar de ce que propose LiveLike (lire Mediakwest #26). » Et de ce qui se fait déjà en NFL (football américain) et lors des tournois de la PGA (golf).

Généralement associée au live ou au near live, la donnée peut aussi accompagner un ralenti. Ainsi, en France, en partenariat avec la société Piq, Euro Media a développé une solution d’affichage des données de performance (vitesse du coup (en m/s), son impact (en G), type de coup (uppercut…), etc.) lors des retransmissions de boxe sur Canal+.

« Notre solution permet à l’opérateur dans le car régie de pouvoir retrouver facilement non seulement la bonne image, en s’aidant de sa remote LSM, mais aussi la bonne data puisque nous synchronisons la visualisation des données avec le timecode de la machine de ralenti, explique Matthieu Skrzypniak. L’opérateur sait donc quel set de données correspond à son ralenti et peut rapidement décider de ce qu’il veut afficher. »

Une solution qui présente un air de famille avec celle centrée également sur le « noble art » et portée par le belge EVS, en partenariat avec le suisse Data Versus Sports, basé à Lausanne.

 

 

Nouveaux « analytics »

Désormais, après l’exploitation des données de performance et de tracking, un nouveau gisement apparaît avec les données biométriques (fréquence cardiaque, mesure du glucose, des lactates…). Carburant indispensable à la performance des équipes et des athlètes, celles-ci commencent à transpirer dans la production télé, grâce aux maillots et autres objets équipés de capteurs. Certaines ont ainsi été affichées lors du dernier Marathon de Sydney.

« Par le biais de la biométrie, les athlètes vont jouer un rôle de plus en plus important dans la mise en scène du sport », pronostiquait déjà, lors des débats du Sportel 2014, Timo Lumme, directeur des services marketing et droits TV du Comité international olympique (CIO). Toutefois, l’utilisation par les médias de ce type de données soulève de complexes questions de droits (à qui appartiennent-elles vraiment ?) et se heurte, pour l’heure du moins, à de nouvelles réglementations, type GDPR (en français, RGPD), qui peuvent en interdire la diffusion.

Moins controversée est la tendance à la contextualisation des données. Ou comment, à travers celles-ci, permettre au téléspectateur de se projeter davantage dans l’histoire de la compétition qui se déroule sous ses yeux. Le canadien SportLogiq a donné le signal de cette nouvelle approche statistique, grâce à une solution basée sur l’intelligence artificielle (IA), qui a déjà fait ses preuves dans le championnat nord-américain de hockey sur glace (NHL) et qui sera prochainement déployée lors des matchs de la ligue suédoise (SHL). Mais il n’est pas le seul. De la même manière, l’américain Stats, par exemple, qui vient de renforcer son équipe de data science avec l’arrivée de Helen Sun au poste de directrice exécutive de la technologie, développe de nouveaux produits soutenus par l’IA.

Ainsi, « en football, nous arrivons à détecter, classifier et stocker, non plus des événements isolés (passes…), mais plusieurs centaines de séquences par match pour décrire le style de jeu d’une équipe (contre-attaque, jeu direct…) », illustre Antoine David.

Un autre exemple est le développement du « ghosting », lequel donne la position optimale de chaque joueur à chaque instant, au regard des positions des autres joueurs sur le terrain, de la dynamique de déplacement et des coups potentiels à jouer pour le porteur du ballon.

De son côté, Opta a mis en place une nouvelle statistique baptisée « expected goals ». « Sur la base d’un historique de quelque 300 000 tirs sur une période de dix ans, nos algorithmes nous permettent d’évaluer le pourcentage de chances qu’a un joueur de marquer un but », décrypte Matthieu Lille-Palette.

À l’origine de ces nouveaux « analytics », l’intelligence artificielle (lire sur le sujet Mediakwest #28) « sera surtout utilisée pour interpréter les données brutes et en sortir des informations exploitables », conclut Matthieu Skrzypniak. Comme, par exemple, avec quel pied une action, autre qu’un but, est réalisée.

 

 

Extrait de l’article paru pour la première fois dans Mediakwest #29, p.82/86. Abonnez-vous à Mediakwest (5 numéros/an + 1 Hors-Série « Guide du tournage ») pour accéder, dès leur sortie, à nos articles dans leur intégralité.