Akamai Diversity
Home > Media Delivery > CMAF : de quoi s'agit-il et pourquoi ce format risque-t-il de chambouler l'avenir de l'OTT ?

CMAF : de quoi s'agit-il et pourquoi ce format risque-t-il de chambouler l'avenir de l'OTT ?

Le 15 juin dernier, en annonçant sur le salon WWDC (Worldwide Developers Conference) étoffer son protocole HLS par la prise en charge du format MP4 fragmenté (fMP4), Apple a franchi une étape significative dans la simplification du streaming vidéo en ligne. Le format fMP4 est lié au tout nouveau CMAF (Common Media Application Format) et, en se proposant de le gérer, Apple rapproche encore un peu plus le marché de l'adoption d'un format unique par les distributeurs OTT, exploitable de surcroît sur la totalité des équipements électroniques grand public. L'objectif ultime consiste à simplifier la diffusion vidéo en ligne.

Le marché OTT a opéré un total revirement au cours des cinq dernières années, délaissant des protocoles multimédias propriétaires comme RTMP, MMS et RTP, au profit de HTTP/S pour diffuser de manière adaptative du contenu segmenté aux internautes. Parmi les formats adaptatifs, l'éclatement est cependant de mise, comme l'attestent les solutions concurrentes proposées avec HLS, Smooth, HDS et MPEG DASH. Même avec le probable désaveu de Smooth et de HDS, et leur remplacement par DASH, la plupart des distributeurs de contenu continuent de devoir gérer deux groupes de contenus cloisonnés, l'un en HLS et l'autre en DASH.

Aujourd'hui, le protocole HLS définit l'utilisation de conteneurs TS (flux de transport), tandis que la norme DASH, même si elle autorise TS, utilise quasi-invariablement en pratique 
ISO-BMFF (Base Media File Format), en particulier une variante dénommée MP4 fragmenté, comme indiqué plus haut. Résultat : les distributeurs de contenu qui entendent cibler une audience HLS et DASH doivent coder et stocker les mêmes données audio et vidéo à deux reprises - en les conditionnant d'abord dans des conteneurs TS, puis à nouveau au format ISO-BMFF. Ces fichiers analogues, même s'ils représentent le même contenu, coûtent deux fois plus cher à encapsuler et à stocker sur le serveur origine, et rivalisent pour s'arroger de l'espace sur les serveurs edge d'Akamai, réduisant par là-même l'efficacité de leur diffusion.

Pour tenter de venir à bout de cette problématique d'efficacité des caches, le marché a lancé une myriade de solutions imposant une synthèse complexe des segments TS et ISO (pour HDS) sur un serveur edge ou un serveur intermédiaire de streaming. Ces serveurs, qui doivent packager le contenu avant de le diffuser, offrent un débit moindre par rapport à ceux qui se contentent de le transférer tel quel. Dès lors, la diversité des conteneurs limite le débit total que peut atteindre un serveur de diffusion, tout en impactant à plusieurs niveaux les coûts de nos clients en ce qui concerne la préparation du contenu, la gestion du workflow et la diffusion. Les clients pourraient également stocker plusieurs versions du contenu, ce qui a également une incidence sur le coût de stockage total.

À la mi-2015, deux collaborateurs improbables ― Microsoft et Apple ― ont uni leurs forces pour mettre fin à cette inefficacité via un nouveau format de fichier multimédia, baptisé à l'époque Common Media File Format, mais aujourd'hui renommé CMAF. Microsoft et Apple ont sollicité Akamai et un certain nombre de leurs très proches partenaires pour travailler à une proposition de manière itérative. En février 2016, ce groupe d'entreprises a préparé une soumission conjointe à MPEG qui l'a acceptée comme nouvel axe de standardisation..

Le format CMAF possède un certain nombre de caractéristiques particulièrement dignes d'intérêt pour le secteur des médias :

  • Il s'agit d'un conteneur fMP4 ISO-BMFF, de type ISO/IEC 14496-12:201 en l'occurrence. Les TS (Transport Streams) servent parfaitement les objectifs des marchés hertzien et câblé en diffusant des flux continus de données, mais sont mal adaptés à la diffusion de contenus multimédias segmentés et adaptatifs, générant des ratios de trafic/charge utile supérieurs à fMP4. Évolutif et compact, le format fMP4 est d'ores et déjà utilisé par DASH, Smooth et HDS ; ce standard ISO s'accompagne d'un éventail d'outils robustes pour l'encodage, la manipulation, le débogage et l'analyse.
  • Le mécanisme standard CENC (Common Encryption) - ISO/IEC 23001-7: 2016 - assure le chiffrement des données utiles du contenu multimédia au moyen d'un cryptage 
    AES-128 bits, puis la fourniture d'informations d'en-tête de sorte que plusieurs systèmes DRM puissent être employés simultanément pour décrypter le contenu. Ce faisant, il est inutile de s'appuyer sur des contenus différents pour gérer la myriade de solutions DRM aujourd'hui disponibles, et dont la convergence ne s'opère malheureusement pas au même rythme que celles des conteneurs de fichiers.
  • Ce format prendra en charge la suite de codecs MPEG AVC (ISO/IEC 14496-10), AAC (ISO/IEC 14496-3) et HEVC (ISO/IEC 23008-2) dans le cadre d'une interopérabilité de base, mais permettra également d'inclure d'autres codecs (VP9 ou audio multicanal).
  • Il accepte actuellement deux types de formats de sous-titres - WebVTT (http://www.w3.org/TR/webvtt1) et IMSC-1 (http://www.w3.org/TR/ttml-imsc1).
  • Les segments doivent débuter par des images clés, et l'alignement des segments être précis sur l'ensemble des débits disponibles. Voilà qui simplifie le passage d'un débit à l'autre sur les lecteurs.
  • Des segments audio et vidéo indépendants (non multiplexés) sont requis.
  • Un mode faible latence est proposé, qui devrait contribuer à ramener les latences des flux OTT en direct sous les seuils admissibles pour la distribution de programmes par voie terrestre et par satellite.
  • Ce format est conçu pour être référencé à la fois par une liste de lecture HLS (.m3u8) et un manifest DASH (.mpd).

Le format CMAF étant très semblable au conteneur de fichiers aujourd'hui utilisé par DASH, son adoption sous cet angle s'accompagne de modifications faibles, voire inexistantes, en termes d'encodeurs, de workflow ou de lecteurs. Pour la communauté Apple et HLS néanmoins, cela nécessite de parser un nouveau type de conteneur. En annonçant la prise en charge du format fMP4 par le protocole HLS sous iOS10, macOS et tvOS, Apple met davantage en confiance un marché désormais certain de voir le format CMAF tenir ses promesses comme moteur de la convergence. 

L'avènement du format CMAF augure du début de la fin des conteneurs TS appliqués à la diffusion OTT. Les atouts de l'encodage, de l'encapsulation et de la mise en cache uniques, couplés à la mise en place d'un seul type de lecteur, présentent bien trop d'attraits tout au long de la chaîne de diffusion pour que le TS persiste dans la durée.

Tout n'est pas rose pour autant. Certes, les équipements et systèmes d'exploitation Apple, Android et Microsoft ne tarderont pas à gérer le format CMAF, mais il existera toujours nombre d'équipements non maintenus, pour lesquels le format HLS basé sur TS demeurera nécessaire. 

Par ailleurs, le mécanisme Common Encryption n'est pas aussi commun qu'on pourrait le croire. Plusieurs modes de chiffrement par bloc sont  autorisés par la spécification - CTR ou CBC. Si la première version du format CMAF continue à gérer les deux, la perspective d'un ensemble de contenu unique pour tous les équipements reste floue. Le format CMAF ne résout pas non plus le problème de fragmentation des manifests, puisque des manifests HLS m3u8 et DASH .mpd continueront de devoir être générés.

Malgré ces enjeux, le format CMAF reste la plus grande avancée du secteur jamais entreprise depuis plusieurs années en faveur d'un avenir placé sous le signe de l'harmonie et de la convergence. Attendons-nous à ce que les acteurs du marché sélectionnent les meilleurs (pour les codecs, sous-titres, modes de cryptage et formats de présentation) et à ce que CMAF s'impose très vite comme le standard multimédia OTT de facto.

Laisser un commentaire