Les expressions régulières avec Telestream Vantage

Article par Fabian Buchta _ Technicien Audiovisuel chez VIDELIO – Cap’Ciné

Utilisation des expressions régulières avec la nouvelle version de Teletream Vantage

Les expressions régulières sont des outils très utilisés par la plupart des environnements de développement intégrés ou des éditeurs de textes. Également appelée « Regex », une expression régulière décrit une chaîne de caractères ayant des propriétés communes, permettant de les trouver dans un bloc de texte et de pouvoir leur appliquer un traitement automatisé comme un remplacement, un ajout ou une suppression.

Lien Microsoft sur les expressions régulières

  Exemple d’expressions régulières

 

L’expression [A-Z] décrira tous les caractères alphabétiques majuscules.

L’expression [a-z] décrira tous les caractères alphabétiques minuscules.

L’expression [0-9] décrira tous les caractères numériques décimaux.

L’expression [^A-Za-z] décrira tous les caractères non-alphabétiques.

L’expression [autb] décrira indépendamment « a » « u » « t » et « b » mais pas « r » ou « tb » ni « ae ».

  Exemple d’application :

L’expression « Journal Télévisé de 20 Heures » opérée par l’expression régulière [A-Z0-9] retournera les caractères alphabétiques majuscules et les chiffres, soit « JT20H ».

L’expression « ITW_Eric_Dupond201204594 » opérée par l’expression [^0-9] retournera tous les caractères qui ne sont pas des chiffres, soit « ITW_Eric_Dupond ».

  Exemple d’un Workflow Vantage supprimant tous les caractères spéciaux 

Il n’est pas rare d’être confronté à des problématiques concernant les caractères acceptés ou non pour le nommage d’un fichier. Beaucoup de systèmes n’acceptent pas de fichiers avec des caractères spéciaux comme par exemple des lettres accentuées ou des signes typographiques. Le traitement de ce type de fichier peut bloquer dès l’étape d’import du média et rester en statut d’erreur.

Les expressions régulières peuvent donc nous aider à les corriger et aussi, à créer une nomenclature précise des noms de fichiers au sein des workflows.

Les expressions régulières sont intégrées nativement dans le workflow manager Vantage. Voici donc ci-dessous un exemple d’utilisation, supprimant tous les caractères spéciaux.

(Si ce sujet vous intéresse et vous souhaitez le mettre en application au sein de vos workflows, n’hésitez pas à nous contacter, nous pourrons vous envoyer les éléments.)

La fonction « Replace Substring (Regex) » est présente dans l’action « Compute » :

En prenant en variable d’entrée le nom du fichier source en cours de traitement, la variable « Base_Name » qui résulte de notre opération prendra comme valeur le nom de fichier appliqué à l’opération de remplacement de tous les caractères « a » accentués ou spéciaux par la lettre simple « a ».

Ainsi un média ayant pour nom « Match à domicile  » sera remplacé par « Match a domicile »

Les actions peuvent s’enchainer au sein de la même action « Compute » tout en réutilisant la même variable d’entrée et de sortie. La dernière valeur renseignée dans la variable « Base_Name » à la fin de l’action sera la valeur de la variable en sortie de l’action « Compute ».

Donc à la suite de cette première opération, les autres opérations s’ajoutent.

En reprenant notre variable « Base_Name », le traitement peut continuer avec tous les caractères « A » accentués ou spéciaux remplacés par la lettre « A », comme ci-dessous :

En effectuant le même procédé pour toutes les lettres de l’alphabet possédant des accents ou autres, plus aucuns caractères accentués ne se trouvera dans le nom de fichier.

Quant aux autres caractères spéciaux comme les ponctuations ou les signes typographiques, nous pouvons les scinder en deux groupes. Les séparateurs et les autres.

Les caractères comme « _ » « & » « + » « , » ou les espaces sont régulièrement utilisés pour séparer des mots dans un nom de fichier. Pour que le nom reste compréhensible, nous pouvons remplacer ces caractères par un tiret « – » :

Tous les autres caractères non-alphanumérique peuvent être supprimés. Comme les caractères  » ‘  » « = » « µ » « % » « ½ » « ß » « © » « @ » « ∆ » « ~ » « $ » « € » « ¢ » « £ » « ¤ » ou encore « ☎ » qui peuvent se retrouver dans le nom d’un fichier, parfois non intentionnellement.

Pour ce faire, nous excluons tout caractère qui n’est ni alphanumérique, ni un tiret « -« , comme ceci :

Enfin, si plusieurs séparateurs se seraient retrouvé côte à côte, il est possible de limiter l’itération d’un caractère. L’expression régulière « -+ » décrira toutes les occurrences d’un tiret suivi d’un ou plusieurs tirets.

Pour ce faire, nous excluons tout caractère qui n’est ni alphanumérique, ni un tiret « -« , comme ceci :

Par exemple pour un média se nommant « Ex-æquo à domicile, Thaïlande ≠ Viêt Nam », le nom du média deviendra « Ex-equo-a-domicile-Thailande-Viet-Nam ».

Grâce à cette suite d’opérations, plus de problématique de nommage !

Il est évidement possible de modifier ou d’ajouter des fonctions pour intégrer au mieux les expressions régulières au workflow cible !

Vous êtes intéressé ? Contactez-nous

Si ce workflow de suppression de caractères spéciaux via les expressions régulières dans Vantage vous intéresse, n’hésitez pas à nous contacter à l’adresse du Support Telestream de Videlio Cap’Ciné : support-telestream@videlio-capcine.com

L’astuce en plus :

Lorsque vous avez un enchainement de plusieurs actions qui reprennent la même variable (comme dans l’exemple ci-dessus), vous pouvez maintenant copier-coller la variable directement dans vos actions via un clique-droit !