Skip to content

Instantly share code, notes, and snippets.

@knarf18
Last active June 19, 2022 13:16
Show Gist options
  • Star 19 You must be signed in to star a gist
  • Fork 4 You must be signed in to fork a gist
  • Save knarf18/76f3738e970e8efa9243 to your computer and use it in GitHub Desktop.
Save knarf18/76f3738e970e8efa9243 to your computer and use it in GitHub Desktop.
Bonnes pratiques pour un meilleur sous-titrage sur le web

Liste bonnes pratiques sous-titrage web

Bien que certains font l'effort de sous-titrer les vidéos qu'il mettent en ligne sur les différentes plates-formes de type youtube, viméo, je m’aperçois que souvent, le sous-titrage comporte des erreurs qui font que celui-ci devient presque inutile car difficilement lu par les principaux intéressés.

J'ai lu de nombreux articles, tutoriels mais souvent il existe des différences ou ce qui se trouve sur l'un n’apparaît pas sur l'autre.

L'idée est donc d'essayer de mettre en place une liste de bonnes pratiques pour essayer d'améliorer le sous-titrage sourds et malentendants (S-M, S-M-E) sur le web et aider les personnes de bonne volonté à le faire le mieux possible.

Pour l'instant cette liste est une base par rapport à mes multiples lectures à ce sujet qui parfois se contredisent donc elle est là pour être corrigée, améliorée, et que l'on y ajoute tout ce qui peut aider à l'amélioration des sous-titrages sur le web.

  1. 40 caractères maximum par ligne (CPL)
  2. Deux lignes maximum
  3. 15 à 20 caractères maximum par seconde (CPS)
  4. Les sons utiles à la compréhension sont spécifiés entre crochets (voir question 1)
  5. Les césures (coupe des sous-titres) sont réalisées de manière logique.
  6. Les majuscules sont accentuées
  7. L'orthographe, la grammaire et la ponctuation sont les plus irréprochables possible
  8. L’exposition minimum du sous-titre est de 1 seconde
  9. L’exposition maximum du sous-titre est de 10 secondes
  10. L’écart entre deux sous-titres (blank) est de 120 ms
  11. Le sous-titre démarre 50 à 200 ms avant le prononcé voire au maximum sur le prononcé. Jamais après (voir question 4)
  12. Pas de sous-titre sur un changement de plan (CP), le mettre avant ou après
  13. En cas de dialogue utiliser le tiret cadratin "—" (voir question 2)
  14. Dans le cas d’un sous-titre sur deux lignes, essayer d’avoir un texte supérieur plus court que le texte inférieur (pyramide)
  15. Le sous-titre est un fichier externe (srt, WebVTT..) et non pas inscrits en dur dans la vidéo
  16. Le nom du fichier précise la langue utilisée avec un suffixe (dans le cas ou le fichier proposé n'est pas dans la même langue que la vidéo)
  17. Utilisation des majuscules quand un texte est dit par plusieurs personnes
  18. Respect des codes couleurs du sous-titrage quand c'est possible. Les fichiers .WebVTT, plus complexes, le permettent et sont pris en compte au moins sur youtube. Vérifier sur les autres plateformes (voir question 1)
  19. Quand le type de fichier ne permet pas la prise en compte des couleurs par les plateformes (exemple .srt), proposer un fichier de sous-titre .srt avec le balisage qui lui peut être interprété par les lecteurs desktop (exemple VLC)
  20. Le sous-titre ne masque pas une information de la vidéo (nom, fonction de la personne...), si le positionnement du sous-titre n'est pas supporté, essayer de reprendre les infos dans le sous-titre
  21. Pas plus d'un espace entre les mots et les signes de ponctuation qui le nécessitent
  22. Si un fichier de sous-titrage dans la langue de la vidéo est proposé en téléchargement, son nom est strictement identique à celui de la vidéo
  23. Les sous-titres ne se chevauchent pas

Questions

1) Substitutions au respect du code couleur ?

Si le respect du code couleur, de l'italique, et tout ce qui demande un balisage n'est pas possible car pas pris en compte par les plates-formes avec un fichier .srt, quelles sont les méthodes de substitutions.

Lorsqu’un personnage parle hors-champ (jaune)

  • Non défini.

les indications de bruit (rouge)

  • Mettre entre crochets. Exemple : [bruit du train], [téléphone], (à valider).

Les indications musicales (magenta)

  • Pour un morceau de musique connu mettre le titre et le nom du compositeur entre crochet.

Exemple : [Streets of Philadelphia, Bruce Springsteen], (à valider).

  • Sinon indiquer le style entre parenthèse. Exemple : (rock), (zouk) ou (musique rock), (musique zouk) (à valider).

  • les paroles des chansons sont retranscrites et encadrées par des notes

Exemple :

♫Il était un petit navire♫

♫il était un petit navire♫ (à valider)

Les réflexions intérieures ou les commentaires en voix off (Cyan ou italique)

  • L'indiquer textuellement en début de sous-titre et comment le matérialiser.

Exemple :

Voix off ou commentaire : Je trouve enfin un petit peu de temps pour t'écrire. (à valider)

[Voix off ou commentaire] Je trouve enfin un petit peu de temps pour t'écrire. (à valider)

  • Doit-on le nommer ?

Exemple :

Journaliste off : il y avait beaucoup de monde à l'exposition ce matin. (à valider)

[Journaliste] Il y avait beaucoup de monde à l'exposition ce matin. (à valider)

Langues étrangères (vert)

  • Non défini.

2) Utilisation du tiret cadratin et noms des personnes ?

Dans le cas d'un dialogue doit-on spécifier le nom de la personne qui parle ou juste utiliser le tiret cadratin si on ne peut pas positionner le sous-titre et comment le matérialiser ?

Exemple :

Michel : Je ne trouve pas les clefs.

—Louise : Tu as regardé dans ton blouson ?

—Michel : Oui j'ai regardé.

ou

Je ne trouve pas les clefs.

—Tu as regardé dans ton blouson ?

—Oui j'ai regardé.

Si oui, une fois le premier dialogue passé peut-on utiliser les initiales

Exemple :

Michel : je ne trouve pas les clefs.

—Louise : tu as regardé dans ton blouson ?

—Michel : oui j'ai regardé.

—L : et dans ton pantalon ?

—M : Ha! je n'ai pas regardé.

3) Sons provenant de sources externes ?

J'ai lu qu'un astérisque (*) doit être utilisé pour tous les sons provenant de haut-parleur, radio, télévision, téléphone, etc. Comment matérialiser cela ?

*Rendez-vous dans 10 minutes au stade

*Le suspect recherché est dangereux

Ou, dans le cas ou une personne téléphone et qu'une information importante à la télévision, doit être retranscrite :

*Téléphone : Rendez-vous dans 10 minutes au stade.

*Télévision : Le suspect recherché est dangereux.

[ *Téléphone ] Rendez-vous dans 10 minutes au stade

[ *Télévision ] Le suspect recherché est dangereux.

4) Calage des sous-titres ?

Pour le démarrage du sous-titrage j'ai mis que celui-ci devait démarrer 50 à 200 ms avant le prononcé et jamais après. Je viens de lire un document d'une université qui préconise l'inverse. On fait quoi ?

5) Temps d'affichage et nombre de caractères ?

Dans le cas de personnes bavardes doit-on privilégier le temps d'affichage d'un sous-titre quitte à avoir plus de 40 caractères par ligne ou respecter le nombre de caractères et avoir un temps d'affichage très court ?

A quel moment doit-on faire un travail d'adaptation pour permettre un bon compromis entre temps d'affichage et nombre de caractères affichés, sachant que le public sourd veut que la transcription soit la plus fidèle possible ?

Pour info, pour la bonne pratique (3) j'ai mis 15 à 20 cps (ce que j'ai trouvé le plus souvent hors docs officielles, wiki, fansub...) alors que dans le document du CSA "Charte relative à la qualité du sous-titrage" il est demandé 12 cps.

Je ne sais pas si vous avez essayez de faire un sous-titrage avec une contrainte de 12 CPS mais si l'ont doit respecter les césures (5), et le blank (10) c'est quasiment impossible sans faire de coupe drastique pour certaines vidéos.

Par exemple je me retrouve avec un sous-titrage comme celui-ci sans possibilité d'augmenter le temps d'affichage :

CPL = Caractères par ligne

CPS = Caractères par seconde

ST1 :

et on va venir parler à tout le monde (CPL= 37) et (CPS du sous-titre = 28.5)

ST2 :

pour expliquer (CPL = 15)

ce qui va se passer à la bibliothèque (CPL = 38) (CPS du sous-titre = 32.5)

Si je colle le tout cela me donne un seul sous-titrage :

ST1 :

et on va venir parler à tout le monde pour expliquer (CPL = 52)

ce qui va se passer à la bibliothèque (CPL = 38) (CPS = 29.9)

Par contre si je fais :

ST1 :

et on va venir expliquer (CPL = 25)

ce qui va se passer à la bibliothèque (CPL = 38) et (CPS du sous-titre = 21.1)

Même là en adaptant et en réduisant au maximum je ne descends pas en dessous de 20 CPS.

Quelle solution est à privilégier ?

  • Deux sous-titres avec une retranscription exacte mais très (trop) rapides et un bon CPL
  • Un sous-titre avec une retrascription exacte mais très (trop) rapide et un CPL supérieur de 10 voire plus
  • Un sous-titre adapté et tronqué avec une vitesse moins importante.

6) Quel sous-titrage privilégier ?

Qualité du sous-titrage

J'aimerai avoir votre avis sur deux vidéos identiques mais avec un sous-titrage différent. Pour vous quelle est celle qui est le plus facilement lisible ?

Bien sur à utiliser sans le son pour le public entendant.

  1. https://youtu.be/c4tY_T6ilj8
  2. https://youtu.be/wnZM4oOXGFA

7) Doit on fortement adapter un sous-titre sous prétexte qu'une transcription existe ?

Pour le bien-fondé de ces bonnes pratiques des exemples de sous-titrages sont nécessaires.

J'attendais avec curiosité la campagne sur l’accessibilité universelle Plus belle la vie "Ensemble" pour voir si les vidéos étaient sous-titrées et si oui de quelle manière.

Alors c'est un bon point elles sont sous-titrées, je ne sais pas si c'est un professionnel qui l'a réalisé mais des coupes drastiques (adaptations) ont été faites pour obtenir des sous-titres les plus courts possible. Il n y a qu'à voir la différence entre le sous-titrage et la transcription.

Edit du 13/09/2015

Le sous-titrage a été réalisé par des professionnels qui sont tenus de respecter un temps d'affichage par rapport au nombre de caractères très strict, ce qui explique, je pense, son adaptation.

Tout le monde n'a pas les moyens de passer par un professionnel, je pense particulièrement aux associations, particuliers..., pleins de bonnes volontés pour sous-titrer leurs vidéos.

Si on veut démocratiser le sous-titrage sur le web doit-on s'astreindre à cette limite ce qui implique un temps et un travail d'adaptation énorme, ou peut-on la dépasser sans que le sous-titrage nuise au confort du public sourd ?

Public sourd quel sous-titrage préférez vous ?

Pour le savoir, j'ai refait le sous-titrage de l'épisode 6 en essayant d'adapter le moins possible.

Vidéo avec sous-titres originaux E06 - Le bon investissement

Vidéo avec sous-titres retravaillés https://www.youtube.com/watch?v=TW5MFb7Eegg

J'attends vos retours et je donnerai les caractéristiques techniques de chaque sous-titrage après.

Références

Une liste d'outils pour sous-titrer : https://github.com/emma11y/sous-titres/

@sophieschuermans
Copy link

Bonjour, je ne comprends pas le point 10. 2 secondes d'écart entre des sous-titres ne me parait pas possible s'il n'y a pas de pause dans les paroles.

@knarf18
Copy link
Author

knarf18 commented Aug 28, 2015

Bonjour sophie, c'est normal il y avait une coquille c'est 120 ms ce qui corresponds à 0,12 secondes, et pas 2 secondes.

Donc merci c'est corrigé.

@htmlzengarden
Copy link

Salut !

Quelques propositions :

    1. Orthographe mais aussi grammaire et ponctuation également peut-être ?
    1. Je préciserais « minimal ».
    1. Cadratin (—) de préférence.
    1. Le nom du fichier précise la langue utilisée avec un suffixe ?

@knarf18
Copy link
Author

knarf18 commented Aug 31, 2015

Bonjour Vincent,

J'ai modifié la 7.

Pour la 10, j'ai lu un petit peu tout, 120,140,166 mais à chaque fois rien d'officiel, même la charte relative à la qualité du sous-titrage parue en 2011 n'en fait pas mention. Ce qui revient quand même le plus souvent c'est 120 ms et déjà avec cet écart ce n'est pas évident à respecter dans le cas par exemple d'une personne très bavarde. Donc j'aurai plutôt tendance à dire qu'il faut une valeur fixe et dans un premier temps choisir arbitrairement 120 ms ce qui semblerait être le temps utilisé par les professionnels.

Personnellement c'est la limite que je me suis donné pour mes sous-titrages mais l'idéal serait de trouver des documents officiels qui infirment ou confirment cette valeur.

Pour la 13, je suis parti du postulat (peut-être à tort) que la plupart des personnes, sociétés, mairies, responsables politiques..., n'hébergent pas leurs vidéos et utilisent des plates-formes type youtube,daylimotion, viméo. Le problème est qu'à ma connaissance, les plate-formes en ligne ne prennent pas en compte le balisage et les entités tout au moins dans le format .srt. Je n'ai pas par contre testé le format WebVTT, mais c'est vrai que c'est en principe ce qui est préconisé. Je l'ai quand même rajouté dans un premier temps. Je vais essayer de tester avec WebVTT voir si cela passe ou pas.

La 13 soulève donc la question de la mise à disposition du fichier de sous-titres en téléchargement car là, les lecteurs desktop type VLC, prennent en compte le balisage et les entités et à ce moment on a la possibilité d'améliorer nettement la qualité du sous-titrage mais cela suppose un travail supplémentaire, une version plate-forme édulcorée et une version locale.

Après il est possible d'agrémenter les bonnes pratiques d'un avertissement type : "Non supporté par les plates-formes" ce qui permettrait d'élargir la liste (couleurs par exemple). Après aux personnes qui sous-titrent de choisir d'offrir ou non un fichier amélioré en téléchargement.

Pour la 16 on parle ici de sous-titrage sourds et malentendants (SM, SME) donc français vers français et non pas d'adaptation, traduction donc j'aurai tendance à dire qu'obligatoirement si le fichier est dispo au téléchargement il sera dans la langue de la vidéo donc français. Pour toi, qu'est-ce que cela apporterait de plus ?

Edit : 12/09/2015

Après réflexion j'ai rajouté la proposition 16 avec quelques précisions par rapport à la 21.

@knarf18
Copy link
Author

knarf18 commented Sep 2, 2015

J'ai modifié la 13.

Je suis parti sur l'entité sans penser au code ASCII, j'ai eu un flash cette nuit. Donc pas de problème pour l'utilisation du tiret cadratin.

@kent1D
Copy link

kent1D commented Sep 24, 2017

Merci

@PVCH-Sous-Titrage
Copy link

Bonjour à Tou(te)s,
Vous serait-il possible de nous rejoindre dans le Groupe Facebook : "Les Sous-Titreurs Amateurs de YouTube" ?
https://www.facebook.com/groups/456809841336627/
Amicalement
Bonne Journée !

@OlivierNourry
Copy link

Bonjour Franck,

Merci pour ce document précieux.

Il y a quelques années j'avais effectué des recherches sur ce même thème, avec pour résultat des propositions en termes de choix de polices et formattage du texte notamment. Le doc pour celles et ceux que cela intéresse: https://drive.google.com/open?id=1rXyhth41MbVMTPlxjm34EFQ2Cggxe7mF

@virtualflo
Copy link

Merci pour ce document. La télé a déjà ses normes très spécifiques et pas adapté au monde du "web". Pour la question 2) chez Checksub nous privilégions de ne pas mettre le nom des personnes. Qu'en pensez-vous ?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment