PDF et accessibilité : la fausse bonne idée

2 commentaires

Attention ! Cet article a été écrit en 2019. Son contenu a peut-être besoin d’une mise à jour. Complétez votre veille avec des articles plus récents, par exemple en consultant les nouveautés de notre blog accessibilité numérique, ou en lançant une recherche pour trouver des articles similaires, mais à jour.

Dans un monde où le numérique prend de plus en plus de place, où l’on se dirige vers la dématérialisation des documents, la solution choisie pour proposer des documents électroniques remplaçant la version papier est souvent le format PDF. Mais qu’en est-il de leur accessibilité et facilité d’utilisation pour une personne handicapée ?

L’accessibilité des PDFs est une problématique qui concerne essentiellement les personnes qui se servent d’un lecteur d’écran pour lire le document. Cet article démontre, à l’aide de plusieurs exemples, les problèmes rencontrés et les solutions de contournement déployées pour avoir accès au contenu des documents PDF lorsqu’on utilise un lecteur d’écran.

Les utilisateurs et les fichiers PDF

Lors de l’étude sur l’usage des lecteurs d’écran en France et en francophonie de juin 2017, réalisée par Access42, la Fédération des Aveugles et Amblyopes de France et leurs partenaires francophones, une question était consacrée à la lecture et l’accessibilité des fichiers PDF.

À la question « Parvenez-vous à lire des documents PDF ? » le rapport de synthèse précise que :

64% des répondants ont indiqué qu’ils pouvaient lire parfois les documents PDF puisque cela dépendait du document PDF.

10% des répondants rencontrent de réels problèmes, certains trouvent des solutions de contournement mais d’autres sont dans l’incapacité totale d’accéder aux contenus des documents PDF :

5% disent qu’ils peuvent les lire en copiant leur contenu dans un autre logiciel. 3% essaient de lire ces documents mais ils n’arrivent pas à accéder à leur contenu. Notons que 2% des répondants n’ouvrent jamais les PDF car ils les trouvent trop inaccessibles.

Au total, ce sont donc les trois quart des répondants qui déclarent avoir des problèmes (ponctuels ou récurrents) avec les documents PDF.

Sur Twitter, les internautes ayant un handicap visuel s’expriment régulièrement sur les problèmes qu’ils rencontrent avec les documents PDF. On peut par exemple citer le cri du cœur anti-PDF de Céline Bœuf.

Il apparaît donc très clairement que le format PDF ne fait pas beaucoup d’heureux chez les utilisateurs aveugles ou très malvoyants. Mais pourquoi ?

L’origine du PDF : pourquoi ce format est-il plébiscité ?

Selon l’article Wikipedia consacré au PDF :

L’avantage du format PDF est qu’il préserve les polices de caractères, les images, les objets graphiques et la mise en forme de tout document source, quelles que soient l’application et la plate-forme utilisées pour le lire.

Le format PDF peut aussi être interactif. Il est possible (grâce à des logiciels tels Adobe Acrobat Pro, LibreOffice ou Scribus) d’incorporer des champs de textes, des notes, des corrections, des menus déroulants, des choix, des calculs, etc. On parle alors de formulaire PDF.

Le format PDF est aujourd’hui de plus en plus utilisé pour échanger des données, les imprimer et les archiver. On utilise souvent le PDF pour transmettre des documents non modifiables, les protéger en lecture et écriture, les protéger par mot de passe et les signer numériquement.

Malheureusement, même s’il existe aujourd’hui une norme d’accessibilité pour les PDFs, les documents disponibles sur la toile sont souvent très difficiles à consulter. Les résultats de l’étude le montrent ; lire un document PDF lorsqu’on se sert d’une technologie d’assistance, plus spécifiquement d’un lecteur d’écran, est trop souvent un parcours du combattant, qui en décourage plus d’un et nécessite d’utiliser des astuces de contournement pour accéder au contenu de ces documents.

Les écueils et frustrations sur les documents PDF

1. Les documents image

Lorsque j’ouvre un document PDF, j’éprouve toujours une certaine appréhension. Vais-je pouvoir le lire ou non ? La plupart du temps, dès que j’ouvre le document reçu par mail ou téléchargé sur Internet, je suis face au message suivant :

Retranscription : Ce document semble vide. Il s’agit peut-être d’un document mal structuré ou d’une image numérisée nécessitant la reconnaissance optique des caractères.

Le problème des PDF images

Ces documents images sont, en général, des documents qui ont été imprimés puis numérisés au format PDF image. Il est impossible de lire, grossir, sélectionner le contenu du document et de faire une recherche de texte dans ce document.

Cela exclut une partie des lectrices et lecteurs ayant un handicap visuel ou des difficultés de lecture, et les met dans une situation semblable à la réception d’un document papier.

Solutions de contournement

Solution 1 : logiciel de reconnaissance de caractères
  • Enregistrer le PDF sur son ordinateur.
  • L’ouvrir avec un logiciel de reconnaissance de caractères, OCR. Les plus performants sont payants.
  • Après la numérisation, il est possible d’enregistrer le résultat dans un traitement de texte classique, dans le presse-papiers ou de l’envoyer par courrier électronique.
Solution 2 : NVDA et Windows 10
  • Avec le lecteur d’écran NVDA, si l’utilisateur dispose de Windows 10, utiliser la fonction de reconnaissance vocale de Windows en appuyant sur NVDA+R. L’utilisateur peut lire le contenu du document numérisé dans une fenêtre virtuelle séparée. L’inconvénient est que seul le texte visible à l’écran est reconnu. Si le document comporte plusieurs pages, une seule portion de celui-ci sera affichée dans la fenêtre virtuelle.
Solution 3 : avec le lecteur d’écran JAWS
  • La reconnaissance de caractères de JAWS, lecteur d’écran payant, est plus complète. Au chargement du document image, JAWS annonce qu’il s’agit d’un document numérisé et propose de lancer la reconnaissance. Après avoir répondu oui, l’utilisateur peut lire le contenu du document numérisé dans une fenêtre virtuelle séparée.
Solution 4 : avec un smartphone

Sous iPhone, il existe également des outils de reconnaissance de caractères.

Citons le dernier arrivé, Scanner, conçu par le développeur de l’application Voice Dream Reader, qui est, lui aussi, payant. Une fois le fichier PDF image importé dans Voice Dream Reader, un message indique qu’il s’agit d’un document image et propose de le numériser à l’aide de Scanner.

Comme on le comprend, les PDFs images nécessitent des manipulations supplémentaires de la part de l’utilisateur. La fiabilité de la reconnaissance n’est pas toujours garantie, cela dépend de la qualité du document. Ce premier écueil est source de frustration pour la personne ayant des difficultés visuelles.

2. Les documents protégés

Dans le cas de documents dématérialisés, il s’agit souvent de documents produits par des logiciels externes ou des contenus générés automatiquement à partir d’Internet. C’est le cas, par exemple, de factures téléphoniques, de relevés de compte et bien d’autres documents officiels.

Ces documents sont souvent protégés. Par exemple, le document peut être protégé en écriture, ce qui empêche l’utilisateur de se servir des fonctionnalités copier / coller.

Exemple de propriétés de protection :

Protection du document :

  • Méthode de protection : Protection par mot de pass
  • Mot de passe d’ouverture : Non
  • Mot de passe d’accès aux droits : Oui
  • Impression : Haute résolution
  • Modification du document : Non autorisé(e)
  • Commentaires : Non autorisé(e)
  • Remplissage ou signature de formulaires : Non autorisé(e)
  • Assemblage du document : Non autorisé(e)
  • Copie du contenu : Non autorisé(e)
  • Accessibilité au contenu activée : Non autorisé(e)
  • Extraction de pages : Non autorisé(e)
  • Niveau de chiffrement : RC4 à 40 bits

Note : Pour visualiser cette boîte de dialogue, allez dans « fichier », « propriétés du document », sélectionnez l’onglet « sécurité » et le bouton « afficher les détails ».

Le problème des documents protégés

Le plus grand obstacle à la consultation d’un document PDF avec un lecteur d’écran est la propriété « Accessibilité au contenu activée ». Lorsqu’elle est paramétrée sur « non autorisé », comme c’est le cas dans l’exemple ci-dessus, la lecture par un logiciel de synthèse vocale ou en braille est impossible. Cette propriété est souvent activée par défaut dans les logiciels automatiques de création de documents PDF tels que ceux qui génèrent les relevés de comptes bancaires.

Voici ce qu’entend un utilisateur de lecteur d’écran dans ce cas.

Retranscription : Protege ! Tiret Adobe Acrobat Reader DC.

Même si on utilise un logiciel de numérisation pour tenter de lire le document, la reconnaissance de caractères est impossible bien qu’aucun mot de passe ne soit associé au document. Lorsqu’on tente la numérisation, il est indiqué qu’un mot de passe est requis pour exécuter l’opération.

La reconnaissance automatique de caractères ne fonctionne pas. L’accès au document est verrouillé.

Solutions de contournement

  • Contacter l’expéditeur du document pour demander à ce que certaines propriétés du document soient autorisées, en particulier l’autorisation d’accessibilité ;
  • Si cette première option n’est pas envisageable, il est possible d’ouvrir le document avec Google Chrome. Ce navigateur supprime les propriétés de protection du document et le structure afin d’en permettre la consultation. Il n’est malheureusement pas possible d’enregistrer ensuite le document dans un format accessible pour le consulter plus tard, avec un autre logiciel.

3. Les PDFs sans structure

La majorité des PDFs que l’on rencontre aujourd’hui sont des PDFs non balisés, c’est-à-dire qu’aucune information sur la structure du document n’a été renseignée. Par exemple, il n’y a aucune indication sémantique des titres de chapitre, les listes à puces ne sont pas indiquées dans la structure, il n’existe pas de lien vers les notes de bas de page ou le sommaire n’est pas interactif.

Le document est donc lu au kilomètre et les informations s’affichent souvent dans le désordre.

Lorsqu’un lecteur d’écran est activé, il est détecté par Adobe Reader et une tentative de structuration est effectuée. Voici le message reçu par l’utilisateur :

Retranscription : Lecture d’un document non balisé avec une technologie d’assistance dialogue Il se peut qu’une technologie d’assistance, telle qu’un lecteur d’écran, soit en cours d’exécution sur votre ordinateur. Ce document non balisé de 2 pages doit être préparé en vue de la lecture avec une technologie d’assistance. Si vous n’utilisez pas de technologie d’assistance, cochez la case « Ne plus afficher cette boîte de dialogue » ci-dessous. Ordre de lecture.
Ordre de lecture : liste déroulante. Déduire l’ordre de lecture du document (conseillé). Réduit Alt+o.

Les problèmes des documents non balisés

  • Le contenu n’est pas toujours restitué dans le bon ordre ;
  • Les polices utilisées rendent parfois la restitution par un lecteur d’écran incompréhensible : disparition des accents, mots collés ;
  • Il n’est pas possible de naviguer d’un chapitre à l’autre.

Solutions

  • Reprendre le contenu de tout le document et le recopier dans un document de traitement de texte ;
  • Si on dispose d’un logiciel de création de PDF, baliser tous les contenus du document en indiquant les titres, les paragraphes, les en-têtes de colonnes de tableaux, les alternatives aux images, etc.

Dans tous les cas, l’utilisateur risque de ne pas avoir accès à toute l’information et l’opération de réparation est longue, fastidieuse et coûteuse.

4. Les PDFs bien structurés, respectant la norme

Peu de documents PDF sont aujourd’hui accessibles.

De plus, même lorsque c’est le cas, les technologies d’assistance ne savent pas toutes les restituer correctement. En effet, si la lecture de PDFs accessibles se fait sans problème avec NVDA ou JAWS sous Windows, un PDF, même balisé, sera difficile à lire sous Mac, puisque VoiceOver ne restitue pas la structure du document lorsqu’on le lit avec l’application aperçu. Une alternative consiste alors à lire le document avec Google Chrome pour Mac.

En outre, la lecture de PDFs accessibles n’est pas des plus pratiques sur mobile car la structure du document n’est pas restituée.

Conclusion

Pour les utilisateurs de lecteur d’écran, la lecture de documents PDFs est trop souvent décourageante. Dans le pire des cas, s’il s’agit de documents scannés, cela revient à tenter de consulter un document papier. Il est nécessaire de les numériser, donc la personne perd du temps en effectuant de multiples manipulations supplémentaires.

L’utilisateur perd également beaucoup de temps lorsque le document n’est pas structuré et qu’il souhaite se rendre à une partie précise, surtout lorsque le document est volumineux.

Proposer des PDFs accessibles, bien structurés, ne peut se faire que si la personne chargée de leur création est formée. En effet, rendre un PDF accessible avec des logiciels comme Acrobat Pro ou InDesign ne se fait pas en un clin d’œil et requiert un certain nombre de compétences. Il est nécessaire de savoir créer un document source structuré dans un logiciel de traitement de texte.

Une fois que le document est enregistré au format PDF, il faut souvent finaliser la mise en accessibilité du document en rajoutant des en-têtes aux cellules de tableaux, des étiquettes aux champs de formulaires et autres informations pour l’accessibilité à l’aide d’Adobe Acrobat Pro, logiciel payant que ne possèdent pas tous les producteurs de contenus.

Cette méthode peut éventuellement fonctionner dans le cas de documents simples, mais elle devient vite très fastidieuse pour les documents complexes, contenant des mises en page sophistiquées (nombreux tableaux ou formulaires, par exemple).

De plus, tous les systèmes d’exploitation ne permettent pas de lire facilement un PDF structuré, comme nous l’avons vu avec un ordinateur sous MacOS avec VoiceOver ou sur un téléphone mobile.

En revanche, il est beaucoup plus aisé de lire un document bien structuré avec un traitement de texte ou avec un navigateur, que ce soit sous Windows, Mac, Linux ou avec un terminal mobile.

C’est pourquoi proposer, en plus des fichiers PDF, une version structurée dans un format de traitement de texte (.odt ou .docx), maîtrisé par le plus grand nombre, est une solution idéale pour rendre ces contenus accessibles aux personnes utilisant un lecteur d’écran. En effet, ce qui compte pour ces personnes ce n’est pas le design, mais bien de pouvoir lire le contenu du document.

Pour aller plus loin

À propos

  • Sylvie Duchateau

    Experte accessibilité numérique

    Sylvie Duchateau a travaillé au sein d’Access42 de 2014 à 2024 en tant que consultante en accessibilité numérique et formatrice. Aveugle, Sylvie a développé une véritable expertise dans la maîtrise des technologies d’assistance : c’est pourquoi elle animait notamment nos formations aux lecteurs d’écran. Sylvie a par ailleurs contribué à traduire en français les WCAG 2.0 et 2.1.

2 commentaires

PDF et accessibilité : la fausse bonne idée
Bonjour,
Merci pour votre message et cette ressource. J'ai privilégié les outils disponibles sur la machine et intégrés au lecteur d'écran. Les outils dont vous parlez, impliquent de posséder un tel compte, d'avoir installé leur application et de poster le fichier à numériser sur leur interface. Ceci n'est peut-être pas évident pour tout le monde.
Je testerai à l'occasion.

PDF et accessibilité : la fausse bonne idée
Bonjour,
Je lis votre article suite à un post de Jean Gilissen sur Linkedin.
Vous n'évoquez pas les outils de conversion automatique et OCR de PDF "image" ou de texte dans une image qui sont inclus dans les Drive de Microsoft et de Google.
Voir : https://bertrand-lambard.canoprof.fr/eleve/Outils_Cloud/Outils%20Cloud_prof/#Hu8avzzqRUdqd6BFlwucnh

Bien à vous

Les commentaires sont désormais fermés, mais vous pouvez toujours nous contacter pour réagir à cet article !