inputenc package (Manuel de référence officieux de LaTeX2e (Août 2022))

23.7 paquetage `inputenc`

Synopsis :

\usepackage[nom-codage]{inputenc}

Déclare que le codage du texte du fichier d’entrée est nom-codage. Par défaut, quand ce paquetage n’est pas chargé, c’est UTF-8. Techniquement, la spécification du nom du codage est optionnelle, mais en pratique il n’est pas utile de l’omettre.

Dans un fichier informatique, les caractères sont stockés selon un schéma appelé le codage. Il y a de nombreux différents codages. Le plus simple est l’ASCII, il prend en charge 95 caractères imprimables, soit trop peu pour la plupart des langages du monde. Par exemple, pour composer un e tréma ‘ë’ dans un fichier source LaTeX codé en ASCII, on utilise la séquence \"e. Ceci rendrait les fichiers source pour quoi que ce soit d’autre que l’anglais difficiles à lire ; et même pour l’anglais il est commode d’avoir un codage plus étendu.

La norme moderne de codage, d’une certaine façon une réunion des autres, est l’UTF-8, l’une des représentations de l’Unicode. C’est le codage par défaut de LaTeX depuis 2018.

Le paquetage inputenc permet à LaTeX de savoir quel codage est utilisé. Par exemple, la commande suivante dit explicitement que le fichier d’entrée est en UTF-8 (notez l’absence de tiret).

\usepackage[utf8]{inputenc}

Attention : n’utilisez inputenc qu’avec le moteur pdfTeX (voir TeX engines). (Les moteurs XeTeX et LuaTeX supposent que le fichier d’entrée est codé en UTF-8). Si vous invoquez LaTeX avec soit la commande xelatex soit la commande lualatex, et essayez de déclarer un codage distinct d’UTF-8 avec inputenc, comme par ex. latin1, alors vous obtiendrez l’erreur inputenc is not designed for xetex or luatex.

Une erreur du paquetage inputenc telle que Invalid UTF-8 byte "96 signifie que le fichier d’entrée contient de la matière qui ne suit pas le schéma de codage. Souvent ces erreurs proviennent de la copie de matière issue d’un document utilisant un codage différent de celui du fichier d’entrée ; l’erreur donnée en exemple provient d’un guillemet anglais simple copié d’une page web utilisant latin1 vers un fichier d’entrée LaTeX utilisant UTF-8. La solution la plus simple consiste à remplacer tout caractère non-UTF-8 avec leur équivalent UTF-8, ou d’utiliser une commande ou un caractère équivalent en LaTeX.

Dans certains documents, tel que des collections d’articles de revue écrits pas différents auteurs, changer le codage en milieu de document peut s’avérer nécessaire. Utiliser la commande \inputencoding{nom-codage}. Les valeurs les plus usuelles pour nom-codage sont : ascii, latin1, latin2, latin3, latin4, latin5, latin9, latin10, et utf8.

23.7 paquetage inputenc

23.7 paquetage `inputenc`