Si vous transférez un fichier texte créé sous Windows vers Ubuntu, il y a de fortes chance pour que ce dernier contiennent des caractères qui ne seront pas correctement affichés.

Exemple de texte contenant des accents (signes diacritiques) visualisé sous Gedit :

Outre les 26 lettres de l’alphabet, l’écriture standard du français met en jeu  
cinq signes diacritiques (accents aigu, grave et circonflexe, tréma et cédille)  
et les deux ligatures <æ> et <œ>.  
 
S’ajoutent ainsi 16 lettres : é, è, ê, ë, à, â, î, ï, ô, ù, û, ü, ÿ, æ, œ et ç. 
 
Ce ne sont pas des décorations : ils ont tous une valeur orthographique.  
 
« Un policier tue », ce n’est pas la même chose que « un policier tué ».  
De même, il vaut mieux placer la cédille de caleçon sur le second c plutôt que sur le premier…


Le même texte avec la commende cat :

Outre les 26 lettres de l�alphabet, l��criture standard du fran�ais met en jeu
cinq signes diacritiques (accents aigu, grave et circonflexe, tr�ma et c�dille)
et les deux ligatures <�> et <�>. 
 
S�ajoutent ainsi 16 lettres : �, �, �, �, �, �, �, �, �, �, �, �, �, �, � et �.
 
Ce ne sont pas des d�corations : ils ont tous une valeur orthographique. 
 
� Un policier tue �, ce n�est pas la m�me chose que � un policier tu� �.
De m�me, il vaut mieux placer la c�dille de cale�on sur le second c plut�t que sur le premier�

Cela vient de la différence de format de codage de caractères utilisé sous Windows et sous Ubuntu.

Windows utilise l’encodage Windows-1252 tandis que Ubuntu utilise par défaut (mais cela peut se changer) UTF-8 (pour s’en assurer il suffit d’utiliser la commande locale)


Pour corriger ce problème il suffit d’utiliser la commande iconv :

iconv -f CP1252 -t utf8 [fichier à convertir] > [fichier convertit]


Sources :

Le texte pris en exemple est un mixte de la définition de Jacques Poitou et de celle de Pince ton Français

Les commentaires sont fermés.