Si vous transférez un fichier texte créé sous Windows vers Ubuntu, il y a de fortes chance pour que ce dernier contiennent des caractères qui ne seront pas correctement affichés.
Exemple de texte contenant des accents (signes diacritiques) visualisé sous Gedit :
Outre les 26 lettres de lalphabet, lécriture standard du français met en jeu cinq signes diacritiques (accents aigu, grave et circonflexe, tréma et cédille) et les deux ligatures <æ> et <>. Sajoutent ainsi 16 lettres : é, è, ê, ë, à, â, î, ï, ô, ù, û, ü, ÿ, æ, et ç. Ce ne sont pas des décorations : ils ont tous une valeur orthographique. « Un policier tue », ce nest pas la même chose que « un policier tué ». De même, il vaut mieux placer la cédille de caleçon sur le second c plutôt que sur le premier
Le même texte avec la commende cat :
Outre les 26 lettres de l�alphabet, l��criture standard du fran�ais met en jeu cinq signes diacritiques (accents aigu, grave et circonflexe, tr�ma et c�dille) et les deux ligatures <�> et <�>. S�ajoutent ainsi 16 lettres : �, �, �, �, �, �, �, �, �, �, �, �, �, �, � et �. Ce ne sont pas des d�corations : ils ont tous une valeur orthographique. � Un policier tue �, ce n�est pas la m�me chose que � un policier tu� �. De m�me, il vaut mieux placer la c�dille de cale�on sur le second c plut�t que sur le premier�
Cela vient de la différence de format de codage de caractères utilisé sous Windows et sous Ubuntu.
Windows utilise l’encodage Windows-1252 tandis que Ubuntu utilise par défaut (mais cela peut se changer) UTF-8 (pour s’en assurer il suffit d’utiliser la commande locale)
Pour corriger ce problème il suffit d’utiliser la commande iconv :
iconv -f CP1252 -t utf8 [fichier à convertir] > [fichier convertit]
Sources :
Le texte pris en exemple est un mixte de la définition de Jacques Poitou et de celle de Pince ton Français