Application C# console permettant la détection de l'encodage d'un fichier texte, ainsi que de son mode de retour à la ligne (end of line char). L'application intègre des options de ré-encodage vers un encodage cible.

Aryx bb47c1805c Refactoring. 2 years ago
DetectEncoding bb47c1805c Refactoring. 2 years ago
packages 5e1cd2f7b7 Utilisation de AryxDevLibrary.1.0.1.659 via Nuget (avant cela, le projet AryxDevLibrary était directement utilisé) 2 years ago
.gitignore 8e9735cf5f Import initiale - v1.0.0 2 years ago
DetectEncoding.sln f3990dd3cf Diverses Corrections 2 years ago
DetectEncoding.sln.DotSettings.user 8e9735cf5f Import initiale - v1.0.0 2 years ago
DetectEncoding.v12.suo bb47c1805c Refactoring. 2 years ago
README.md d2383350ad Mettre à jour 'README.md' 2 years ago

README.md

EncodingDetector

Encoding Detector est une application console pour Windows 7/8/10. Elle fonctionne avec le .Net Framework 4.0. Cette application permet la détection de l'encodage d'un fichier texte (ASCII, ANSI, UTF8, UTF16) ainsi que du caractère de fin de ligne (style UNIX ou DOS). Elle peut également effectuer un ré-encodage vers un fichier cible.

Librairies tierces

Encoding Detector utilise deux références tierces pour fonctionner :

Fonctionnement

Encoding Detector fonctionne comme une application console, c'est-à-dire via un shell Windows (invite de commandes ou PowerShell).

Syntaxe

DetectEncoding.exe -f fichier 
[-c UTF8_BOM|UTF8_NOBOM|ANSI|UTF16LE|UTF16BE|UTF16LE_NOBOM|UTF16BE_NOBOM|ASCII] [-e DOS|UNIX] [-o cibleConversion]

Détails

Fichier à traiter

Obligatoire

Option : -f ou --file

Description : Indique le chemin du fichier pour lequel il faut déterminer l'encodage et le caractère de fin de ligne.

Conversion de l'encodage

Option : -c ou --convert-to

Description : Spécifie l'encodage cible désiré.

Choix : UTF8_BOM, UTF8_NOBOM, ANSI, UTF16LE, UTF16BE, UTF16LE_NOBOM, UTF16BE_NOBOM, ASCII

Conversion du caractère de fin de ligne

Option : -e ou --end-of-line-to

Description : Spécifie le caractère de fin ligne cible désiré.

Choix : DOS : pour un caractère de fin de ligne \r\n. Utilisé dans les produits Microsoft (DOS, Windows)

UNIX : pour un caractère de fin de ligne \n.

Nom du fichier converti

Option : -o ou --output-file

Description : Nom désiré du fichier converti.

Conversion

La conversion de l'encodage et du caractère de fin de ligne ne s'effectue que lorsque l'encodage du fichier à traiter à réussi. Si pour une raison ou une autre l'encodage du fichier source n'est pas détecté, la conversion ne sera pas effectuée.

Si l'option "o" n'est pas indiqué, le fichier converti sera sous la forme :

NomDuFichierSource-Out.ExtensionDuFichierSource

Exemples

Exemple 1

Commande :

DetectEncoding.exe -f .\fileTest.sql

Sortie écran :

Encoding Detector with reencoding !
===================================
by Aryx - Wolfaryx informatique - 2018

Encoding detection based on work from AutoIt Consulting :
https://github.com/AutoItConsulting/text-encoding-detect

InputFile: C:\Users\ARyx\fileTest.sql
Encoding: Ansi; Unix

Ici, l'encodage du fichier fileTest.sql est détecté comme de l'Ansi. Son caractère de fin de ligne est "\n", de type Unix.

Exemple 2

Commande :

DetectEncoding.exe -f .\fileTest.sql -c UTF8_BOM -e DOS

Sortie écran :

Encoding Detector with reencoding !
===================================
by Aryx - Wolfaryx informatique - 2018


Encoding detection based on work from AutoIt Consulting :
https://github.com/AutoItConsulting/text-encoding-detect

InputFile: C:\Users\ARyx\fileTest.sql
Encoding: Ansi; Unix
Output : Encoding: UTF8_BOM; DOS

Ici, l'encodage du fichier fileTest.sql est détecté comme étant de l'ANSI. Son caractère de fin de ligne est "\n", de type Unix. Le fichier de sorti sera encodé en UTF8 avec BOM, et avec un caractère de fin de ligne "\r\n".