Як визначити кодування текстового файлу
Кодуванням тексту в файлах цифрових документів називають спосіб зіставлення послідовностей байт символам мови. Існує безліч різних кодувань для різних мов. Визначити кодування текстового файлу можна за допомогою ряду програмних засобів.
Вам знадобиться
- - Microsoft Office Word;
- - KWrite;
- - Mozilla Firefox;
- - enca.
Інструкція
1
Використовуйте редактор Microsoft Office Word, якщо він встановлений на комп`ютері, для визначення кодування текстового файлу. Запустіть цю програму. У головному меню виберіть пункт «Файл» і «Відкрити ...» або натисніть клавіші Ctrl + O. В відобразиться діалозі перейдіть до потрібного каталогу і виділіть файл. Натисніть кнопку «Відкрити». Якщо кодування тексту відрізняється від CP1251, автоматично відкриється діалог «Перетворення файлу». Активуйте в ньому опцію «Інша» і підберіть кодування, використовуючи список, що знаходиться праворуч. При виборі правильного кодування в поле «Зразок» буде виведений читається текст.
2
Застосуйте текстові редактори, які допускають вибір кодування тексту джерела. Хорошим прикладом подібного програми є KWrite (працює в середовищі KDE в UNIX-подібних системах). Завантажте текстовий файл в редактор. Потім просто перебирайте кодування, поки не відобразиться читається текст (в KWrite для цього використовується розділ Encoding меню Tools).
3
Аналогічно текстового редактора для визначення кодування файлу можна використовувати і браузер. Скористайтеся Mozilla Firefox. Запустіть цю програму. Якщо воно не встановлено, завантажте відповідний дистрибутив з сайту mozilla.org і інсталює його. Відкрийте в браузері текстовий файл. Для цього виберіть в головному меню пункти «Файл» і «Відкрити файл ...» або натисніть Ctrl + O. Якщо завантажений текст відобразився коректно, розгорніть розділ «Кодування» меню «Вид» і дізнайтеся кодування з назви пункту, на якому встановлена позначка. В іншому випадку підберіть даний параметр шляхом вибору різних пунктів того ж меню, а також його розділу «Додаткові».
4
Застосуйте спеціалізовані утиліти для визначення кодувань текстових файлів. В UNIX-подібних системах можна використовувати enca. При необхідності встановіть цю програму за допомогою доступних менеджерів пакетів. Виведіть список доступних мов, виконавши команду:
enca --list languages
Визначте кодування текстового файлу, вказавши його ім`я за допомогою опції -g і мову документа за допомогою опції -L. наприклад:
enca -L russian -g /home/vic/tmp/aaa.txt.
Статті за темою "Як визначити кодування текстового файлу"
Оцініть, будь ласка статтю