Чому замість букв показуються ієрогліфи

Іноді отримане повідомлення електронної пошти може замість тексту містити досить химерну суміш символів і графічних знаків, що нагадує ієрогліфи, яку з чиєїсь «легкої руки» охрестили «крякозябри». Це трапляється не тільки з текстом листів, але і з вмістом веб-сторінок, деяких текстових файлів і навіть з написами в інтерфейсі комп`ютерних програм.


Чому замість букв показуються ієрогліфи




При збереженні та відтворенні на екрані букв, цифр, знаків пунктуації та інших текстових елементів операційна система комп`ютера використовує спеціальні таблиці. У них всі ці символи розміщені в строго визначеному порядку. Коли ви зберігаєте який-небудь документ, що містить текст, то в файл записуються самі букви і цифри, а їх порядкові номери в цій таблиці. Коли ж ви відкриваєте такий документ, то відбувається зворотна операція - додаток читає з файлу номери символів і виводить на сторінці відповідні їм знаки з таблиці. Ці таблиці називають «наборами символів» (Character Set, скорочено CharSet) або «кодуваннями».

Таких таблиць існує досить багато - кілька десятків. Спочатку кожен конкуруючий виробник комп`ютерного програмного забезпечення створював свою власну таблицю символів, потім створювалися таблиці для різних національних алфавітів з обов`язковим включенням англійської, потім, у міру вдосконалення операційних систем, створювалися їх варіанти для нових можливостей і т.д. Якщо текст, записаний і збережений з використанням однієї такої таблиці потім відкрити з використанням іншого, то результатом і буде той самий, що ми називаємо словом «крякозябри» - номери символів залишаться колишніми, але знаки їм відповідні в цій таблиці буде зовсім іншими.

Вказівка кодування, яку комп`ютерна програма має використовувати для відображення текстового вмісту файлу, записується в службове поле цього файлу. Якщо текст передається по мережах, то вказівка кодування відправляється в службовому полі переданого пакета інформації. У HTML-коді веб сторінок для зберігання назви використаної кодування призначений спеціальний тег. У листі електронної пошти кодування передається в службових полях разом з інформацією про відправника, одержувача і т.д. Якщо вказівка кодування будь-яким з перерахованих способів відсутній, то з крякозябри доведеться боротися вручну - спробуйте підібрати потрібне кодування засобами прикладної програми. Така функція передбачена і в браузері, і в поштовому клієнті, а текстовий редактор (наприклад, Microsoft Word) сам намагається визначити правильний метод кодування за непрямими ознаками.

Здається, сьогодні нарешті створений стандарт таблиці символів, який задовольняє всіх - його назвали «Юнікод» (Unicode). Але перехід на нього ще тільки відбувається, тому з крякозябри доведеться стикатися ще кілька років.



Увага, тільки СЬОГОДНІ!


Оцініть, будь ласка статтю
Всього голосів: 107
Увага, тільки СЬОГОДНІ!