Кодування символів

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Набі́р си́мволів, кодува́ння си́мволів, таблиця символів (англ. character set, character encoding) — певна таблиця кодування скінченної множини символів. Така таблиця зіставляє кожному символу послідовність довжиною в один або більше байт. Нерідко замість терміна набір символів неправильно вживають термін кодова сторінка, що означає насправді окремий випадок набору символів з однобайтовим кодуванням. Термін кодуваннякомп'ютерному контексті) є синонімом терміна «набір символів».

Зараз в основному використовуються кодування двох типів: сумісні з ASCII і сумісні з EBCDIC, із гнітючою перевагою перших. Подання UTF-8 Юнікода сумісне з ASCII. Кодування на базі EBCDIC (наприклад, KOI-8) використовуються тільки на деяких мейнфреймах. Спочатку в кожній операційній системі використовувався один набір символів. Тепер використовувані набори символів стандартизовані та залежать від типу операційної системи лише за традицією й установлюються відповідно до локалі.

У Вікіпедії й інших проектах фонду Вікімедія використовується Юнікод (UTF-8).

Див. також [ред.]