Кодування символів у HTML

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Мова гіпертекстової розмітки HTML використовується з 1991 року, але версія 4.0 (1997) була першою, де відтворення символів, відмінних від ASCII (тобто, англійської мови), досить стандартизовано.

Визначення кодування засобами HTTP[ред.ред. код]

При відображенні HTML-сторінки браузерами останнім потрібно повідомити в якому кодуванні збережена сторінка. Для цього можна скористатися двома методами:

  • набір символів документа задається в заголовку HTTP, наприклад для тексту в варіанті кодування windows-1251
Content-Type: text/html; charset=windows-1251
  • Інформацію про кодування можна вставити в сам документ HTML, використовуючи тег meta в розділ <head> HTML-документа. Наприклад, у разі кодування UTF-8 тег meta буде виглядати наступним чином:

  <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

У стандарті для мови HTML 5 мета тег інформує браузер про кодування сторінки записується відмінно від правил прийнятих в більш ранніх стандартах HTML. Так приклад наведений вище в HTML 5 буде виглядати наступним чином:

  <meta charset="utf-8"/>

Див. також[ред.ред. код]