charmap - набор символов для задания кодировки символов
ОПИСАНИЕ
Описание набора символов (charmap) создает набор из доступных символов,
а также их кодировки. Все поддерживаемые наборы символов должны иметь
своим подмножеством
переносимый набор символов.
СИНТАКСИС
Файл с набором символов начинается с заголовка, который может содержать
следующие ключевые слова:
<codeset>,
за которым следует имя кодировки.
<mb_cur_max>,
за которым следует максимальное число байтов для многобайтного
символа. Многобайтные символы в данный момент не поддерживаются. По
умолчанию это число равно 1.
<mb_cur_min>,
за которым следует минимальное число байтов на символ. Данное
значение может быть меньше или равно
mb_cur_max.
Если оно не задано, то по умолчанию принимается значение
mb_cur_max.
<escape_char>,
за которым следует символ, который должен использоваться как
символ escape во всех нижеследующих строках, чтобы выделять символы,
которые должны интерпретироваться специальным образом. По умолчанию
таким символом является обратная косая черта (\\).
<comment_char>,
за которым следует символ, который будет использоваться в качестве
символа комментария во всех нижеследующих строках. По умолчанию
таким символом является решетка (#).
Само определение набора символов начинается с ключевого слова
CHARMAP
в первом знакоместе.
Последующие строки могут иметь два формата, предназначенных для
задания кодировки символов:
<символьное-имя> <кодировка> <комментарии>
Такая форма задает ровно один символ и его кодировку.
Такая форма задает несколько символов. Она полезна только для многобайтных
символов, которые в данный момент не реализованы.
Последняя строка в файле определения набора символов должна содержать
END CHARMAP.
СИМВОЛЬНЫЕ ИМЕНА
Символьное имя
для символа содержит только символы из
переносимого набора символов.
Само имя заключается в угловые скобками. Символы, которые следуют за
<escape_char>,
теряют специальное значение и интерпретируются как сами эти символы;
например, последовательность
'<\\\\\\>>'
представляет собой символьное имя
'\\>'
заключенное в угловые скобки.
КОДИРОВКА СИМВОЛА
Кодировка может быть в любой из трех следующих форм: