Кодовая страница 942 - Code page 942

Кодовая страница 942 (сокращенно CP942 или же IBM-942) является одним из расширений IBM Shift JIS. Наборы кодированных символов: JIS X 0201, JIS X 0208, Расширения IBM для IBM 1880 UDC и расширения IBM. Это комбинация однобайтовых Кодовая страница 1041 и двухбайтовый Кодовая страница 301.[1]

Это надмножество IBM-932, отличающийся использованием кодовой страницы 1041 вместо Кодовая страница 897 для его однобайтовых кодов. Кодовая страница 1041 является расширением кодовой страницы 897 и добавляет пять однобайтовых символов.[2] 0x80 отображается на знак цента (¢), 0xA0 отображается в знак фунта стерлингов (£), 0xFD отображается на не подписывать (¬), 0xFE отображается в обратная косая черта (\) и 0xFF отображается на тильда (~).[3] Все они не назначены в кодовой странице 897 и, следовательно, в IBM-932.[4]

Кодовая страница 942 содержит стандартные 7-битные ISO 646 коды, а японские символы обозначены старшим битом первого байта, установленным в 1. Некоторые кодовые точки на этой странице требуют второго байта, поэтому символы используют для кодирования 8 или 16 бит.

Кодовая страница 1041 и, следовательно, кодовая страница 942, использует 0x5C для Знак иены (¥) и 0x7E для верхнего края (),[3] соответствует нижней половине JIS X 0201 скорее, чем US-ASCII. Однако версия кодовой страницы 942, используемая в Международные компоненты для Unicode (называемый «ibm-942_P12A-1999» или «x-IBM942C») использует сопоставления US-ASCII для однобайтовых символов от 0x20 до 0x7E. Это приводит к дублированию сопоставления тильды (0x7E и 0xFF) и обратной косой черты (0x5C и 0xFE).[5]

Макет

Первый байт
0123456789АBCDEF
0
1
2!"#$%&'()*+,-./
30123456789:;<=>?
4@АBCDEFграммЧАСяJKLMNО
5пQрSТUVWИксYZ[¥]^_
6`абcdежграммчасяjkлмпо
7пqрsттыvшИксуz{|}
8¢
9
А£
Bソ
C
D
E
F¬\~
Второй байт
0123456789АBCDEF
0
1
2
3
4
5
6
7
8
9
А
B
C
D
E
F
 
Непечатаемый символ ASCII
Неизмененный символ ASCII
Измененный символ ASCII
Однобайтовая катакана половинной ширины
Первый байт двухбайтового символа, используемый JIS X 0208
Не используется в качестве первого байта, незанятое пространство в JIS X 0208
Первый байт двухбайтового символа расширения IBM
Первый байт двухбайтового определяемого пользователем символа IBM
Однобайтовые расширения IBM
Второй байт двухбайтового символа, первая половина последовательности JIS которого была нечетной
Второй байт двухбайтового символа, первая половина последовательности JIS которого была четной
Не используется как второй байт двухбайтового символа


Смотрите также

Рекомендации

  1. ^ «Идентификаторы кодированного набора символов - CCSID 942». IBM Глобализация. IBM. Архивировано из оригинал 15 марта 2016 г.
  2. ^ «Идентификаторы кодовой страницы - CP 01041». IBM Глобализация. Архивировано из оригинал на 2016-06-01.
  3. ^ а б "CP01041.txt". IBM. В архиве из оригинала на 2019-01-12.
  4. ^ "CP00897.txt". IBM. В архиве из оригинала на 2019-01-12. Получено 2017-11-08.
  5. ^ "Converter Explorer: ibm-942_P12A-1999". Демонстрация ICU. Международные компоненты для Unicode.

внешняя ссылка