JIS X 0212 - JIS X 0212
Эта статья включает в себя список общих Рекомендации, но он остается в основном непроверенным, потому что ему не хватает соответствующих встроенные цитаты.Март 2018 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Язык (и) | Предназначен для использования вместе с JIS X 0208 за Японский поддерживать. Сам по себе не поддерживает никаких языков. |
---|---|
Стандарт | JIS X 0212: 1990 |
Классификация | Дополнительная кодировка, ISO 2022, DBCS, Кодирование CJK |
Расширяется | JIS X 0208 при использовании вместе |
Форматы кодирования | EUC-JP ISO-2022-JP-1 |
Преемник | JIS X 0213 |
JIS X 0212 это Японский промышленный стандарт определение набора кодированных символов для кодирования дополнительных символов для использования в японском языке. Этот стандарт предназначен для дополнения JIS X 0208 (Кодовая страница 952). Он пронумерован 953 или же 5049 как кодовую страницу IBM (см. ниже).
Это один из исходных стандартов Unicode. Унифицированные идеограммы CJK.
История
В 1990 г. Японская ассоциация стандартов (JSA) выпустила дополнительный стандарт набора символов: JIS X 0212-1990 Код дополнительного набора японских графических символов для обмена информацией (情報 交換 用 漢字 符号 - 補助 漢字, Jōhō Kōkan'y Kanji Fugō - Ходзё кандзи). Этот стандарт был предназначен для расширения круга персонажей, доступных в основном JIS X 0208 набор символов и устранить недостатки в охвате этого набора.
Функции
Стандарт определяет 6067 знаков, включая:
- 21 греческий символ с диакритическими знаками
- 26 восточноевропейских символов с диакритическими знаками (в основном кириллица)
- 198 буквенных знаков с диакритическими знаками
- 5,801 кандзи
Кодировки
Следующие кодировки или инкапсуляции используются для включения символов JIS X 0212 в файлах и т. Д.
- в EUC-JP символы представлены тремя байтами, первый из которых равен 0x8F, а следующие два - в диапазоне от 0xA1 до 0xFE.
- в ISO 2022 последовательность «ESC $ (D» используется для обозначения символов JIS X 0212.
Отсутствие инкапсуляции символов JIS X 0212 в популярных Shift JIS кодирование возможно, так как Shift JIS не имеет достаточного незанятого кодового пространства для символов.
Реализации
JIS X 0212 называется Кодовая страница 953 от IBM, который включает расширения поставщиков.[1][2][3] Альтернатива CCSID 5049 исключает эти расширения.[4]
Поскольку символы JIS X 0212 не могут быть закодированы в Shift JIS, системе кодирования, которая традиционно доминировала в японской обработке информации, было выполнено несколько практических реализаций набора символов. Как упоминалось выше, он может быть закодирован в EUC-JP, который обычно используется в системах Unix / Linux, и именно здесь произошло большинство реализаций:
- в начале 1990-х базовые шрифты "BDF" были скомпилированы для использования в Unix X Window System;
- был скомпилирован файл преобразования IME для системы WNN;
- то kterm приложение окна консоли было расширено для его поддержки;
- то Emacs и jstevie редакторы были расширены для его поддержки.
Многие браузеры WWW, такие как Netscape / Mozilla /Fire Fox family, Opera и т. д. и сопутствующие приложения, такие как Mozilla Thunderbird поддерживает отображение символов JIS X 0212 в кодировке EUC-JP, однако Internet Explorer не поддерживает символы JIS X 0212. Современные пакеты эмуляции терминала, такие как Терминал GNOME также поддерживают символы JIS X 0212.
Приложения, которые поддерживают JIS X 0212 в кодировке EUC, включают:
- то xjdic программа-словарь для Unix / Linux;
- то WWWJDIC Японский сервер словарей (однако как Internet Explorer не поддерживает расширения JIS X 0212 в EUC, этот сервер отправляет растровую графику для этих символов при установке в режиме EUC-JP.)
JIS X 0212 и Unicode
Кандзи в JIS X 0212 были взяты в качестве одного из источников для Ханьское объединение что привело к единому набору CJK символы в начальных ISO 10646 /Unicode стандарт. Были включены все 5801 кандзи.
Будущее
Помимо упомянутых выше приложений, стандарт JIS X 0212 фактически мертв. 2743 кандзи из него были включены в более поздние JIS X 0213 стандарт. В более долгосрочной перспективе его вклад, вероятно, будет заключаться в 5,801 кандзи, которые были включены в Unicode.
Смотрите также
Рекомендации
- JIS X 0212-1990 情報 交換 用 漢字 符号 - 補助 漢字, 日本 規格 協会, 東京 (1990 年 10 1 制定).(документ японских стандартов)
- Понимание обработки информации в Японии, Кен Лунде, O'Reilly & Assoc. 1993 г.
- Обработка информации CJKV, Кен Лунде, O'Reilly & Assoc. 1999, 2008.
- ^ «Кодовая страница 953 информационного документа». Архивировано из оригинал на 2016-03-17.
- ^ «Информационный документ CCSID 953». Архивировано из оригинал 28 марта 2016 г.
- ^ Кодовая страница CPGID 00953 (pdf) (PDF), IBM
- ^ «Информационный документ CCSID 5049». Архивировано из оригинал on 2016-03-27.