КОИ8-РУ - KOI8-RU

КОИ8-РУ
Язык (и)Белорусский, украинец, русский, болгарский
Классификация8 бит КОИ, расширенный ASCII
РасширяетсяКОИ8-Б
На основеКОИ8-У, КОИ8-Р
Другая связанная кодировка (и)КОИ8-Э, КОИ8-Ф

КОИ8-РУ это 8-битный кодировка символов, предназначенный для покрытия русский, украинец, и Белорусский которые используют Кириллица алфавит. Это тесно связано с КОИ8-Р, который охватывает русский и болгарский, но заменяет десять символов прямоугольника на пять украинских и белорусских букв Ґ, Є, І, Ї, и Ў как в верхнем, так и в нижнем регистрах. Это еще более тесно связано с КОИ8-У, который не включает, но в остальном производит те же замены. Дополнительные буквенные обозначения соответствуют КОИ8-Э, за исключением, которое добавляется к КОИ8-Ф.

В IBM, КОИ8-РУ присваивается кодовая страница /CCSID 1167.[1][2]

KOI8 по-прежнему используется гораздо чаще, чем ISO 8859-5, которые так и не прижились. Другая распространенная кодировка символов кириллицы - Окна-1251. В будущем оба могут уступить место Unicode.

KOI8 означает Код Обмен Информации, 8 бит (русский: Код Обмена Информации, 8 бит), что означает «Код для обмена информацией, 8 бит».

Наборы символов KOI8 обладают тем свойством, что буквы русской кириллицы располагаются в псевдолатическом порядке, а не в естественном кириллическом алфавитном порядке, как в ISO 8859-5. Хотя это может показаться неестественным, у него есть то полезное свойство, что если восьмой бит удален, текст все еще можно прочитать (или, по крайней мере, расшифровать) при транслитерации с обратным регистром на обычном ASCII-терминале. Например, «Русский Текст» в KOI8-RU становится РУССКИЙ ТЕКСТ ("Русский текст"), если 8-й бит удален.

Набор символов

В следующей таблице показана кодировка KOI8-RU. Каждый символ показан с его эквивалентом Unicode кодовая точка.

КОИ8-РУ[3][4][5]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
1_
16
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
А
0041
B
0042
C
0043
D
0044
E
0045
F
0046
грамм
0047
ЧАС
0048
я
0049
J
004A
K
004B
L
004C
M
004D
N
004E
О
004F
5_
80
п
0050
Q
0051
р
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
Икс
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
d
0064
е
0065
ж
0066
грамм
0067
час
0068
я
0069
j
006A
k
006B
л
006C
м
006D
п
006E
о
006F
7_
112
п
0070
q
0071
р
0072
s
0073
т
0074
ты
0075
v
0076
ш
0077
Икс
0078
у
0079
z
007A
{
007B
|
007C
}
007D
~
007E
8_
128

2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590
9_
144

2591

2592

2593

201C

25A0

2219

201D

2014

2116

2122
NBSP
00A0
»
00BB
®
00AE
«
00AB
·
00B7
¤
00A4
A_
160

2550

2551

2552
ё
0451
є
0454

2554
і
0456
ї
0457

2557

2558

2559

255A

255B
ґ
0491
ў
045E

255E
B_
176

255F

2560

2561
Ё
0401
Є
0404

2563
І
0406
Ї
0407

2566

2567

2568

2569

256A
Ґ
0490
Ў
040E
©
00A9
C_
192
ю
044E
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
D_
208
п
043F
я
044F
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044C
ы
044B
з
0437
ш
0448
э
044D
щ
0449
ч
0447
ъ
044A
E_
224
Ю
042E
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
F_
240
П
041F
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042C
Ы
042B
З
0417
Ш
0428
Э
042D
Щ
0429
Ч
0427
Ъ
042A

  Письмо  Число  Пунктуация  Символ  Другой  Неопределенный  Отличия от КОИ8-Р


Несмотря на то что RFC 2319 говорит, что символ 0x95 должен быть U + 2219 (∙), он также может быть U + 2022 (•), чтобы соответствовать символу маркера в Окна-1251.

В некоторых ссылках есть опечатка и неправильно указано, что символ 0xB4 - это U + 0403, а не правильный U + 0404. Эта опечатка присутствует в Приложении А к RFC 2319 (но таблица в основном тексте RFC дает правильное отображение).

Смотрите также

Рекомендации

  1. ^ «Кодовая страница 1167 информационного документа». Архивировано из оригинал на 2017-01-16.
  2. ^ «Информационный документ CCSID 1167». Архивировано из оригинал on 2016-03-27.
  3. ^ Лейшер, Марк (1999-12-20), KOI8-RU Таблица преобразования белорусской / украинской кириллицы в Unicode 2.1, KOI8RU.TXT
  4. ^ Кодовая страница CPGID 01167 (pdf) (PDF), IBM
  5. ^ Кодовая страница CPGID 01167 (txt), IBM

внешняя ссылка