Теорема кодирования источника Шеннона - Shannons source coding theorem
Теория информации |
---|
В теория информации, Теорема Шеннона о кодировании источника (или же бесшумная теорема кодирования) устанавливает пределы возможного Сжатие данных, и операционное значение Энтропия Шеннона.
Названный в честь Клод Шеннон, то теорема кодирования исходного кода показывает, что (в пределе, поскольку длина потока независимая и одинаково распределенная случайная величина (i.i.d.) данные стремятся к бесконечности) невозможно сжать данные так, чтобы кодовая скорость (среднее количество битов на символ) было меньше энтропии Шеннона источника, без фактической уверенности в том, что информация будет потеряна. Однако можно получить скорость кода, произвольно близкую к энтропии Шеннона, с пренебрежимо малой вероятностью потери.
В исходная теорема кодирования для символьных кодов устанавливает верхнюю и нижнюю границы минимально возможной ожидаемой длины кодовых слов в зависимости от энтропия входного слова (которое рассматривается как случайная переменная ) и размера целевого алфавита.
Заявления
Исходное кодирование является отображением (последовательности) символов из информации источник в последовательность символов алфавита (обычно битов), так что исходные символы могут быть точно восстановлены из двоичных битов (исходное кодирование без потерь) или восстановлены с некоторым искажением (исходное кодирование с потерями). Это концепция Сжатие данных.
Теорема исходного кода
В теории информации теорема кодирования исходного кода (Шеннон 1948)[1] неофициально заявляет, что (MacKay 2003, стр. 81,[2] Обложка 2006, Глава 5[3]):
N i.i.d. случайные величины, каждая с энтропия ЧАС(Икс) можно сжать более чем N H(Икс) биты с незначительным риском потери информации, так как N → ∞; но, наоборот, если они сжаты до менее чем N H(Икс) бит практически уверен, что информация будет потеряна.
Теорема исходного кодирования для символьных кодов
Позволять Σ1, Σ2 обозначим два конечных алфавита и пусть Σ∗
1 и Σ∗
2 обозначить набор всех конечных слов из этих алфавитов (соответственно).
Предположим, что Икс случайная величина, принимающая значения в Σ1 и разреши ж быть однозначно декодируемый код из Σ∗
1 к Σ∗
2 куда | Σ2| = а. Позволять S обозначают случайную величину, заданную длиной кодового слова ж (Икс).
Если ж оптимален в том смысле, что он имеет минимальную ожидаемую длину слова для Икс, затем (Шеннон, 1948):
Где обозначает ожидаемое значение оператор.
Доказательство: теорема о кодировании источника
Данный Икс является i.i.d. источник, его Временные ряды Икс1, ..., Иксп это i.i.d. с энтропия ЧАС(Икс) в дискретнозначном случае и дифференциальная энтропия в непрерывнозначном случае. Теорема исходного кода утверждает, что для любого ε > 0, т.е. для любого ставка ЧАС(Икс) + ε больше, чем энтропия источника достаточно большой п и кодировщик, который принимает п i.i.d. повторение источника, Икс1:п, и сопоставляет его с п(ЧАС(Икс) + ε) двоичные биты, такие что исходные символы Икс1:п восстанавливаются из двоичных разрядов с вероятностью не менее 1 − ε.
Доказательство достижимости. Исправить некоторые ε > 0, и разреши
Типовой набор, Аε
п, определяется следующим образом:
В Асимптотическая равнораспределенность (AEP) показывает, что для достаточно больших п, вероятность того, что последовательность, порожденная источником, принадлежит типичному набору, Аε
п, как определено, приближается к одному. В частности, для достаточно больших п, можно сделать сколь угодно близким к 1 и, в частности, больше, чем (Видеть AEP для доказательства).
Определение типичных множеств подразумевает, что те последовательности, которые лежат в типичном множестве, удовлетворяют:
Обратите внимание, что:
- Вероятность последовательности взяты из Аε
п больше, чем 1 − ε. - , что следует из левой части (нижней оценки) для .
- , что следует из оценки сверху для и нижняя граница полной вероятности всего множества Аε
п.
С битов достаточно, чтобы указать на любую строку в этом наборе.
Алгоритм кодирования: кодировщик проверяет, находится ли входная последовательность в пределах типичного набора; если да, он выводит индекс входной последовательности в типичном наборе; в противном случае кодировщик выдает произвольный п(ЧАС(Икс) + ε) цифровой номер. Пока входная последовательность лежит в пределах типичного набора (с вероятностью не менее 1 − ε) кодировщик не делает ошибок. Таким образом, вероятность ошибки кодировщика ограничена сверху величиной ε.
Доказательство обратного. Обратное доказывается, показывая, что любой набор размера меньше, чем Аε
п (в смысле экспоненты) покрыл бы набор вероятностей, ограниченный от 1.
Доказательство: теорема кодирования источника для кодов символов.
За 1 ≤ я ≤ п позволять sя обозначают длину слова каждого возможного Икся. Определять , куда C выбирается так, чтобы q1 + ... + qп = 1. потом
где вторая строка следует из Неравенство Гиббса а пятая строка следует из Неравенство Крафт:
так бревно C ≤ 0.
Для второго неравенства можно положить
так что
и так
и
и поэтому по неравенству Крафт существует код без префиксов с такой длиной слова. Таким образом, минимальный S удовлетворяет
Распространение на нестационарные независимые источники
Кодирование источника без потерь с фиксированной скоростью для нестационарных независимых источников с дискретным временем
Определить типовой набор Аε
п в качестве:
Тогда для данного δ > 0, за п достаточно большой, Pr (Аε
п) > 1 − δ. Теперь мы просто кодируем последовательности в типичном наборе, а обычные методы кодирования исходного кода показывают, что мощность этого набора меньше, чем . Таким образом, в среднем ЧАСп(Икс) + ε битов достаточно для кодирования с вероятностью больше, чем 1 − δ, куда ε и δ можно сделать сколь угодно малым, сделав п больше.
Смотрите также
- Кодирование каналов
- Теорема о шумном канальном кодировании
- Показатель ошибки
- Асимптотическая равнораспределенность (AEP)
Рекомендации
- ^ К. Э. Шеннон, "Математическая теория коммуникации ", Технический журнал Bell System, т. 27, стр. 379–423, 623–656, июль, октябрь 1948 г.
- ^ Дэвид Дж. С. Маккей. Теория информации, логический вывод и алгоритмы обучения Кембридж: Издательство Кембриджского университета, 2003. ISBN 0-521-64298-1
- ^ Обложка, Томас М. (2006). «Глава 5: Сжатие данных». Элементы теории информации. Джон Вили и сыновья. ISBN 0-471-24195-4.