Неравенство Гиббса - Gibbs inequality

Джозайя Уиллард Гиббс

В теория информации, Неравенство Гиббса это заявление о информационная энтропия дискретного распределение вероятностей. Несколько других оценок энтропии вероятностных распределений выводятся из неравенства Гиббса, включая Неравенство Фано Впервые он был представлен Дж. Уиллард Гиббс в 19 ​​веке.

Неравенство Гиббса

Предположим, что

это распределение вероятностей. Тогда для любого другого распределения вероятностей

следующее неравенство между положительными величинами (поскольку pя и qя находятся между нулем и единицей):[1]:68

с равенством тогда и только тогда, когда

для всех я. Проще говоря, информационная энтропия распределения P меньше или равно его перекрестная энтропия с любым другим дистрибутивом Q.

Разница между двумя величинами - это Дивергенция Кульбака – Лейблера или относительная энтропия, поэтому неравенство также можно записать:[2]:34

Обратите внимание, что использование base-2 логарифмы не является обязательным и позволяет называть количество по обе стороны неравенства "средним неожиданный "измеряется в биты.

Доказательство

Для простоты докажем утверждение, используя натуральный логарифм (ln), поскольку

выбранный нами конкретный логарифм только масштабирует отношение.

Позволять обозначим множество всех для которого пя не равно нулю. Тогда, поскольку для всех х> 0, с равенством тогда и только тогда, когда х = 1, у нас есть:

Последнее неравенство является следствием пя и qя часть вероятностного распределения. В частности, сумма всех ненулевых значений равна 1. Некоторые ненулевые qяоднако их можно было исключить, поскольку выбор индексов зависит от пя быть ненулевым. Следовательно, сумма qя может быть меньше 1.

Пока по набору индексов , у нас есть:

,

или эквивалентно

.

Обе суммы могут быть распространены на всех , т.е. включая , напоминая, что выражение стремится к 0 как стремится к 0, а как правило в качестве стремится к 0. Мы приходим к

Для выполнения равенства потребуем

  1. для всех так что равенство держит,
  2. и что значит если , то есть, если .

Это может произойти тогда и только тогда, когда за .

Альтернативные доказательства

В качестве альтернативы результат можно доказать, используя Неравенство Дженсена, то неравенство логарифмической суммы, или тот факт, что дивергенция Кульбака-Лейблера является формой Расхождение Брегмана. Ниже мы приводим доказательство, основанное на неравенстве Дженсена:

Поскольку журнал является вогнутой функцией, мы имеем следующее:

Где первое неравенство связано с неравенством Дженсена, а последнее равенство - по той же причине, что и в приведенном выше доказательстве.

Кроме того, поскольку строго вогнутая, по условию равенства неравенства Йенсена равенство получается, когда

и

Предположим, что это отношение равно , то имеем

Где мы используем тот факт, что - распределения вероятностей. Следовательно, равенство происходит, когда .

Следствие

В энтропия из ограничено:[1]:68

Доказательство тривиально - просто положите для всех я.

Смотрите также

Рекомендации

  1. ^ а б Пьер Бремо (6 декабря 2012 г.). Введение в вероятностное моделирование. Springer Science & Business Media. ISBN  978-1-4612-1046-7.
  2. ^ Дэвид Дж. С. Маккей. Теория информации, логические выводы и алгоритмы обучения. Издательство Кембриджского университета. ISBN  978-0-521-64298-9.