Предельная плотность дискретных точек - Limiting density of discrete points

В теория информации, то предельная плотность дискретных точек это корректировка формулы Клод Шеннон за дифференциальная энтропия.

Его сформулировал Эдвин Томпсон Джейнс для устранения недостатков в первоначальном определении дифференциальной энтропии.

Определение

Первоначально Шеннон записал следующую формулу для энтропия непрерывного распределения, известного как дифференциальная энтропия:

{ Displaystyle h (X) = - int p (x) log p (x) , dx.}

Однако, в отличие от формулы Шеннона для дискретной энтропии, это не результат какого-либо вывода (Шеннон просто заменил символ суммирования в дискретной версии на интеграл), и оказывается, что отсутствуют многие свойства, которые делают дискретную энтропию полезной. мера неопределенности. В частности, он не инвариантен относительно замена переменных и даже может стать отрицательным. Кроме того, это даже неверно по размерам. С ${ Displaystyle P (x)}$ будет безразмерным, ${ displaystyle p (x)}$ должны иметь единицы ${ displaystyle { frac {1} {dx}}}$ , что означает, что аргумент логарифма не является безразмерным, как требуется.

Джейнс (1963, 1968) утверждал, что формулу для непрерывной энтропии следует выводить, взяв предел все более плотных дискретных распределений.^[1]^[2] Предположим, что у нас есть набор ${ displaystyle N}$ дискретные точки ${ displaystyle {x_ {i} }}$ , такое, что в пределе ${ displaystyle N to infty}$ их плотность приближается к функции ${ Displaystyle м (х)}$ называется «инвариантной мерой».

{ displaystyle lim _ {N to infty} { frac {1} {N}} , ({ mbox {количество точек в}} a

Джейнс вывел из этого следующую формулу для непрерывной энтропии, которую, как он утверждал, следует рассматривать как правильную:

{ displaystyle lim _ {N rightarrow infty} H_ {N} (X) = log (N) - int p (x) log { frac {p (x)} {m (x)} } , dx.}

Обычно, когда это пишется, термин ${ Displaystyle журнал (N)}$ опускается, так как обычно он не является конечным. Итак, фактическое общее определение

{ Displaystyle H (X) = - int p (x) log { frac {p (x)} {m (x)}} , dx.}

Где неясно, действительно ли ${ Displaystyle журнал (N)}$ термин следует опустить, можно написать

{ Displaystyle H_ {N} (X) sim log (N) + H (X)}

Обратите внимание, что в формуле Джейнса ${ Displaystyle м (х)}$ - плотность вероятности. Понятно, что для любого конечного ${ displaystyle N}$ который ${ Displaystyle м (х)}$ ^{[требуется дальнейшее объяснение ]} представляет собой просто равномерную плотность по квантованию непрерывного пространства, которое используется в сумме Римана. В пределе ${ Displaystyle м (х)}$ - непрерывная предельная плотность точек при квантовании, используемая для представления непрерывной переменной ${ displaystyle x}$ .

Предположим, у кого-то есть числовой формат, который принимает ${ displaystyle N}$ возможные значения, распределенные согласно ${ Displaystyle м (х)}$ . потом ${ displaystyle H_ {N} (X)}$ (если ${ displaystyle N}$ достаточно велика, чтобы справедливо непрерывное приближение) - дискретная энтропия переменной ${ displaystyle x}$ в этой кодировке. Это равно среднему количеству битов, необходимых для передачи этой информации, и не превышает ${ Displaystyle журнал (N)}$ . Следовательно, ${ Displaystyle H (X)}$ можно рассматривать как количество информации, полученной, зная, что переменная ${ displaystyle x}$ следует за распределением ${ displaystyle p (x)}$ , и не распределяется равномерно по возможным квантованным значениям, как было бы, если бы он следовал ${ Displaystyle м (х)}$ . ${ Displaystyle H (X)}$ на самом деле (отрицательный) Дивергенция Кульбака – Лейблера из ${ Displaystyle м (х)}$ к ${ displaystyle p (x)}$ , который рассматривается как информация, полученная в результате изучения того, что переменная, ранее считавшаяся распределенной как ${ Displaystyle м (х)}$ фактически распространяется как ${ displaystyle p (x)}$ .

Формула непрерывной энтропии Джейнса обладает свойством инвариантности относительно замены переменных при условии, что ${ Displaystyle м (х)}$ и ${ displaystyle p (x)}$ преобразуются таким же образом. (Это мотивирует название «инвариантная мера» для м.) Это решает многие трудности, возникающие при применении формулы Шеннона для непрерывной энтропии. Сам Джейнс уронил ${ Displaystyle журнал (N)}$ термин, поскольку он не имел отношения к его работе (максимальное распределение энтропии), и несколько неудобно иметь бесконечный член в расчетах. К сожалению, с этим ничего не поделать, если квантование выполняется произвольно точно, как это было бы в случае непрерывного предела. Обратите внимание, что ${ Displaystyle H (X)}$ как определено здесь (без ${ Displaystyle журнал (N)}$ term) всегда будет неположительным, потому что расхождение KL всегда будет неотрицательным.

Если это так, ${ Displaystyle м (х)}$ постоянна на некотором интервале размера ${ displaystyle r}$ , и ${ displaystyle p (x)}$ по существу равна нулю вне этого интервала, то предельная плотность дискретных точек (LDDP) тесно связана с дифференциальной энтропией ${ displaystyle h (X)}$

{ Displaystyle H_ {N} (X) приблизительно log (N) - log (r) + H (X)}

Предельная плотность дискретных точек - Limiting density of discrete points

Определение

Рекомендации