Нормально распределенный и некоррелированный не означает независимого - Normally distributed and uncorrelated does not imply independent

В теория вероятности, хотя простые примеры показывают, что линейная некоррелированность двух случайных величин, как правило, не подразумевает их независимость, иногда ошибочно думают, что это означает, что когда две случайные величины нормально распределенный. В этой статье показано, что предположение о нормальном распределении не имеет таких последствий, хотя многомерное нормальное распределение, в том числе двумерное нормальное распределение, делает.

Сказать, что пара случайных величин имеет двумерное нормальное распределение означает, что каждый линейная комбинация из и для постоянных (т.е. не случайных) коэффициентов и имеет одномерное нормальное распределение. В том случае, если и некоррелированы, то они независимы.[1] Однако возможно для двух случайных величин и должны быть распределены таким образом совместно, чтобы каждый из них по отдельности имел нормальное распределение, и они не коррелировали, но не были независимыми; примеры приведены ниже.

Примеры

Симметричный пример

Две нормально распределенные, некоррелированные, но зависимые переменные.
Совместный ассортимент и . Более темный цвет означает более высокое значение функции плотности.

Предполагать имеет нормальное распределение с ожидаемое значение 0 и дисперсия 1. Пусть иметь Распределение Радемахера, так что или же , каждое с вероятностью 1/2, и положим не зависит от . Позволять . потом

  • и некоррелированы;
  • оба имеют одинаковое нормальное распределение; и
  • и не являются независимыми.[2]

Чтобы увидеть это и некоррелированы, можно считать ковариация : по определению, это

Тогда по определению случайных величин , , и , и независимость из , надо

Чтобы увидеть это имеет то же нормальное распределение, что и , учитывать

(поскольку и оба имеют одинаковое нормальное распределение), где это кумулятивная функция распределения нормального распределения ..

Чтобы увидеть это и не являются независимыми, обратите внимание, что или это .

Наконец, распределение простой линейной комбинации концентрирует положительную вероятность в 0: . Следовательно, случайная величина не распространяется нормально, и поэтому и не совместно нормально распределены (по определению выше).

Асимметричный пример

Совместная плотность и . Темнее означает более высокое значение плотности.

Предполагать имеет нормальное распределение с ожидаемое значение 0 и дисперсия 1. Пусть

куда - положительное число, которое необходимо указать ниже. Если очень маленький, то корреляция рядом если очень большой, то близко к 1. Поскольку корреляция непрерывная функция из , то теорема о промежуточном значении подразумевает, что есть определенная ценность что делает корреляцию 0. Это значение составляет приблизительно 1,54. В таком случае, и некоррелированы, но они явно не независимы, поскольку полностью определяет .

Чтобы увидеть это нормально распределен - действительно, его распределение такое же, как у - каждый может вычислить его кумулятивная функция распределения:

где предпоследнее равенство следует из симметрии распределения и симметрия условия, что .

В этом примере разница далеки от нормального распределения, поскольку имеет значительную вероятность (около 0,88) того, что оно равно 0. Напротив, нормальное распределение, будучи непрерывным распределением, не имеет дискретной части, то есть не концентрируется более чем нулевая вероятность в любой точке. как следствие и не совместно нормально распространяются, даже если они нормально распространяются отдельно.[3]

Примеры с поддержкой почти везде в ℝ2

Как известно, соотношение двух независимых стандартных нормальных случайных отклонений и имеет Распределение Коши. С равным успехом можно начать со случайной величины Коши и вывести условное распределение чтобы удовлетворить требование, чтобы с и независимые и стандартные нормальные. Проворачивая математику, можно обнаружить, что

в котором является случайной величиной Радемахера и это Случайная величина хи-квадрат с двумя степенями свободы.

Рассмотрим два набора , . Обратите внимание, что не индексируется - то есть та же случайная величина Коши используется в определении обоих и . Это разделение приводит к зависимостям по индексам: ни ни не зависит от . Тем не менее все и некоррелированы, поскольку все двумерные распределения обладают симметрией отражения по осям.

Ненормальные совместные распределения с нормальными краями.

На рисунке показаны диаграммы рассеяния выборок, взятых из вышеуказанного распределения. Это дает два примера двумерных распределений, которые некоррелированы и имеют нормальные предельные распределения, но не являются независимыми. На левой панели показано совместное распределение и ; дистрибутив поддерживается везде, но не у истоков. На правой панели показано совместное распределение и ; распределение имеет поддержку везде, кроме осей, и имеет разрыв в начале координат: плотность расходится при приближении к началу координат по любому прямому пути, кроме осей.

Смотрите также

Рекомендации

  1. ^ Хогг, Роберт; Танис, Эллиот (2001). «Глава 5.4. Двумерное нормальное распределение». Вероятность и статистический вывод (6-е изд.). С. 258–259. ISBN  0130272949.
  2. ^ UIUC, Лекция 21. Многомерное нормальное распределение, 21.6: «Индивидуально гауссовский против совместно гауссовского».
  3. ^ Эдвард Л. Мельник и Аарон Тененбейн, «Неправильные спецификации нормального распределения», Американский статистик, том 36, номер 4 ноября 1982 года, страницы 372–373