Кредитное плечо (статистика) - Leverage (statistics)

В статистика и в частности в регрессивный анализ, использовать это мера того, как далеко независимая переменная ценности наблюдение взяты из других наблюдений.

Пункты с высоким кредитным плечом это те наблюдения, если таковые имеются, сделанные при экстремальных или выпадающих значениях независимых переменных, так что отсутствие соседних наблюдений означает, что подобранная регрессионная модель будет проходить близко к этому конкретному наблюдению.[1]

Определение

в линейная регрессия модель, оценка кредитного плеча для я-е наблюдение определяется как:

то я-й диагональный элемент матрица проекции , куда это матрица дизайна (чьи строки соответствуют наблюдениям, а столбцы - независимым или объясняющим переменным).

Интерпретация

Оценка кредитного плеча также известна как самочувствительность наблюдения или самовлияние,[2] из-за уравнения

в котором говорится, что рычаги я-е наблюдение равно частная производная приспособленных я-ое зависимое значение относительно измеренного я-ое зависимое значение . Эта частная производная описывает степень, в которой я-ое измеренное значение влияет на я-е подходящее значение. Обратите внимание, что это плечо зависит от значений объясняющих (x-) переменных всех наблюдений, но не от каких-либо значений зависимых (y-) переменных.

Уравнение следует непосредственно из вычисления подобранных значений через шляпа матрица в качестве ; то есть кредитное плечо - это диагональный элемент матрицы дизайна:

Границы кредитного плеча

Доказательство

Во-первых, обратите внимание, что ЧАС является идемпотентная матрица: Также обратите внимание, что симметричен (т. е .: ). Итак, приравнивая ii элемент ЧАС к тому из ЧАС 2, у нас есть

и

Влияние на остаточную дисперсию

Если мы находимся в обыкновенный метод наименьших квадратов установка с фиксированным X и гомоскедастический ошибки регрессии

затем я-th остаток регрессии

имеет отклонение

Другими словами, оценка рычага наблюдения определяет степень шума в неверном прогнозе модели для этого наблюдения, причем более высокий рычаг приводит к меньшему шуму.

Доказательство

Во-первых, обратите внимание, что идемпотентно и симметрично, и . Это дает

Таким образом

Студентизированные остатки

Соответствующие студенизированный остаток - остаток, скорректированный на его оценочную остаточную дисперсию для конкретного наблюдения, - тогда

куда является подходящей оценкой

Связанные понятия

Частичное кредитное плечо

Частичное кредитное плечо - это мера вклада отдельного независимые переменные Современные компьютерные пакеты для статистического анализа включают, как часть их средств для регрессионного анализа, различные количественные меры для идентификации влиятельные наблюдения, включая такую ​​меру того, как независимая переменная вносит свой вклад в общий рычаг данных.

Расстояние Махаланобиса

Кредитное плечо тесно связано с Расстояние Махаланобиса[3] (см. доказательство: [4]).

В частности, для некоторой матрицы квадрат расстояния Махаланобиса некоторого вектора-строки от вектора среднего , длины , а с оценкой ковариационная матрица является:

Это связано с кредитным плечом матрицы шляпы после добавления к нему вектора-столбца из единиц. Отношения между ними следующие:

Взаимосвязь между кредитным плечом и расстоянием Махаланобиса позволяет нам разложить кредитное плечо на значимые компоненты, чтобы можно было аналитически исследовать некоторые источники высокого кредитного плеча. [5]

Программные реализации

Многие программы и статистические пакеты, такие как р, Python и т. д., включают реализации кредитного плеча.

Язык / ПрограммаФункцияПримечания
ршляпа (x, перехват = ИСТИНА) или же hatvalues ​​(модель, ...)Видеть [1]

Смотрите также

Рекомендации

  1. ^ Эверитт, Б. С. (2002). Кембриджский статистический словарь. Издательство Кембриджского университета. ISBN  0-521-81099-X.
  2. ^ Кардинали, К. (июнь 2013 г.). «Ассимиляция данных: диагностика влияния наблюдения на систему усвоения данных» (PDF).
  3. ^ Weiner, Irving B .; Schinka, John A .; Велисер, Уэйн Ф. (23 октября 2012 г.). Справочник по психологии, методам исследования в психологии. Джон Вили и сыновья. ISBN  978-1-118-28203-8.
  4. ^ Доказать связь между расстоянием Махаланобиса и кредитным плечом?
  5. ^ Ким, М. Г. (2004). «Источники высокого кредитного плеча в модели линейной регрессии (Журнал прикладной математики и вычислений, том 16, 509–513)». arXiv:2006.04024 [math.ST ].