Кредитное плечо (статистика) - Leverage (statistics)
В статистика и в частности в регрессивный анализ, использовать это мера того, как далеко независимая переменная ценности наблюдение взяты из других наблюдений.
Пункты с высоким кредитным плечом это те наблюдения, если таковые имеются, сделанные при экстремальных или выпадающих значениях независимых переменных, так что отсутствие соседних наблюдений означает, что подобранная регрессионная модель будет проходить близко к этому конкретному наблюдению.[1]
Определение
в линейная регрессия модель, оценка кредитного плеча для я-е наблюдение определяется как:
то я-й диагональный элемент матрица проекции , куда это матрица дизайна (чьи строки соответствуют наблюдениям, а столбцы - независимым или объясняющим переменным).
Интерпретация
Оценка кредитного плеча также известна как самочувствительность наблюдения или самовлияние,[2] из-за уравнения
в котором говорится, что рычаги я-е наблюдение равно частная производная приспособленных я-ое зависимое значение относительно измеренного я-ое зависимое значение . Эта частная производная описывает степень, в которой я-ое измеренное значение влияет на я-е подходящее значение. Обратите внимание, что это плечо зависит от значений объясняющих (x-) переменных всех наблюдений, но не от каких-либо значений зависимых (y-) переменных.
Уравнение следует непосредственно из вычисления подобранных значений через шляпа матрица в качестве ; то есть кредитное плечо - это диагональный элемент матрицы дизайна:
Границы кредитного плеча
Доказательство
Во-первых, обратите внимание, что ЧАС является идемпотентная матрица: Также обратите внимание, что симметричен (т. е .: ). Итак, приравнивая ii элемент ЧАС к тому из ЧАС 2, у нас есть
и
Влияние на остаточную дисперсию
Если мы находимся в обыкновенный метод наименьших квадратов установка с фиксированным X и гомоскедастический ошибки регрессии
затем я-th остаток регрессии
имеет отклонение
Другими словами, оценка рычага наблюдения определяет степень шума в неверном прогнозе модели для этого наблюдения, причем более высокий рычаг приводит к меньшему шуму.
Доказательство
Во-первых, обратите внимание, что идемпотентно и симметрично, и . Это дает
Таким образом
Студентизированные остатки
Соответствующие студенизированный остаток - остаток, скорректированный на его оценочную остаточную дисперсию для конкретного наблюдения, - тогда
куда является подходящей оценкой
Связанные понятия
Частичное кредитное плечо
Частичное кредитное плечо - это мера вклада отдельного независимые переменные Современные компьютерные пакеты для статистического анализа включают, как часть их средств для регрессионного анализа, различные количественные меры для идентификации влиятельные наблюдения, включая такую меру того, как независимая переменная вносит свой вклад в общий рычаг данных.
Расстояние Махаланобиса
Кредитное плечо тесно связано с Расстояние Махаланобиса[3] (см. доказательство: [4]).
В частности, для некоторой матрицы квадрат расстояния Махаланобиса некоторого вектора-строки от вектора среднего , длины , а с оценкой ковариационная матрица является:
Это связано с кредитным плечом матрицы шляпы после добавления к нему вектора-столбца из единиц. Отношения между ними следующие:
Взаимосвязь между кредитным плечом и расстоянием Махаланобиса позволяет нам разложить кредитное плечо на значимые компоненты, чтобы можно было аналитически исследовать некоторые источники высокого кредитного плеча. [5]
Программные реализации
Многие программы и статистические пакеты, такие как р, Python и т. д., включают реализации кредитного плеча.
Язык / Программа | Функция | Примечания |
---|---|---|
р | шляпа (x, перехват = ИСТИНА) или же hatvalues (модель, ...) | Видеть [1] |
Смотрите также
- Матрица проекции - чьи основные диагональные записи являются рычагами наблюдений
- Расстояние Махаланобиса - а (масштабированный ) мера рычага базы данных
- Расстояние повара - мера изменений коэффициентов регрессии при удалении наблюдения
- DFFITS
- Выброс - наблюдения с экстремальным Y значения
- Степени свободы (статистика), сумма баллов кредитного плеча
Рекомендации
- ^ Эверитт, Б. С. (2002). Кембриджский статистический словарь. Издательство Кембриджского университета. ISBN 0-521-81099-X.
- ^ Кардинали, К. (июнь 2013 г.). «Ассимиляция данных: диагностика влияния наблюдения на систему усвоения данных» (PDF).
- ^ Weiner, Irving B .; Schinka, John A .; Велисер, Уэйн Ф. (23 октября 2012 г.). Справочник по психологии, методам исследования в психологии. Джон Вили и сыновья. ISBN 978-1-118-28203-8.
- ^ Доказать связь между расстоянием Махаланобиса и кредитным плечом?
- ^ Ким, М. Г. (2004). «Источники высокого кредитного плеча в модели линейной регрессии (Журнал прикладной математики и вычислений, том 16, 509–513)». arXiv:2006.04024 [math.ST ].