Степени свободы (статистика) - Degrees of freedom (statistics)

В статистика, номер степени свободы - количество значений в окончательном расчете статистика которые могут варьироваться.[1]

Количество независимых способов, которыми динамическая система может двигаться, не нарушая наложенных на нее ограничений, называется числом степеней свободы. Другими словами, количество степеней свободы можно определить как минимальное количество независимых координат, которые могут полностью определять положение системы.

Оценки статистические параметры могут быть основаны на разном количестве информации или данных. Количество независимых частей информации, которые используются для оценки параметра, называется степенями свободы. В общем случае степени свободы оценки параметра равны количеству независимых оценки которые входят в оценку за вычетом количества параметров, используемых в качестве промежуточных шагов в оценке самого параметра (в большинстве случаев дисперсия выборки имеет N - 1 степень свободы, поскольку вычисляется из N случайные оценки за вычетом единственного параметра, оцениваемого как промежуточный шаг, который является средним по выборке).[2]

Математически степень свободы - это количество Габаритные размеры домена случайный вектор, или, по сути, количество «свободных» компонентов (сколько компонентов необходимо знать, прежде чем вектор будет полностью определен).

Этот термин чаще всего используется в контексте линейные модели (линейная регрессия, дисперсионный анализ ), где некоторые случайные векторы вынуждены лежать в линейные подпространства, а количество степеней свободы - это размерность подпространство. Степени свободы также обычно связаны с квадратами длин (или «суммой квадратов» координат) таких векторов, а параметры хи-квадрат и другие распределения, которые возникают в связанных задачах статистического тестирования.

Хотя вводные учебники могут вводить степени свободы в качестве параметров распределения или посредством проверки гипотез, именно основная геометрия определяет степени свободы и имеет решающее значение для правильного понимания концепции.

История

Хотя основная концепция степеней свободы была признана еще в 1821 году в работах астронома и математика. Карл Фридрих Гаусс,[3] его современное определение и использование были впервые разработаны английским статистиком Уильям Сили Госсет в его 1908 Биометрика статья «Вероятная ошибка среднего», опубликованная под псевдонимом «Студент».[4] Хотя Госсет фактически не использовал термин «степени свободы», он объяснил эту концепцию в ходе разработки того, что стало известно как Распределение Стьюдента. Сам термин популяризировал английский статистик и биолог. Рональд Фишер, начиная с его работы 1922 года о квадратах хи.[5]

Обозначение

В уравнениях типичный символ степеней свободы: ν (строчные Греческая буква ню ). В тексте и таблицах сокращение «d.f.» обычно используется. Р. А. Фишер используемый п символизировать степень свободы, но современное использование обычно оставляет п для размера выборки.

Случайных векторов

Геометрически степени свободы можно интерпретировать как размерность определенных векторных подпространств. В качестве отправной точки предположим, что у нас есть выборка независимых нормально распределенных наблюдений,

Это можно представить как п-размерный случайный вектор:

Поскольку этот случайный вектор может лежать где угодно в п-мерное пространство, имеет п степени свободы.

Теперь позвольте быть выборочное среднее. Случайный вектор можно разложить как сумму выборочного среднего плюс вектор остатков:

Первый вектор в правой части ограничен, чтобы быть кратным вектору единиц, и единственная свободная величина - . Следовательно, он имеет 1 степень свободы.

Второй вектор ограничен соотношением . Первый п - 1 компоненты этого вектора могут быть любыми. Однако, как только вы узнаете первую п - 1, ограничение сообщает вам значение п-й компонент. Следовательно, этот вектор имеет п - 1 степень свободы.

Математически первый вектор - это ортогональная проекция или проекция методом наименьших квадратов вектора данных на подпространство охватывал вектором единиц. 1 степень свободы - это размерность этого подпространства. Второй вектор невязки - это проекция методом наименьших квадратов на (п - 1) -мерный ортогональное дополнение этого подпространства и имеет п - 1 степень свободы.

В приложениях статистического тестирования часто напрямую интересуют не векторы компонентов, а их квадраты длин. В приведенном выше примере остаточная сумма квадратов является

Если точки данных нормально распределены со средним 0 и дисперсией , то остаточная сумма квадратов имеет масштабированный распределение хи-квадрат (в масштабе ), с участием п - 1 степень свободы. Степени свободы, здесь параметр распределения, все еще можно интерпретировать как размерность лежащего в основе векторного подпространства.

Аналогичным образом, однократный т-тестовое задание статистика

следует за Студенческий т распространение с п - 1 степень свободы при предполагаемом среднем значении верно. Опять же, степени свободы возникают из остаточного вектора в знаменателе.

В моделях структурных уравнений

Когда представлены результаты моделей структурных уравнений (SEM), они обычно включают один или несколько показателей общего соответствия модели, наиболее распространенным из которых является χ2 статистика. Это составляет основу для других обычно публикуемых индексов. Хотя чаще всего интерпретируются именно эти статистические данные, степени свободы χ2 необходимы для понимания соответствия модели, а также характера самой модели.

Степени свободы в SEM вычисляются как разность между количеством уникальных частей информации, которые используются в качестве входных данных для анализа, иногда называемых известными, и количеством параметров, которые однозначно оцениваются, иногда называемых неизвестными. Например, в однофакторном подтверждающем факторном анализе с 4 элементами имеется 10 известных (шесть уникальных ковариаций среди четырех элементов и четыре дисперсии элементов) и 8 неизвестных (4 факторные нагрузки и 4 дисперсии ошибок) для 2 степеней вероятности. свобода. Степени свободы важны для понимания соответствия модели, хотя бы по той или иной причине, при прочих равных, чем меньше степеней свободы, тем лучше показатели, такие как χ2 будет.

Было показано, что степени свободы могут использоваться читателями статей, содержащих SEM, чтобы определить, действительно ли авторы этих статей сообщают правильную статистику соответствия модели. В организационных науках, например, почти половина статей, опубликованных в ведущих журналах, сообщают о степенях свободы, которые несовместимы с моделями, описанными в этих статьях, оставляя читателя гадать, какие модели были фактически протестированы.[6]

Остатков

Обычный способ думать о степенях свободы - это количество независимых частей информации, доступных для оценки другой части информации. Более конкретно, количество степеней свободы - это количество независимых наблюдений в выборке данных, которые доступны для оценки параметра популяции, из которой эта выборка взята. Например, если у нас есть два наблюдения, при вычислении среднего у нас есть два независимых наблюдения; однако при вычислении дисперсии у нас есть только одно независимое наблюдение, поскольку два наблюдения одинаково удалены от выборочного среднего.

При подгонке статистических моделей к данным векторы остатков должны лежать в пространстве меньшей размерности, чем количество компонентов в векторе. Этот меньший размер - это количество степени свободы ошибки, также называется остаточные степени свободы.

пример

Пожалуй, самый простой пример - это. Предположим

находятся случайные переменные каждый с ожидаемое значение μ, и разреши

быть «выборочным средним». Тогда величины

остатки, которые можно рассматривать оценки из ошибки Икся − μ. Сумма остатков (в отличие от суммы ошибок) обязательно равна 0. Если известно значение любого п - 1 остаток, таким образом, можно найти последний. Это означает, что они вынуждены лежать в пространстве измерения. п - 1. Говорят, что есть п - 1 степень свободы для ошибок.

Пример, который лишь немного менее прост, - это пример наименьших квадратов оценка а и б в модели

где Икся дано, но eя и, следовательно Yя случайны. Позволять и быть оценками наименьших квадратов а и б. Тогда остатки

вынуждены лежать в пространстве, определяемом двумя уравнениями

Один говорит, что есть п - 2 степени свободы ошибки.

Обозначения заглавная буква Y используется при указании модели, а в нижнем регистре y в определении остатков; это потому, что первые являются гипотетическими случайными величинами, а вторые - фактическими данными.

Мы можем обобщить это на множественную регрессию, включающую п параметры и ковариаты (например, п - 1 предиктор и одно среднее (= перехват в регрессии)), и в этом случае стоимость в степени свободы посадки является п, уходя п - п степени свободы для ошибок

В линейных моделях

Демонстрация т а распределения хи-квадрат для задач с одним образцом выше - это простейший пример возникновения степеней свободы. Однако подобная геометрия и векторные разложения лежат в основе большей части теории линейные модели, в том числе линейная регрессия и дисперсионный анализ. Здесь представлен явный пример, основанный на сравнении трех средних; более подробно геометрия линейных моделей обсуждается Кристенсеном (2002).[7]

Предположим, что независимые наблюдения проводятся для трех популяций, , и . Ограничение тремя группами и равными размерами выборки упрощает обозначения, но идеи легко обобщаются.

Наблюдения можно разложить как

где являются средствами отдельных образцов, и среднее значение всех 3п наблюдения. В векторных обозначениях это разложение можно записать как

Вектор наблюдения в левой части имеет 3п степени свободы. В правой части первый вектор имеет одну степень свободы (или размерность) для общего среднего. Второй вектор зависит от трех случайных величин, , и . Однако они должны быть равны 0 и поэтому ограничены; поэтому вектор должен лежать в 2-мерном подпространстве и иметь 2 степени свободы. Остальные 3п - 3 степени свободы в остаточном векторе (состоящем из п - 1 степень свободы внутри каждой из популяций).

В дисперсионном анализе (ANOVA)

В задачах статистического тестирования обычно интересуют не сами составляющие векторы, а их квадраты длин или сумма квадратов. Степени свободы, связанные с суммой квадратов, представляют собой степени свободы соответствующих составляющих векторов.

Приведенный выше пример с тремя популяциями является примером односторонний дисперсионный анализ. Модель, или обработка, сумма квадратов - это квадрат длины второго вектора,

с 2 степенями свободы. Остаточная сумма квадратов, или ошибка, равна

с 3 (п−1) степеней свободы. Конечно, вводные книги по ANOVA обычно формулируют формулы без отображения векторов, но именно эта основная геометрия дает начало формулам SS и показывает, как однозначно определять степени свободы в любой данной ситуации.

При нулевой гипотезе об отсутствии разницы между средними значениями совокупности (и при условии, что стандартные предположения регулярности дисперсионного анализа удовлетворяются) суммы квадратов имеют масштабированные распределения хи-квадрат с соответствующими степенями свободы. Статистика F-критерия - это отношение после масштабирования по степеням свободы. Если нет разницы между популяциями, значит, это соотношение соответствует F-распространение с 2 и 3п - 3 степени свободы.

В некоторых сложных настройках, таких как несбалансированный разделенный участок В планах суммы квадратов больше не имеют масштабированного распределения хи-квадрат. Сравнение суммы квадратов со степенями свободы больше не имеет смысла, и в этих случаях программное обеспечение может сообщать об определенных дробных «степенях свободы». Такие числа не имеют подлинной интерпретации степеней свободы, а просто дают приблизительный распределение хи-квадрат для соответствующей суммы квадратов. Детали таких приближений выходят за рамки этой страницы.

В вероятностных распределениях

Несколько часто встречающихся статистических распределений (Ученики т, хи-квадрат, F ) имеют параметры, которые обычно называют степени свободы. Эта терминология просто отражает то, что во многих приложениях, где встречаются эти распределения, параметр соответствует степеням свободы лежащего в основе случайного вектора, как в предыдущем примере ANOVA. Другой простой пример: если независимы нормальные случайные величины, статистика

следует распределению хи-квадрат с п - 1 степень свободы. Здесь степени свободы возникают из остаточной суммы квадратов в числителе, и, в свою очередь, п - 1 степень свободы основного остаточного вектора .

При применении этих распределений к линейным моделям параметры степеней свободы могут принимать только целое число ценности. Базовые семейства распределений допускают дробные значения для параметров степеней свободы, которые могут возникнуть при более сложных применениях. Один набор примеров - это задачи, в которых приближения хи-квадрат на основе эффективные степени свободы используются. В других приложениях, таких как моделирование хвостатый данные, а т или F-распределение может использоваться как эмпирическая модель. В этих случаях нет особых степени свободы интерпретация параметров распределения, даже если терминология может и дальше использоваться.

В нестандартной регрессии

Многие нестандартные методы регрессии, в том числе регуляризованный метод наименьших квадратов (например., регресс гребня ), линейные сглаживания, сглаживающие шлицы, и полупараметрическая регрессия не основаны на обыкновенный метод наименьших квадратов прогнозы, а скорее на упорядоченный (обобщенный и / или оштрафованные) методом наименьших квадратов, и поэтому степени свободы, определенные в терминах размерности, обычно не используются для этих процедур. Однако эти процедуры все еще линейны в наблюдениях, и подобранные значения регрессии могут быть выражены в виде

где - вектор подобранных значений для каждого из исходных значений ковариации из подобранной модели, y - исходный вектор ответов, а ЧАС это шляпа матрица или, в более общем смысле, более гладкая матрица.

Для статистического вывода суммы квадратов все еще могут быть сформированы: сумма квадратов модели равна ; остаточная сумма квадратов равна . Однако, поскольку ЧАС не соответствует обычной аппроксимации методом наименьших квадратов (т.е. не является ортогональной проекцией), эти суммы квадратов больше не имеют (масштабированных, нецентральных) распределений хи-квадрат, а степени свободы с определением размеров не являются полезно.

В эффективные степени свободы соответствия можно определить различными способами, чтобы реализовать критерии согласия, перекрестная проверка, и другие статистические выводы процедуры. Здесь можно различить регрессионные эффективные степени свободы и остаточные эффективные степени свободы.

Регрессионные эффективные степени свободы

Для эффективных степеней свободы регрессии соответствующие определения могут включать след матрицы шляпы,[8] tr (ЧАС) след квадратичной формы шляпной матрицы tr (H'H) форма tr (2ЧАСЧАС ЧАС'), или Приближение Саттертуэйта, tr (H'H)2/ tr (H'HH'H).[9]В случае линейной регрессии матрица шляпы ЧАС является Икс(Икс 'Икс)−1ИКС ', и все эти определения сводятся к обычным степеням свободы. Заметить, что

регрессионные (не остаточные) степени свободы в линейных моделях представляют собой «сумму чувствительности подобранных значений по отношению к наблюдаемым значениям отклика»,[10] то есть сумма кредитное плечо.

Один из способов понять это - рассмотреть простую матрицу сглаживания, такую ​​как Размытие по Гауссу, используется для уменьшения шума данных. В отличие от простой линейной или полиномиальной аппроксимации, вычисление эффективных степеней свободы сглаживающей функции непросто. В этих случаях важно оценить степени свободы, разрешенные матрица, так что остаточные степени свободы могут затем использоваться для оценки статистических тестов, таких как .

Остаточные эффективные степени свободы

Существуют соответствующие определения остаточных эффективных степеней свободы (redf) с ЧАС заменяется я − ЧАС. Например, если целью является оценка дисперсии ошибки, redf будет определен как tr ((я − ЧАС)'(я − ЧАС)), а несмещенная оценка (с ),

или:[11][12][13][14]

Последнее приближение выше[12] снижает вычислительные затраты с О(п2) только О(п). В общем числитель будет минимизируемой целевой функцией; например, если матрица шляпы включает в себя ковариационную матрицу наблюдения Σ, то становится .

Общее

Обратите внимание, что, в отличие от исходного случая, допускаются нецелочисленные степени свободы, хотя значение обычно должно быть ограничено от 0 до п.[15]

Рассмотрим, например, k-ближайший сосед более плавный, что является средним k ближайшие измеренные значения к заданной точке. Затем на каждом из п измеренных точек, вес исходного значения в линейной комбинации, которая составляет прогнозируемое значение, составляет всего 1 /k. Таким образом, след матрицы шляпы есть н / к. Таким образом, плавные затраты н / к эффективные степени свободы.

В качестве другого примера рассмотрим существование почти повторяющихся наблюдений. Наивное применение классической формулы, пп, приведет к переоценке степени свободы остатков, как если бы каждое наблюдение было независимым. Однако более реалистично матрица шляп ЧАС = Икс(Икс−1 Икс)−1ИКС ' Σ−1 будет включать в себя ковариационную матрицу наблюдений Σ, указывающую на ненулевую корреляцию между наблюдениями.

Более общая формулировка эффективной степени свободы привела бы к более реалистичной оценке, например, дисперсии ошибки σ2, который, в свою очередь, масштабирует неизвестные параметры ' апостериорный среднеквадратичное отклонение; степень свободы также влияет на коэффициент расширения, необходимый для получения эллипс ошибки для данного уровень уверенности.

Другие составы

Подобные концепции являются эквивалентные степени свободы в непараметрическая регрессия,[16] то степень свободы сигнала в атмосферных исследованиях,[17][18] и нецелочисленная степень свободы в геодезии.[19][20]

Остаточная сумма квадратов имеет обобщенное распределение хи-квадрат, и теория, связанная с этим распределением[21] предоставляет альтернативный путь к ответам, приведенным выше.[требуется дальнейшее объяснение ]

Смотрите также

использованная литература

  1. ^ "Степени свободы". Глоссарий статистических терминов. Анимационное ПО. Получено 2008-08-21.
  2. ^ Лейн, Дэвид М. "Степени свободы". HyperStat Online. Статистические решения. Получено 2008-08-21.
  3. ^ Уокер, Х. М. (апрель 1940 г.). "Степени свободы" (PDF). Журнал педагогической психологии. 31 (4): 253–269. Дои:10,1037 / ч0054588.
  4. ^ Студент (март 1908 г.). «Вероятная ошибка среднего». Биометрика. 6 (1): 1–25. Дои:10.2307/2331554. JSTOR  2331554.
  5. ^ Фишер, Р. А. (январь 1922 г.). «Об интерпретации χ2 из таблиц непредвиденных обстоятельств и вычислении P». Журнал Королевского статистического общества. 85 (1): 87–94. Дои:10.2307/2340521. JSTOR  2340521.
  6. ^ Кортина, Дж. М., Грин, Дж. П., Киллер, К. Р. и Ванденберг, Р. Дж. (2017). Степени свободы в SEM: тестируем ли мы модели, которые, как мы заявляем, тестируют? Организационные методы исследования, 20 (3), 350-378.
  7. ^ Кристенсен, Рональд (2002). Плоские ответы на сложные вопросы: теория линейных моделей (Третье изд.). Нью-Йорк: Спрингер. ISBN  0-387-95361-2.
  8. ^ Тревор Хасти, Роберт Тибширани, Джером Х. Фридман (2009), Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование2-е изд., 746 с. ISBN  978-0-387-84857-0, Дои:10.1007/978-0-387-84858-7, [1] (уравнение (5.16))
  9. ^ Fox, J .; Sage Publications, inc; Шалфей. (2000). Непараметрическая простая регрессия: сглаживающие диаграммы рассеяния. Непараметрическая простая регрессия: сглаживающие диаграммы рассеяния. Публикации SAGE. п. 58. ISBN  978-0-7619-1585-0. Получено 2020-08-28.
  10. ^ Йе, Дж. (1998), "Об измерении и корректировке эффектов интеллектуального анализа данных и выбора модели", Журнал Американской статистической ассоциации, 93 (441), 120–131. JSTOR  2669609 (уравнение (7))
  11. ^ Клайв Лоадер (1999), Локальная регрессия и вероятность, ISBN  978-0-387-98775-0, Дои:10.1007 / b98858, (уравнение (2.18), стр.30)
  12. ^ а б Тревор Хасти, Роберт Тибширани (1990), Обобщенные аддитивные модели, CRC Press, (стр. 54) и (уравнение (B.1), стр. 305))
  13. ^ Саймон Н. Вуд (2006), Обобщенные аддитивные модели: введение в R, CRC Press, (уравнение (4,14), стр.172)
  14. ^ Дэвид Рупперт, М. П. Ванд, Р. Дж. Кэрролл (2003 г.), Полупараметрическая регрессия, Cambridge University Press (уравнение (3.28), стр. 82)
  15. ^ Джеймс С. Ходжес (2014) Линейные модели с широкими параметрами, CRC Press. [2]
  16. ^ Питер Дж. Грин, Б. В. Сильверман (1994), Непараметрическая регрессия и обобщенные линейные модели: подход со штрафом за грубость, CRC Press (уравнение (3.15), стр. 37)
  17. ^ Клайв Д. Роджерс (2000), Обратные методы зондирования атмосферы: теория и практика, World Scientific (уравнение (2.56), стр. 31)
  18. ^ Адриан Дойку, Томас Траутманн, Франц Шрайер (2010), Численная регуляризация обратных задач атмосферы., Springer (уравнение (4.26), стр. 114)
  19. ^ Д. Донг, Т. А. Херринг и Р. В. Кинг (1997), Оценка региональной деформации на основе комбинации космических и наземных геодезических данных, J. Геодезия, 72 (4), 200–214, Дои:10.1007 / s001900050161 (уравнение (27), стр.205)
  20. ^ H. Theil (1963), "Об использовании неполной априорной информации в регрессионном анализе", Журнал Американской статистической ассоциации, 58 (302), 401–414 JSTOR  2283275 (уравнение (5.19) - (5.20))
  21. ^ Джонс, Д.А. (1983) «Статистический анализ эмпирических моделей с оптимизацией», Биометрика, 70 (1), 67–88

дальнейшее чтение

внешние ссылки