Чау-тест - Chow test

В Чау-тест(Мандарин: 鄒 檢定), предложенный эконометрист Грегори Чоу в 1960 году, это проверка того, являются ли истинные коэффициенты в двух линейная регрессия на разных наборах данных равны. В эконометрике он чаще всего используется в анализ временных рядов проверить наличие структурный разрыв в период, который можно считать известным априори (например, крупное историческое событие, такое как война). В оценка программы, тест Чоу часто используется для определения того, оказывают ли независимые переменные разное влияние на разные подгруппы населения.

Иллюстрации

Применение теста Чау
Структурный разрыв (уклоны разные)Оценка программы (точки пересечения различаются)
Chowtest4.svgChowtest8.svg
В есть структурный разрыв; отдельные регрессии на подынтервалы и дает лучшую модель, чем комбинированная регрессия (пунктирная линия) на всем интервале.Сравнение двух разных программ (красный, зеленый) в общем наборе данных: отдельные регрессии для обеих программ дают лучшую модель, чем комбинированная регрессия (черный).

Первый тест чау

Предположим, что мы моделируем наши данные как

Если мы разделим наши данные на две группы, мы получим

и

В нулевая гипотеза теста Чау утверждает, что , , и , и есть предположение, что ошибки модели находятся независимые и одинаково распределенные из нормальное распределение с неизвестным отклонение.

Позволять быть суммой в квадрате остатки из объединенных данных, быть суммой в квадрате остатки из первой группы, и быть суммой в квадрате остатки из второй группы. и количество наблюдений в каждой группе и - общее количество параметров (в данном случае 3, т.е. 2 коэффициента независимых переменных + точка пересечения). Тогда статистика критерия Чоу равна

Статистика теста соответствует F-распределение с и степени свободы.


Тот же результат может быть достигнут с помощью фиктивных переменных.

Рассмотрим два сравниваемых набора данных. Во-первых, это «первичный» набор данных i = {1, ...,} и «вторичный» набор данных i = {+1, ..., n}. Тогда существует объединение этих двух множеств: i = {1, ..., n}. Если нет структурных изменений между первичными и вторичными наборами данных, можно провести регрессию по объединению без возникновения проблемы смещения оценок.


Рассмотрим регрессию:

Которая выполняется по i = {1, ..., n}.

D - фиктивная переменная, принимающая значение 1 для i = {+1, ..., n} и 0 в противном случае.

Если оба набора данных можно полностью объяснить с помощью тогда фиктивная переменная не используется, поскольку набор данных полностью объясняется ограниченным уравнением. Таким образом, при условии отсутствия структурных изменений у нас есть нулевая и альтернативная гипотеза:

Нулевая гипотеза о совместной незначимости D может быть запущена как F-тест с n-2 (k + 1) степенями свободы. То есть: .

Замечания

  • Глобальную сумму квадратов (SSE) часто называют Ограниченной суммой квадратов (RSSM), поскольку мы в основном тестируем модель с ограничениями, в которой у нас есть предположения (с количество регрессоров).
  • Некоторое программное обеспечение, такое как SAS, будет использовать прогнозирующий тест Чоу, когда размер подвыборки меньше количества регрессоров.

Рекомендации

  • Чоу, Грегори С. (1960). «Проверка равенства между наборами коэффициентов в двух линейных регрессиях» (PDF). Econometrica. 28 (3): 591–605. Дои:10.2307/1910133. JSTOR  1910133.
  • Доран, Ховард Э. (1989). Прикладной регрессионный анализ в эконометрике. CRC Press. п. 146. ISBN  978-0-8247-8049-4.
  • Догерти, Кристофер (2007). Введение в эконометрику. Издательство Оксфордского университета. п. 194. ISBN  978-0-19-928096-4.
  • Кмента Ян (1986). Элементы эконометрики (Второе изд.). Нью-Йорк: Макмиллан. стр.412–423. ISBN  978-0-472-10886-2.
  • Вулдридж, Джеффри М. (2009). Введение в эконометрику: современный подход (Четвертое изд.). Мейсон: Юго-Западный. С. 243–246. ISBN  978-0-324-66054-8.

внешняя ссылка