Чау-тест - Chow test
В Чау-тест(Мандарин: 鄒 檢定), предложенный эконометрист Грегори Чоу в 1960 году, это проверка того, являются ли истинные коэффициенты в двух линейная регрессия на разных наборах данных равны. В эконометрике он чаще всего используется в анализ временных рядов проверить наличие структурный разрыв в период, который можно считать известным априори (например, крупное историческое событие, такое как война). В оценка программы, тест Чоу часто используется для определения того, оказывают ли независимые переменные разное влияние на разные подгруппы населения.
Иллюстрации
Структурный разрыв (уклоны разные) | Оценка программы (точки пересечения различаются) |
---|---|
В есть структурный разрыв; отдельные регрессии на подынтервалы и дает лучшую модель, чем комбинированная регрессия (пунктирная линия) на всем интервале. | Сравнение двух разных программ (красный, зеленый) в общем наборе данных: отдельные регрессии для обеих программ дают лучшую модель, чем комбинированная регрессия (черный). |
Первый тест чау
Предположим, что мы моделируем наши данные как
Если мы разделим наши данные на две группы, мы получим
и
В нулевая гипотеза теста Чау утверждает, что , , и , и есть предположение, что ошибки модели находятся независимые и одинаково распределенные из нормальное распределение с неизвестным отклонение.
Позволять быть суммой в квадрате остатки из объединенных данных, быть суммой в квадрате остатки из первой группы, и быть суммой в квадрате остатки из второй группы. и количество наблюдений в каждой группе и - общее количество параметров (в данном случае 3, т.е. 2 коэффициента независимых переменных + точка пересечения). Тогда статистика критерия Чоу равна
Статистика теста соответствует F-распределение с и степени свободы.
Тот же результат может быть достигнут с помощью фиктивных переменных.
Рассмотрим два сравниваемых набора данных. Во-первых, это «первичный» набор данных i = {1, ...,} и «вторичный» набор данных i = {+1, ..., n}. Тогда существует объединение этих двух множеств: i = {1, ..., n}. Если нет структурных изменений между первичными и вторичными наборами данных, можно провести регрессию по объединению без возникновения проблемы смещения оценок.
Рассмотрим регрессию:
Которая выполняется по i = {1, ..., n}.
D - фиктивная переменная, принимающая значение 1 для i = {+1, ..., n} и 0 в противном случае.
Если оба набора данных можно полностью объяснить с помощью тогда фиктивная переменная не используется, поскольку набор данных полностью объясняется ограниченным уравнением. Таким образом, при условии отсутствия структурных изменений у нас есть нулевая и альтернативная гипотеза:
Нулевая гипотеза о совместной незначимости D может быть запущена как F-тест с n-2 (k + 1) степенями свободы. То есть: .
Замечания
- Глобальную сумму квадратов (SSE) часто называют Ограниченной суммой квадратов (RSSM), поскольку мы в основном тестируем модель с ограничениями, в которой у нас есть предположения (с количество регрессоров).
- Некоторое программное обеспечение, такое как SAS, будет использовать прогнозирующий тест Чоу, когда размер подвыборки меньше количества регрессоров.
Рекомендации
- Чоу, Грегори С. (1960). «Проверка равенства между наборами коэффициентов в двух линейных регрессиях» (PDF). Econometrica. 28 (3): 591–605. Дои:10.2307/1910133. JSTOR 1910133.
- Доран, Ховард Э. (1989). Прикладной регрессионный анализ в эконометрике. CRC Press. п. 146. ISBN 978-0-8247-8049-4.
- Догерти, Кристофер (2007). Введение в эконометрику. Издательство Оксфордского университета. п. 194. ISBN 978-0-19-928096-4.
- Кмента Ян (1986). Элементы эконометрики (Второе изд.). Нью-Йорк: Макмиллан. стр.412–423. ISBN 978-0-472-10886-2.
- Вулдридж, Джеффри М. (2009). Введение в эконометрику: современный подход (Четвертое изд.). Мейсон: Юго-Западный. С. 243–246. ISBN 978-0-324-66054-8.
внешняя ссылка
- Вычисление статистики Чоу, Тесты Чоу и Уолда, Чау-тесты: Серия объяснений FAQ из Stata Корпорация в https://www.stata.com/support/faqs/
- [1]: Серия объяснений FAQ из SAS Корпорация