Тестирование суррогатных данных - Surrogate data testing

Тестирование суррогатных данных[1] (или метод суррогатных данных) является статистическим доказательство от противного техника и похожие на параметрическая начальная загрузка используется для обнаружения нелинейность в Временные ряды.[2] Техника в основном включает в себя указание нулевая гипотеза описывая линейный процесс а затем генерировать несколько суррогатные данные наборы в соответствии с с помощью Монте-Карло методы. Затем рассчитывается различающая статистика для исходного временного ряда и всего суррогатного набора. Если значение статистики значительно отличается для исходного ряда, чем для суррогатного набора, нулевая гипотеза отклоняется и предполагается нелинейность.[2]

Конкретный используемый метод проверки суррогатных данных напрямую связан с нулевой гипотезой. Обычно это похоже на следующее:Данные являются реализацией стационарной линейной системы, выход которой, возможно, измерялся монотонно возрастающей, возможно, нелинейной (но статической) функцией..[1] Здесь линейный означает, что каждое значение линейно зависит от прошлых значений или от настоящих и прошлых значений некоторого независимого одинаково распределенного (i.i.d.) процесса, обычно также гауссова. Это равносильно утверждению, что процесс ARMA тип. В случае потоков (непрерывных отображений) линейность системы означает, что она может быть выражена линейным дифференциальным уравнением. В этой гипотезе статический функция измерения - это функция, которая зависит только от текущего значения аргумента, а не от прошлых значений.

Методы

Было предложено множество алгоритмов генерации суррогатных данных. Обычно их делят на две группы:[3]

  • Типичные реализации: ряды данных генерируются как выходные данные хорошо подогнанной модели к исходным данным.
  • Ограниченные реализации: ряды данных создаются непосредственно из исходных данных, обычно путем их подходящего преобразования.

Последние методы суррогатных данных не зависят ни от конкретной модели, ни от каких-либо параметров, поэтому они являются непараметрическими методами. Эти методы суррогатных данных обычно основаны на сохранении линейной структуры исходной серии (например, на сохранении автокорреляционная функция, или эквивалентно периодограмма, оценка спектра образца).[4]Среди методов ограниченных реализаций наиболее широко используются (и поэтому их можно назвать классические методы) находятся:

  1. Алгоритм 0, или RS (для Случайное перемешивание):[1][5] Новые данные создаются просто путем случайных перестановок исходного ряда. Перестановки гарантируют то же распределение амплитуд, что и исходный ряд, но разрушают любую линейную корреляцию. Этот метод связан с нулевой гипотезой о том, что данные являются некоррелированным шумом (возможно, гауссовым и измеренным статической нелинейной функцией).
  2. Алгоритм 1, или RP (для Случайные фазы; также известный как FT, для Преобразование Фурье ):[1][6] Чтобы сохранить линейную корреляцию (периодограмму) ряда, суррогатные данные создаются посредством обратного преобразования Фурье модулей преобразования Фурье исходных данных с новыми (равномерно случайными) фазами. Если суррогаты должны быть действительными, фазы Фурье должны быть антисимметричными по отношению к центральному значению данных.
  3. Алгоритм 2, или AAFT (для Преобразование Фурье с поправкой на амплитуду):[1][3] Этот метод примерно имеет преимущества двух предыдущих: он пытается сохранить как линейную структуру, так и амплитудное распределение. Этот метод состоит из следующих шагов:
    • Масштабирование данных до распределения Гаусса (Гауссизация).
    • Выполнение RP-преобразования новых данных.
    • Наконец, выполняем преобразование, обратное первому (дегауссизация).
    Недостатком этого метода как раз и является то, что последний шаг несколько изменяет линейную структуру.
  4. Итерационный алгоритм 2, или IAAFT (для Итеративное преобразование Фурье с корректировкой по амплитуде):[7] Этот алгоритм является итеративной версией AAFT. Шаги повторяются до тех пор, пока автокорреляционная функция не станет достаточно похожей на исходную, или пока не исчезнут изменения амплитуд.

Было предложено множество других методов суррогатных данных, некоторые из которых основаны на оптимизации для достижения автокорреляции, близкой к исходной,[8][9][10] некоторые на основе вейвлет-преобразования[11][12][13] а некоторые способны работать с некоторыми типами нестационарных данных.[14][15][16]

Смотрите также

Рекомендации

  1. ^ а б c d е Дж. Тайлер; С. Юбэнк; А. Лонгтин; Б. Галдрикян; Дж. Дойн Фармер (1992). «Тестирование на нелинейность временных рядов: метод суррогатных данных» (PDF). Physica D. 58 (1–4): 77–94. Bibcode:1992 ФИД ... 58 ... 77 Т. Дои:10.1016 / 0167-2789 (92) 90102-С.
  2. ^ а б Андреас Галка (2000). Темы нелинейного анализа временных рядов: значение для анализа ЭЭГ. Ривер Эдж, Нью-Джерси: World Scientific. С. 222–223. ISBN  9789810241483.
  3. ^ а б Дж. Тайлер; Д. Причард (1996). «Метод Монте-Карло с ограничениями для проверки гипотез». Physica D. 94 (4): 221–235. arXiv:комп-газ / 9603001. Bibcode:1996 ФИД ... 94..221Т. Дои:10.1016/0167-2789(96)00050-4.
  4. ^ А. Галка; Т. Одзаки (2001). «Проверка на нелинейность многомерных временных рядов из непрерывной динамики». Physica D. 158 (1–4): 32–44. Bibcode:2001PhyD..158 ... 32G. CiteSeerX  10.1.1.379.7641. Дои:10.1016 / s0167-2789 (01) 00318-9.
  5. ^ J.A. Шейнкман; Б. ЛеБарон (1989). «Нелинейная динамика и доходность акций». Журнал бизнеса. 62 (3): 311. Дои:10.1086/296465.
  6. ^ A.R. Осборн; A.D. Kirwan Jr .; А. Провенцале; Л. Бергамаско (1986). «Поиски хаотического поведения в крупных и мезомасштабных движениях в Тихом океане». Physica D. 23 (1–3): 75–83. Bibcode:1986 ФИД ... 23 ... 75O. Дои:10.1016/0167-2789(86)90113-2.
  7. ^ Т. Шрайбер; А. Шмитц (1996). «Улучшенные суррогатные данные для тестов на нелинейность». Phys. Rev. Lett. 77 (4): 635–638. arXiv:chao-dyn / 9909041. Bibcode:1996ПхРвЛ..77..635С. Дои:10.1103 / PhysRevLett.77.635. PMID  10062864.
  8. ^ Т. Шрайбер; А. Шмитц (2000). «Суррогатный временной ряд». Physica D. 142 (3–4): 346–382. Bibcode:2000PhyD..142..346S. Дои:10.1016 / S0167-2789 (00) 00043-9.
  9. ^ Т. Шрайбер (1998). «Ограниченная рандомизация данных временных рядов». Phys. Rev. Lett. 80 (4): 2105–2108. arXiv:chao-dyn / 9909042. Bibcode:1998ПхРвЛ..80.2105С. Дои:10.1103 / PhysRevLett.80.2105.
  10. ^ Р. Энгберт (2002). «Тестирование на нелинейность: роль суррогатных данных». Хаос, солитоны и фракталы. 13 (1): 79–84. Bibcode:2002CSF .... 13 ... 79E. Дои:10.1016 / S0960-0779 (00) 00236-8.
  11. ^ М. Брейкспир; М. Браммер; П.А. Робинсон (2003). «Построение многомерных суррогатных наборов из нелинейных данных с использованием вейвлет-преобразования». Physica D. 182 (1): 1–22. Bibcode:2003PhyD..182 .... 1B. Дои:10.1016 / S0167-2789 (03) 00136-2.
  12. ^ Си Джей Кейлок (2006). «Ограниченный суррогатный временной ряд с сохранением структуры среднего и дисперсии». Phys. Ред. E. 73 (3): 036707. Bibcode:2006PhRvE..73c6707K. Дои:10.1103 / PhysRevE.73.036707.
  13. ^ Си Джей Кейлок (2007). «Вейвлет-метод генерации суррогатных данных». Physica D. 225 (2): 219–228. Bibcode:2007PhyD..225..219K. Дои:10.1016 / j.physd.2006.10.012.
  14. ^ Т. Накамура; М. Смолл (2005). «Небольшие суррогатные данные: проверка динамики колеблющихся данных с помощью тенденций». Phys. Ред. E. 72 (5): 056216. Дои:10.1103 / PhysRevE.72.056216. HDL:10397/4826.
  15. ^ Т. Накамура; М. Маленький; Ю. Хирата (2006). «Тестирование нелинейности в нерегулярных колебаниях с долгосрочными тенденциями». Phys. Ред. E. 74 (2): 026205. Bibcode:2006PhRvE..74b6205N. Дои:10.1103 / PhysRevE.74.026205. HDL:10397/7633.
  16. ^ J.H. Лючио; Р. Вальдес; L.R. Родригес (2012). «Усовершенствования методов суррогатных данных для нестационарных временных рядов». Phys. Ред. E. 85 (5): 056202. Bibcode:2012PhRvE..85e6202L. Дои:10.1103 / PhysRevE.85.056202. PMID  23004838.