Знаковый ранговый тест Вилкоксона - Wilcoxon signed-rank test

В Знаковый ранговый тест Вилкоксона это непараметрический проверка статистической гипотезы используется для сравнения двух связанных выборок, совпадающих выборок или повторных измерений на одной выборке, чтобы оценить, различаются ли их средние ранги генеральной совокупности (т.е. тест парных различий ). Его можно использовать как альтернативу парный студенческий т-тест (также известный как "т-тест для совпадающих пар "или"т-тест для зависимых выборок »), когда нельзя считать, что распределение разницы между средними значениями двух выборок нормально распределенный.[1] Знаковый ранговый критерий Уилкоксона - это непараметрический тест, который можно использовать для определения того, были ли выбраны две зависимые выборки из популяций, имеющих одинаковое распределение.

История

Тест назван в честь Фрэнк Уилкоксон (1892–1965), который в единственной статье предложил и его, и оценочная сумма для двух независимых выборок (Wilcoxon, 1945).[2] Популяризировал тест Сидни Сигел (1956) в его влиятельном учебнике по непараметрической статистике.[3] Сигель использовал символ Т для значения, связанного с, но не совпадающего с . Как следствие, тест иногда называют Wilcoxon Т тест, а статистика теста отображается как значение Т.

Предположения

  1. Данные парные и относятся к одной и той же совокупности.
  2. Каждая пара выбирается случайно и независимо[нужна цитата ].
  3. Данные измерены как минимум на шкала интервалов когда, как обычно, внутри пары различия рассчитываются для выполнения теста (хотя достаточно, чтобы сравнения внутри пары проводились порядковая шкала ).

Тестовая процедура

Позволять быть размером выборки, т. е. количеством пар. Таким образом, всего 2N точки данных. Для пар , позволять и обозначить измерения.

ЧАС0: разница между парами следует за симметричное распределение около нуля
ЧАС1: разница между парами не подчиняется симметричному распределению около нуля.
  1. За рассчитать и , куда это функция знака.
  2. Исключить пары с . Позволять быть уменьшенным размером выборки.
  3. Закажите оставшиеся пары от наименьшей абсолютной разницы до наибольшей абсолютной разницы, .
  4. Классифицировать пары, начиная с пары с наименьшей ненулевой абсолютной разницей, равной единице. Связи получают ранг, равный среднему значению рангов, которые они охватывают. Позволять обозначают ранг.
  5. Рассчитайте статистика теста
    , сумма подписанных рангов.
  6. При нулевой гипотезе следует определенному распределению без простого выражения. Этот дистрибутив имеет ожидаемое значение 0 и отклонение из .
    можно сравнить с критическим значением из справочной таблицы.[4]
    Двусторонняя проверка заключается в отклонении если .
  7. В качестве увеличивается, выборочное распределение сходится к нормальному распределению. Таким образом,
    За , а z-оценка можно рассчитать как , куда .
    Чтобы выполнить двусторонний тест, отклоните если .
    В качестве альтернативы можно выполнить односторонние тесты с точным или приблизительным распределением. p-значения также можно рассчитать.
  8. За необходимо использовать точное распределение.

Пример

1125110115
2115122 –17
313012515
4140120120
5140140 0
6115124 –19
7140123117
8125137 –112
914013515
10135145 –110
заказ по абсолютной разнице
5140140 0  
3130125151.51.5
9140135151.51.5
2115122 –173 –3
6115124 –194 –4
10135145 –1105 –5
8125137 –1126 –6
112511011577
714012311788
414012012099

это функция знака, это абсолютная величина, и это классифицировать. Обратите внимание, что пары 3 и 9 связаны по абсолютной величине. Они будут иметь ранги 1 и 2, поэтому каждый получит среднее значение 1,5.

[5]
что две медианы одинаковы.
В -значение этого результата

Исторический Т статистика

В исторических источниках другая статистика, обозначенная Сигелем как Т статистика. В Т статистика - это меньшая из двух сумм рангов данного знака; в этом примере, следовательно, Т будет равно 3 + 4 + 5 + 6 = 18. Низкие значения Т необходимы для значимости. Т легче рассчитать вручную, чем W и этот тест эквивалентен двухстороннему тесту, описанному выше; однако распределение статистики при необходимо отрегулировать.

что две медианы одинаковы.

Примечание: критическое Т значения () значениями можно найти в приложениях к учебникам по статистике, например, в Таблице B-3 Непараметрической статистики: пошаговый подход, 2-е издание Дейла И. Формана и Грегори В. Кордера (https://www.oreilly.com/library/view/nonparametric-statistics-a/9781118840429/bapp02.xhtml ).

В качестве альтернативы, если п достаточно велико, распределение Т под можно аппроксимировать нормальным распределением со средним и дисперсия .

Ограничение

Как показано в примере, когда разница между группами равна нулю, наблюдения отбрасываются. Это вызывает особую озабоченность, если образцы взяты из дискретного распределения. В этих сценариях модификация теста Вилкоксона, выполненная Праттом 1959, предоставляет альтернативу, которая включает нулевые разности.[6][7] Эта модификация более надежна для данных в порядковой шкале.[7]

Размер эффекта

Чтобы вычислить размер эффекта для знакового рангового теста можно использовать ранг-бисериальная корреляция.

Если тестовая статистика W сообщается, ранговая корреляция r равна тестовой статистике W деленное на общую сумму рангов S, или жер = W/S.[8] Используя приведенный выше пример, статистика теста W = 9. Размер выборки 9 имеет общую сумму рангов S = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) = 45. Следовательно, ранговая корреляция составляет 9/45, поэтому р = 0.20.

Если тестовая статистика Т Сообщается, что эквивалентный способ вычисления ранговой корреляции заключается в разнице в пропорции между двумя суммами рангов, которая представляет собой формулу простой разности Керби (2014).[8] Чтобы продолжить текущий пример, размер выборки равен 9, поэтому общая сумма рангов равна 45. Т - меньшая из двух ранговых сумм, поэтому Т равно 3 + 4 + 5 + 6 = 18. Только на основе этой информации можно вычислить оставшуюся сумму рангов, потому что это общая сумма S минус Т, или в данном случае 45–18 = 27. Затем две пропорции суммы рангов: 27/45 = 60% и 18/45 = 40%. Наконец, ранговая корреляция - это разница между двумя пропорциями (0,60 минус 0,40), следовательно, р = .20.

Программные реализации

  • р включает реализацию теста как wilcox.test (x, y, пара = ИСТИНА), где x и y - векторы одинаковой длины.[9]
  • АЛГЛИБ включает реализацию знакового рангового теста Уилкоксона в C ++, C #, Delphi, Visual Basic и т. д.
  • GNU Octave реализует различные односторонние и двусторонние версии теста в Wilcoxon_test функция.
  • SciPy включает в себя реализацию знакового рангового теста Уилкоксона в Python
  • Accord.NET включает реализацию знакового рангового теста Вилкоксона на C # для приложений .NET.
  • MATLAB реализует этот тест, используя «тест суммы рангов Вилкоксона», поскольку [p, h] = signrank (x, y) также возвращает логическое значение, указывающее решение теста. Результат h = 1 указывает на отклонение нулевой гипотезы, а h = 0 указывает на неспособность отклонить нулевую гипотезу на уровне значимости 5%.
  • Юля Пакет HypothesisTests включает критерий ранжирования со знаком Вилкоксона как «значение (SignedRankTest (x, y))»

Смотрите также

Рекомендации

  1. ^ «Парный t – тест - Справочник по биологической статистике». www.biostathandbook.com. Получено 2019-11-18.
  2. ^ Вилкоксон, Франк (декабрь 1945 г.). «Индивидуальные сравнения методами ранжирования» (PDF). Бюллетень по биометрии. 1 (6): 80–83. Дои:10.2307/3001968. HDL:10338.dmlcz / 135688. JSTOR  3001968.
  3. ^ Сигел, Сидней (1956). Непараметрическая статистика для поведенческих наук. Нью-Йорк: Макгроу-Хилл. С. 75–83. ISBN  9780070573482.
  4. ^ Лоури, Ричард. "Концепции и приложения выводимой статистики". Получено 5 ноября 2018.
  5. ^ «Таблица подписанных рангов Вилкоксона | Реальная статистика с использованием Excel». Получено 2020-08-10.
  6. ^ Пратт, Дж (1959). «Замечания о нулях и связях в процедурах ранжирования со знаком Уилкоксона». Журнал Американской статистической ассоциации. 54 (287): 655–667. Дои:10.1080/01621459.1959.10501526.
  7. ^ а б Деррик, B; Белый, П (2017). «Сравнение двух образцов из индивидуального вопроса Лайкерта». Международный журнал математики и статистики. 18 (3): 1–13.
  8. ^ а б Керби, Дэйв С. (2014), «Формула простой разности: подход к обучению непараметрической корреляции», Комплексная психология, 3: 11.IT.3.1, Дои:10.2466 / 11.IT.3.1
  9. ^ Далгаард, Питер (2008). Вводная статистика с R. Springer Science & Business Media. С. 99–100. ISBN  978-0-387-79053-4.

внешняя ссылка