Крамерс V - Cramérs V

В статистика, Крамера V (иногда называют Фи Крамера и обозначается как φc) является мерой ассоциация между двумя номинальные переменные, что дает значение от 0 до +1 (включительно). Он основан на Статистика хи-квадрат Пирсона и был опубликован Харальд Крамер в 1946 г.[1]

Использование и интерпретация

φc является взаимной корреляцией двух дискретных переменных[2] и может использоваться с переменными, имеющими два или более уровней. φc является симметричной мерой, не имеет значения, какую переменную мы помещаем в столбцы, а какие в строки. Кроме того, порядок строк / столбцов не имеет значения, поэтому φc может использоваться с номинальными типами данных или выше (особенно упорядоченными или числовыми).

V Крамера также может применяться к степень соответствия модели хи-квадрат, когда есть 1 × k стол (в данном случае р = 1). В этом случае k принимается как количество необязательных результатов и служит мерой тенденции к единственному результату.[нужна цитата ]

Крамеровский V изменяется от 0 (соответствует нет ассоциации между переменными) до 1 (полная ассоциация) и может достигать 1 только тогда, когда каждая переменная полностью определяется другой.

φc2 это средний квадрат каноническая корреляция между переменными.[нужна цитата ]

В случае 2 × 2 Таблица сопряженности V Крамера равно Коэффициент Phi.

Обратите внимание, что, поскольку значения хи-квадрат имеют тенденцию увеличиваться с увеличением количества ячеек, тем больше разница между р (строки) и c (столбцы), более вероятно, что φc будет стремиться к 1 без убедительных доказательств значимой корреляции.[нужна цитата ]

V можно рассматривать как связь между двумя переменными в процентах от их максимально возможного изменения. V2 это средний квадрат каноническая корреляция между переменными.[нужна цитата ]

Расчет

Пусть образец размером п одновременно распределенных переменных и за задаваться частотами

количество раз значения наблюдались.

Тогда статистика хи-квадрат будет:

V Крамера вычисляется путем деления квадратного корня из статистики хи-квадрат на размер выборки и минимальное измерение минус 1:

 

куда:

  • - коэффициент фи.
  • выводится из критерия хи-квадрат Пирсона
  • это общая сумма наблюдений и
  • количество столбцов.
  • количество строк.

В p-значение для значимость из V тот же самый, который рассчитывается с использованием Критерий хи-квадрат Пирсона.[нужна цитата ]

Формула дисперсии V= φc известен.[3]

В R функция cramerV () из пакета спутник[4] вычисляет V с помощью функции chisq.test из пакета stats. В отличие от функции cramersV () от ЛСР[5] упаковка, cramerV () также предлагает возможность исправить систематическую ошибку. Применяется исправление, описанное в следующем разделе.

Коррекция смещения

V Крамера может быть сильно предвзятой оценкой своего аналога по населению и, как правило, переоценивает силу ассоциации. Поправка смещения, используя приведенные выше обозначения, дается выражением[6]

 

куда

 

и

 
 

потом оценивает ту же численность населения, что и V Крамера, но обычно с гораздо меньшими среднеквадратичная ошибка. Причина исправления заключается в том, что в условиях независимости.[7]

Смотрите также

Другие меры корреляции для номинальных данных:

Другие статьи по теме:

Рекомендации

  1. ^ Крамер, Харальд. 1946 г. Математические методы статистики. Princeton: Princeton University Press, стр. 282 (Глава 21. Двумерный случай). ISBN  0-691-08004-6 (таблица содержания В архиве 2016-08-16 в Wayback Machine )
  2. ^ Шескин, Дэвид Дж. (1997). Справочник по параметрическим и непараметрическим статистическим процедурам. Бока-Ратон, Флорида: CRC Press.
  3. ^ Либетрау, Альберт М. (1983). Меры ассоциации. Ньюбери-Парк, Калифорния: Sage Publications. Количественные применения в серии социальных наук № 32 (страницы 15–16)
  4. ^ «Rcompanion: функции для поддержки оценки программы дополнительного образования». 2019-01-03.
  5. ^ "Lsr: Companion to" Learning Statistics with R"". 2015-03-02.
  6. ^ Бергсма, Уичер (2013). "Коррекция смещения для V Крамера и T Чупрова". Журнал Корейского статистического общества. 42 (3): 323–328. Дои:10.1016 / j.jkss.2012.10.002.
  7. ^ Бартлетт, Морис С. (1937). «Свойства достаточности и статистических тестов». Труды Лондонского королевского общества. Серия А. 160 (901): 268–282. Дои:10.1098 / rspa.1937.0109. JSTOR  96803.

внешняя ссылка