Среднее абсолютное отклонение - Average absolute deviation

В среднее абсолютное отклонение, или же среднее абсолютное отклонение (СУМАСШЕДШИЙ) набора данных является средний из абсолютный отклонения от центральной точки. Это сводная статистика из статистическая дисперсия или изменчивость. В общем виде центральной точкой может быть иметь в виду, медиана, Режим, или результат любой другой меры основная тенденция или любая случайная точка данных, относящаяся к данному набору данных. Абсолютные значения различий между точками данных и их центральная тенденция суммируются и делятся на количество точек данных.

Меры рассеивания

Несколько мер статистическая дисперсия определяются в терминах абсолютного отклонения. Термин "среднее абсолютное отклонение" не определяет однозначно меру статистическая дисперсия, поскольку есть несколько показателей, которые можно использовать для измерения абсолютных отклонений, и есть несколько показателей основная тенденция это тоже можно использовать. Таким образом, для однозначной идентификации абсолютного отклонения необходимо указать как меру отклонения, так и меру центральной тенденции. К сожалению, в статистической литературе еще не приняты стандартные обозначения, так как оба среднее абсолютное отклонение от среднего и среднее абсолютное отклонение от медианы в литературе обозначаются инициалами "MAD", что может привести к путанице, поскольку в целом они могут иметь значения, значительно отличающиеся друг от друга.

Среднее абсолютное отклонение от центральной точки

Среднее абсолютное отклонение набора {Икс1, Икс2, ..., Иксп} является

Выбор меры центральной тенденции, , оказывает заметное влияние на величину среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:

Мера центральной тенденции Среднее абсолютное отклонение
Среднее = 5
Медиана = 3
Режим = 2

Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.

Среднее абсолютное отклонение от среднего меньше или равно стандартное отклонение; один из способов доказать это полагается на Неравенство Дженсена.

Для нормальное распределение, отношение среднего абсолютного отклонения к стандартному отклонению равно . Таким образом, если Икс является нормально распределенной случайной величиной с ожидаемым значением 0, тогда см. Geary (1935):[1]

Другими словами, для нормального распределения среднее абсолютное отклонение примерно в 0,8 раза превышает стандартное отклонение. Однако измерения в выборке дают значения отношения среднего среднего отклонения / стандартного отклонения для данной гауссовой выборки. п со следующими оценками: , с уклоном на малые п.[2]

Среднее абсолютное отклонение от среднего

В среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», представляет собой среднее значение абсолютных отклонений данных от среднего значения данных: среднее (абсолютное) расстояние от среднего. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме по отношению к указанной центральной точке (см. Выше).

MAD было предложено использовать вместо стандартное отклонение так как это лучше соответствует реальной жизни.[3] Поскольку MAD - более простой способ измерения изменчивости, чем стандартное отклонение, это может быть полезно в школьном обучении.[4][5]

Точность прогноза этого метода очень тесно связана с среднеквадратичная ошибка (MSE), который представляет собой среднеквадратичную ошибку прогнозов. Хотя эти методы очень тесно связаны, MAD чаще используется, потому что их легче вычислить (избегая необходимости возведения в квадрат).[6] и легче понять.[7]

Среднее абсолютное отклонение от медианы

Среднее абсолютное отклонение от медианы (медиана MAD) предлагает прямую меру масштаба случайной переменной вокруг ее медианы.

Это максимальная вероятность оценщик масштабного параметра из Распределение Лапласа. Для нормального распределения имеем . Поскольку медиана минимизирует среднее абсолютное расстояние, мы имеем . Используя общую дисперсионную функцию, Хабиб (2011) определил MAD относительно медианы как

где индикаторная функция

Это представление позволяет получить медианные коэффициенты корреляции MAD.[нужна цитата ]

Среднее абсолютное отклонение вокруг центральной точки

Среднее абсолютное отклонение от среднего

В принципе, среднее значение может быть принято в качестве центральной точки для медианного абсолютного отклонения, но чаще вместо этого берется медианное значение.

Среднее абсолютное отклонение от медианы

В среднее абсолютное отклонение (также MAD) - это медиана абсолютного отклонения от медиана. Это робастная оценка дисперсии.

В примере {2, 2, 3, 4, 14}: 3 - это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1 , 11}) со средним значением 1, в данном случае на него не влияет значение выброса 14, поэтому среднее абсолютное отклонение (также называемое MAD) равно 1.

Максимальное абсолютное отклонение

В максимальное абсолютное отклонение вокруг произвольной точки - это максимум абсолютных отклонений образца от этой точки. Хотя это не является строго мерой центральной тенденции, максимальное абсолютное отклонение можно найти, используя формулу для среднего абсолютного отклонения, как указано выше, с , куда это максимум выборки.

Минимизация

Меры статистической дисперсии, полученные из абсолютного отклонения, характеризуют различные меры центральной тенденции как сведение к минимуму дисперсия: медиана - это мера центральной тенденции, наиболее связанной с абсолютным отклонением. Некоторые параметры локации можно сравнить следующим образом:

  • L2 норма статистика: среднее минимизирует среднеквадратичная ошибка
  • L1 норма статистика: медиана минимизирует средний абсолютное отклонение,
  • L норма статистика: средний диапазон сводит к минимуму максимум абсолютное отклонение
  • обрезанный L норма статистика: например, середина (среднее значение первого и третьего квартили ), что минимизирует медиана абсолютное отклонение всего распределения, также минимизирует максимум абсолютное отклонение распределения после отсечения верхних и нижних 25%.

Оценка

График 01.jpg

Среднее абсолютное отклонение выборки составляет предвзятый оценщик среднего абсолютного отклонения совокупности. Для того чтобы абсолютное отклонение было несмещенной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно равняться абсолютному отклонению совокупности. Однако это не так. Для населения 1,2,3 и абсолютное отклонение совокупности относительно медианы, и абсолютное отклонение совокупности относительно среднего значения составляют 2/3. Среднее значение всех абсолютных отклонений выборки относительно среднего размера 3, которое можно извлечь из генеральной совокупности, составляет 44/81, в то время как среднее всех абсолютных отклонений выборки относительно медианы составляет 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.

Однако этот аргумент основан на понятии беспристрастности к среднему. Каждый показатель местоположения имеет свою собственную форму беспристрастности (см. предвзятый оценщик ). Соответствующая форма беспристрастности здесь - медианная непредвзятость.

График 02.jpg

Смотрите также

Рекомендации

  1. ^ Гири, Р. К. (1935). Отношение среднего отклонения к стандартному отклонению как критерий нормальности. Биометрика, 27 (3/4), 310–332.
  2. ^ См. Также статьи Гири за 1936 и 1946 гг .: Гири, Р. К. (1936). Моменты отношения среднего отклонения к стандартному отклонению для нормальных образцов. Biometrika, 28 (3/4), 295–307 и Гири, Р. К. (1947). Проверка на нормальность. Биометрика, 34 (3/4), 209–242.
  3. ^ «Архивная копия». Архивировано 16 января 2014 года.. Получено 2014-01-16.CS1 maint: заархивированная копия как заголовок (связь) CS1 maint: BOT: статус исходного URL-адреса неизвестен (связь)
  4. ^ Кадер, Гэри (март 1999). «Средства и БЕЗОПАСНОСТЬ». Преподавание математики в средней школе. 4 (6): 398–403. В архиве из оригинала 18.05.2013. Получено 20 февраля 2013.
  5. ^ Франклин, Кристин, Гэри Кадер, Дениз Мьюборн, Джерри Морено, Рокси Пек, Майк Перри и Ричард Шеффер (2007). Руководство по оценке и обучению статистическому образованию (PDF). Американская статистическая ассоциация. ISBN  978-0-9791747-1-1. В архиве (PDF) из оригинала от 07.03.2013. Получено 2013-02-20.
  6. ^ Нахмиас, Стивен; Olsen, Тава Леннон (2015), Анализ производства и операций (7-е изд.), Waveland Press, p. 62, ISBN  9781478628248, MAD часто является предпочтительным методом измерения ошибки прогноза, потому что он не требует возведения в квадрат.
  7. ^ Штадтлер, Хартмут; Килгер, Кристоф; Мейр, Герберт, ред. (2014), Управление цепочкой поставок и расширенное планирование: концепции, модели, программное обеспечение и примеры из практики, Springer Texts in Business and Economics (5-е изд.), Springer, p. 143, ISBN  9783642553097, значение MAD легче интерпретировать.

внешняя ссылка