Точная статистика - Exact statistics

Точная статистика, например, описанный в точный тест, является ветвью статистика который был разработан для получения более точных результатов, касающихся статистическое тестирование и интервальная оценка устраняя процедуры, основанные на асимптотический и приближенные статистические методы. Основная характеристика точных методов состоит в том, что статистические тесты и доверительные интервалы основаны на точных утверждениях вероятности, которые действительны для любых размер образца. Точные статистические методы помогают избежать некоторых необоснованных предположений традиционных статистических методов, таких как предположение о равных дисперсиях в классических статистических методах. ANOVA. Они также позволяют сделать точный вывод о компоненты дисперсии из смешанные модели.

Когда точно п-значения и доверительные интервалы вычисляются при определенном распределении, таком как нормальное распределение, тогда лежащие в основе методы называются точными параметрическими методами. Точные методы, которые не делают никаких предположений о распределении, называются точными непараметрическими методами. Последнее имеет то преимущество, что делает меньше предположений, тогда как первые, как правило, дают более мощные тесты, когда предположение о распределении является разумным. Для продвинутых методов, таких как дисперсионный анализ ANOVA. регрессивный анализ, и смешанные модели доступны только точные параметрические методы.

Когда размер выборки невелик, асимптотические результаты, полученные с помощью некоторых традиционных методов, могут быть недействительными. В таких ситуациях асимптотика п-значения могут существенно отличаться от точных п-значения. Следовательно, асимптотические и другие приближенные результаты могут привести к ненадежным и вводящим в заблуждение выводам.

Подход

Все классические статистические процедуры построены с использованием статистики, которая зависит только от наблюдаемых случайных векторов, тогда как обобщенные оценки, тесты и доверительные интервалы, используемые в точной статистике, используют преимущества наблюдаемых случайных векторов и наблюдаемых значений, как в байесовский подход но без необходимости рассматривать постоянные параметры как случайные величины. Например, в выборке из нормальной совокупности со средним и дисперсия , предполагать и - выборочное среднее и выборочная дисперсия. Затем, определяя Z и U таким образом:

и это

.

Теперь предположим, что интересующий параметр - это коэффициент вариации, . Затем мы можем легко выполнить точные тесты и точные доверительные интервалы для на основе обобщенной статистики

,

куда наблюдаемое значение и наблюдаемое значение . Точные выводы о на основе вероятностей и ожидаемых значений возможны, потому что и его распределение, и наблюдаемое значение не содержат мешающих параметров.

Обобщенный п-значения

Классические статистические методы не обеспечивают точных тестов для многих статистических задач, таких как тестирование компонентов дисперсии и ANOVA при неравных дисперсиях. Чтобы исправить эту ситуацию, обобщенный п-значения определяются как расширение классической п-значения, чтобы можно было выполнять тесты на основе точных утверждений вероятности, действительных для любого размера выборки.

Смотрите также

Рекомендации

внешняя ссылка

  • LogXact, StatXact, Коммерческие программные пакеты для точной параметрической статистики
  • XPro, Бесплатное программное обеспечение для точной параметрической статистики.