Блокировка (статистика) - Blocking (statistics)

в статистический теория дизайн экспериментов, блокировка это организация экспериментальные единицы в группах (блоках), похожих друг на друга.

Использовать

Блокировка снижает необъяснимую изменчивость. Его принцип заключается в том, что непреодолимая изменчивость (например, необходимость двух партий сырья для производства 1 контейнера химического вещества) сбит с толку или с псевдонимом взаимодействия (n) (высшего / высшего порядка), чтобы исключить его влияние на конечный продукт. Высокого порядка взаимодействия обычно имеют наименьшее значение (подумайте о том факте, что температура реактора или партии сырья более важна, чем их комбинация - это особенно верно, когда присутствует больше (3, 4, ...) факторов ); таким образом, предпочтительно смешать эту изменчивость с более высоким взаимодействием.

Примеры

  • Мужской и женский: Эксперимент предназначен для тестирования нового препарата на пациентах. Есть два уровня лечения, препарат, средство, медикамент, и плацебо, под управлением мужской и женский пациенты в двойной слепой испытание. Пол пациента блокировка фактор, учитывающий вариабельность лечения между самцы и самки. Это уменьшает источники изменчивости и, следовательно, приводит к большей точности.
  • Высота: Эксперимент предназначен для проверки воздействия нового пестицида на конкретный участок травы. Зона травы имеет большое изменение высоты и, таким образом, состоит из двух отдельных областей - «высокая высота» и «низкая высота». Группу обработки (новый пестицид) и группу плацебо применяют как для высоких, так и для низких участков травы. В этом случае исследователь блокирует фактор повышения, который может объяснять вариабельность применения пестицида.
  • Вмешательство: Предположим, изобретен процесс, который продлевает срок службы подошвы обуви, и составлен план проведения полевых испытаний. Учитывая группу п добровольцев, одним из возможных вариантов было бы дать п / 2 из них туфли с новой подошвой и п / 2 из них туфли на обычной подошве, рандомизация назначение двух видов подошв. Этот тип эксперимента полностью рандомизированный дизайн. Затем обе группы просят надеть обувь в течение определенного периода времени, а затем измеряют степень износа подошвы. Это работоспособный экспериментальный план, но чисто с точки зрения статистической точности (игнорируя любые другие факторы), лучшим вариантом было бы дать каждому человеку одну обычную подошву и одну новую подошву, случайным образом назначив два типа слева и правый ботинок каждого добровольца. Такой дизайн называется «рандомизированный полный блочная конструкция. "Этот дизайн будет более чувствительным, чем первый, потому что каждый человек действует как его / ее собственный контроль и, следовательно, контрольная группа более точно соответствует группа лечения.

Рандомизированный блочный дизайн

в статистический теория дизайн экспериментов, блокировка - это размещение экспериментальные единицы в группах (блоках), похожих друг на друга. Обычно блокирующий фактор является источником изменчивость это не представляет особого интереса для экспериментатора. Примером блокирующего фактора может быть пол пациента; блокируя пол, этот источник изменчивости контролируется, что приводит к большей точности.

В теории вероятностей метод блоков состоит из разбиения выборки на блоки (группы), разделенные более мелкими подблоками, так что блоки можно считать почти независимыми. Метод блоков помогает доказывать предельные теоремы в случае зависимых случайных величин.

Метод блоков был введен С. Бернштейн:

Бернштейн С.Н. (1926) Sur l'extension du théorème limit du исчисление вероятностей aux sommes de Quantités dependantes. Математика. Аннален, т. 97, 1-59.

Метод был успешно применен в теории сумм зависимых случайных величин и в теории экстремальных значений:

Ибрагимов И.А. и Линник Ю.В. (1971) Независимые и стационарные последовательности случайных величин. Вольтерс-Нордхофф, Гронинген.

Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1983) Крайности и связанные свойства случайных последовательностей и процессов. Нью-Йорк: Springer Verlag.

Новак С.Ю. (2011) Экстремальные методы ценности с приложениями к финансам. Chapman & Hall / CRC Press, Лондон.

Блокировка, используемая для мешающих факторов, которые можно контролировать

Когда мы можем контролировать мешающие факторы, можно использовать важный метод, известный как блокирование, для уменьшения или устранения вклада в экспериментальную ошибку, вносимого мешающими факторами. Основная концепция заключается в создании однородных блоков, в которых факторы помех остаются постоянными, а интересующий фактор может изменяться. Внутри блоков можно оценить влияние различных уровней интересующего фактора, не беспокоясь о вариациях из-за изменений факторов блока, которые учитываются в анализе.

Определение блокирующих факторов

Фактор неприятности используется в качестве фактора блокировки, если каждый уровень основного фактора встречается одинаковое количество раз с каждым уровнем фактора помехи. Анализ эксперимента будет сосредоточен на влиянии различных уровней основного фактора в каждом блоке эксперимента.

Заблокируйте несколько наиболее важных неприятных факторов

Общее правило:

«Заблокируйте то, что можете; рандомизируйте то, что вы не можете ».

Блокирование используется для устранения влияния некоторых наиболее важных мешающих переменных. Затем используется рандомизация для уменьшения негативного воздействия оставшихся мешающих переменных. Для важных мешающих переменных блокирование даст более высокую значимость интересующих переменных, чем рандомизация.

Стол

Один из полезных способов взглянуть на эксперимент с рандомизированными блоками - это рассматривать его как набор полностью рандомизированный экспериментов, каждый из которых запускается в рамках одного из блоков общего эксперимента.

Рандомизированные блочные конструкции (RBD)
Название дизайнаКоличество факторов kКоличество прогонов п
2-факторный RBD2L1 * L2
3-факторный RBD3L1 * L2 * L3
4-факторный RBD4L1 * L2 * L3 * L4
k-фактор RBDkL1 * L2 * * Lk

с

L1 = количество уровней (настроек) фактора 1
L2 = количество уровней (настроек) фактора 2
L3 = количество уровней (настроек) фактора 3
L4 = количество уровней (настроек) фактора 4
Lk = количество уровней (настроек) фактора k

Пример

Предположим, инженеры на предприятии по производству полупроводников хотят проверить, оказывают ли различные дозировки материала имплантата пластины существенное влияние на измерения удельного сопротивления после процесса диффузии, происходящего в печи. У них есть четыре разных дозировки, которые они хотят попробовать, и достаточно экспериментальных пластин из одной партии, чтобы запустить три пластины при каждой дозировке.

Фактором неудобства, с которым они сталкиваются, является «ход печи», поскольку известно, что каждый прогон печи отличается от предыдущего и влияет на многие параметры процесса.

Идеальный способ провести этот эксперимент - запустить все пластины 4x3 = 12 в одной печи. Это полностью устранило бы мешающий фактор печи. Тем не менее, обычные производственные пластины имеют приоритет в печи, и только несколько экспериментальных пластин допускаются в любую печь одновременно.

Неблокирующий способ запустить этот эксперимент - запустить каждую из двенадцати экспериментальных пластин в случайном порядке, по одной на прогон печи. Это увеличило бы экспериментальную ошибку каждого измерения удельного сопротивления из-за вариабельности работы печи и затруднило бы изучение эффектов различных дозировок. Заблокированный способ проведения этого эксперимента, предполагающий, что вы можете убедить производство позволить вам поместить четыре экспериментальных пластины в печь, будет помещать четыре пластины с разными дозировками в каждую из трех прогонов печи. Единственная случайная выборка будет заключаться в выборе того, какая из трех пластин с дозировкой 1 попадет в печь 1, и аналогично для пластин с дозировкой 2, 3 и 4.

Описание эксперимента

Позволять Икс1 быть "уровень" дозировки и Икс2 быть фактором блокировки работы печи. Тогда эксперимент можно описать следующим образом:

k = 2 фактора (1 первичный фактор Икс1 и 1 коэффициент блокировки Икс2)
L1 = 4 уровня фактора Икс1
L2 = 3 уровня фактора Икс2
п = 1 репликация на ячейку
N = L1 * L2 = 4 * 3 = 12 ходов

Перед рандомизацией испытания дизайна выглядят так:

Икс1Икс2
11
12
13
21
22
23
31
32
33
41
42
43

Матричное представление

Альтернативным способом обобщения испытаний дизайна было бы использование матрицы 4x3, 4 строки которой - уровни обработки. Икс1 и чьи столбцы представляют собой 3 уровня блокирующей переменной Икс2. Ячейки в матрице имеют индексы, соответствующие Икс1, Икс2 комбинации выше.

УходБлок 1Блок 2Блок 3
1111
2111
3111
4111

В более широком смысле, обратите внимание, что испытания для любого проекта рандомизированного блока с K-фактором - это просто индексы ячеек k размерная матрица.

Модель

Модель для рандомизированного блочного дизайна с одной мешающей переменной:

куда

Yij любое наблюдение, для которого Икс1 = я и Икс2 = j
Икс1 это главный фактор
Икс2 это фактор блокировки
μ - общий параметр местоположения (т. е. среднее)
Тя эффект от лечения я (фактора Икс1)
Bj эффект от нахождения в блоке j (фактора Икс2)

Оценки

Оценка для μ: = среднее значение всех данных
Оценка для Тя : с = среднее из всех Y для которого Икс1 = я.
Оценка для Bj : с = среднее из всех Y для которого Икс2 = j.

Обобщения

Теоретические основы

Теоретической основой блокировки является следующий математический результат. Учитывая случайные величины, Икс и Y

Таким образом, разнице между обработкой и контролем может быть придана минимальная дисперсия (т.е. максимальная точность) за счет максимизации ковариации (или корреляции) между Икс и Y.

Смотрите также

Рекомендации

Библиография