Блокировка (статистика) - Blocking (statistics)
Эта статья включает в себя список общих Рекомендации, но он остается в основном непроверенным, потому что ему не хватает соответствующих встроенные цитаты.Январь 2018) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
в статистический теория дизайн экспериментов, блокировка это организация экспериментальные единицы в группах (блоках), похожих друг на друга.
Использовать
Блокировка снижает необъяснимую изменчивость. Его принцип заключается в том, что непреодолимая изменчивость (например, необходимость двух партий сырья для производства 1 контейнера химического вещества) сбит с толку или с псевдонимом взаимодействия (n) (высшего / высшего порядка), чтобы исключить его влияние на конечный продукт. Высокого порядка взаимодействия обычно имеют наименьшее значение (подумайте о том факте, что температура реактора или партии сырья более важна, чем их комбинация - это особенно верно, когда присутствует больше (3, 4, ...) факторов ); таким образом, предпочтительно смешать эту изменчивость с более высоким взаимодействием.
Примеры
- Мужской и женский: Эксперимент предназначен для тестирования нового препарата на пациентах. Есть два уровня лечения, препарат, средство, медикамент, и плацебо, под управлением мужской и женский пациенты в двойной слепой испытание. Пол пациента блокировка фактор, учитывающий вариабельность лечения между самцы и самки. Это уменьшает источники изменчивости и, следовательно, приводит к большей точности.
- Высота: Эксперимент предназначен для проверки воздействия нового пестицида на конкретный участок травы. Зона травы имеет большое изменение высоты и, таким образом, состоит из двух отдельных областей - «высокая высота» и «низкая высота». Группу обработки (новый пестицид) и группу плацебо применяют как для высоких, так и для низких участков травы. В этом случае исследователь блокирует фактор повышения, который может объяснять вариабельность применения пестицида.
- Вмешательство: Предположим, изобретен процесс, который продлевает срок службы подошвы обуви, и составлен план проведения полевых испытаний. Учитывая группу п добровольцев, одним из возможных вариантов было бы дать п / 2 из них туфли с новой подошвой и п / 2 из них туфли на обычной подошве, рандомизация назначение двух видов подошв. Этот тип эксперимента полностью рандомизированный дизайн. Затем обе группы просят надеть обувь в течение определенного периода времени, а затем измеряют степень износа подошвы. Это работоспособный экспериментальный план, но чисто с точки зрения статистической точности (игнорируя любые другие факторы), лучшим вариантом было бы дать каждому человеку одну обычную подошву и одну новую подошву, случайным образом назначив два типа слева и правый ботинок каждого добровольца. Такой дизайн называется «рандомизированный полный блочная конструкция. "Этот дизайн будет более чувствительным, чем первый, потому что каждый человек действует как его / ее собственный контроль и, следовательно, контрольная группа более точно соответствует группа лечения.
Рандомизированный блочный дизайн
в статистический теория дизайн экспериментов, блокировка - это размещение экспериментальные единицы в группах (блоках), похожих друг на друга. Обычно блокирующий фактор является источником изменчивость это не представляет особого интереса для экспериментатора. Примером блокирующего фактора может быть пол пациента; блокируя пол, этот источник изменчивости контролируется, что приводит к большей точности.
В теории вероятностей метод блоков состоит из разбиения выборки на блоки (группы), разделенные более мелкими подблоками, так что блоки можно считать почти независимыми. Метод блоков помогает доказывать предельные теоремы в случае зависимых случайных величин.
Метод блоков был введен С. Бернштейн:
Бернштейн С.Н. (1926) Sur l'extension du théorème limit du исчисление вероятностей aux sommes de Quantités dependantes. Математика. Аннален, т. 97, 1-59.
Метод был успешно применен в теории сумм зависимых случайных величин и в теории экстремальных значений:
Ибрагимов И.А. и Линник Ю.В. (1971) Независимые и стационарные последовательности случайных величин. Вольтерс-Нордхофф, Гронинген.
Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1983) Крайности и связанные свойства случайных последовательностей и процессов. Нью-Йорк: Springer Verlag.
Новак С.Ю. (2011) Экстремальные методы ценности с приложениями к финансам. Chapman & Hall / CRC Press, Лондон.
Блокировка, используемая для мешающих факторов, которые можно контролировать
Когда мы можем контролировать мешающие факторы, можно использовать важный метод, известный как блокирование, для уменьшения или устранения вклада в экспериментальную ошибку, вносимого мешающими факторами. Основная концепция заключается в создании однородных блоков, в которых факторы помех остаются постоянными, а интересующий фактор может изменяться. Внутри блоков можно оценить влияние различных уровней интересующего фактора, не беспокоясь о вариациях из-за изменений факторов блока, которые учитываются в анализе.
Определение блокирующих факторов
Фактор неприятности используется в качестве фактора блокировки, если каждый уровень основного фактора встречается одинаковое количество раз с каждым уровнем фактора помехи. Анализ эксперимента будет сосредоточен на влиянии различных уровней основного фактора в каждом блоке эксперимента.
Заблокируйте несколько наиболее важных неприятных факторов
Общее правило:
- «Заблокируйте то, что можете; рандомизируйте то, что вы не можете ».
Блокирование используется для устранения влияния некоторых наиболее важных мешающих переменных. Затем используется рандомизация для уменьшения негативного воздействия оставшихся мешающих переменных. Для важных мешающих переменных блокирование даст более высокую значимость интересующих переменных, чем рандомизация.
Стол
Один из полезных способов взглянуть на эксперимент с рандомизированными блоками - это рассматривать его как набор полностью рандомизированный экспериментов, каждый из которых запускается в рамках одного из блоков общего эксперимента.
Название дизайна | Количество факторов k | Количество прогонов п |
---|---|---|
2-факторный RBD | 2 | L1 * L2 |
3-факторный RBD | 3 | L1 * L2 * L3 |
4-факторный RBD | 4 | L1 * L2 * L3 * L4 |
k-фактор RBD | k | L1 * L2 * * Lk |
с
- L1 = количество уровней (настроек) фактора 1
- L2 = количество уровней (настроек) фактора 2
- L3 = количество уровней (настроек) фактора 3
- L4 = количество уровней (настроек) фактора 4
- Lk = количество уровней (настроек) фактора k
Пример
Предположим, инженеры на предприятии по производству полупроводников хотят проверить, оказывают ли различные дозировки материала имплантата пластины существенное влияние на измерения удельного сопротивления после процесса диффузии, происходящего в печи. У них есть четыре разных дозировки, которые они хотят попробовать, и достаточно экспериментальных пластин из одной партии, чтобы запустить три пластины при каждой дозировке.
Фактором неудобства, с которым они сталкиваются, является «ход печи», поскольку известно, что каждый прогон печи отличается от предыдущего и влияет на многие параметры процесса.
Идеальный способ провести этот эксперимент - запустить все пластины 4x3 = 12 в одной печи. Это полностью устранило бы мешающий фактор печи. Тем не менее, обычные производственные пластины имеют приоритет в печи, и только несколько экспериментальных пластин допускаются в любую печь одновременно.
Неблокирующий способ запустить этот эксперимент - запустить каждую из двенадцати экспериментальных пластин в случайном порядке, по одной на прогон печи. Это увеличило бы экспериментальную ошибку каждого измерения удельного сопротивления из-за вариабельности работы печи и затруднило бы изучение эффектов различных дозировок. Заблокированный способ проведения этого эксперимента, предполагающий, что вы можете убедить производство позволить вам поместить четыре экспериментальных пластины в печь, будет помещать четыре пластины с разными дозировками в каждую из трех прогонов печи. Единственная случайная выборка будет заключаться в выборе того, какая из трех пластин с дозировкой 1 попадет в печь 1, и аналогично для пластин с дозировкой 2, 3 и 4.
Описание эксперимента
Позволять Икс1 быть "уровень" дозировки и Икс2 быть фактором блокировки работы печи. Тогда эксперимент можно описать следующим образом:
- k = 2 фактора (1 первичный фактор Икс1 и 1 коэффициент блокировки Икс2)
- L1 = 4 уровня фактора Икс1
- L2 = 3 уровня фактора Икс2
- п = 1 репликация на ячейку
- N = L1 * L2 = 4 * 3 = 12 ходов
Перед рандомизацией испытания дизайна выглядят так:
Икс1 | Икс2 |
---|---|
1 | 1 |
1 | 2 |
1 | 3 |
2 | 1 |
2 | 2 |
2 | 3 |
3 | 1 |
3 | 2 |
3 | 3 |
4 | 1 |
4 | 2 |
4 | 3 |
Матричное представление
Альтернативным способом обобщения испытаний дизайна было бы использование матрицы 4x3, 4 строки которой - уровни обработки. Икс1 и чьи столбцы представляют собой 3 уровня блокирующей переменной Икс2. Ячейки в матрице имеют индексы, соответствующие Икс1, Икс2 комбинации выше.
Уход | Блок 1 | Блок 2 | Блок 3 |
---|---|---|---|
1 | 1 | 1 | 1 |
2 | 1 | 1 | 1 |
3 | 1 | 1 | 1 |
4 | 1 | 1 | 1 |
В более широком смысле, обратите внимание, что испытания для любого проекта рандомизированного блока с K-фактором - это просто индексы ячеек k размерная матрица.
Модель
Модель для рандомизированного блочного дизайна с одной мешающей переменной:
куда
- Yij любое наблюдение, для которого Икс1 = я и Икс2 = j
- Икс1 это главный фактор
- Икс2 это фактор блокировки
- μ - общий параметр местоположения (т. е. среднее)
- Тя эффект от лечения я (фактора Икс1)
- Bj эффект от нахождения в блоке j (фактора Икс2)
Оценки
- Оценка для μ: = среднее значение всех данных
- Оценка для Тя : с = среднее из всех Y для которого Икс1 = я.
- Оценка для Bj : с = среднее из всех Y для которого Икс2 = j.
Обобщения
- Обобщенные рандомизированные блочные конструкции (GRBD) позволяет проводить тесты взаимодействия блока и лечения и имеет ровно один блокирующий фактор, такой как RCBD.
- Латинские квадраты (и другие конструкции строка-столбец) имеют два блокирующих фактора, которые, как считается, не взаимодействуют друг с другом.
- Выборка латинского гиперкуба
- Греко-латинские квадраты
- Гипер-греко-латинский квадратный дизайн
Теоретические основы
Теоретической основой блокировки является следующий математический результат. Учитывая случайные величины, Икс и Y
Таким образом, разнице между обработкой и контролем может быть придана минимальная дисперсия (т.е. максимальная точность) за счет максимизации ковариации (или корреляции) между Икс и Y.
Смотрите также
- Алгебраическая статистика
- Блочный дизайн
- Комбинаторный дизайн
- Обобщенный рандомизированный блочный дизайн
- Глоссарий экспериментального дизайна
- Оптимальный дизайн
- Тест парных различий
- Рандомизированный блочный дизайн
- Зависимые и независимые переменные
Рекомендации
- Эта статья включаетматериалы общественного достояния от Национальный институт стандартов и технологий интернет сайт https://www.nist.gov.
Библиография
- Аддельман, С. (1969). «Обобщенный рандомизированный блочный дизайн». Американский статистик. 23 (4): 35–36. Дои:10.2307/2681737. JSTOR 2681737.
- Аддельман, С. (1970). «Вариативность методов и экспериментальных единиц в дизайне и анализе экспериментов». Журнал Американской статистической ассоциации. 65 (331): 1095–1108. Дои:10.2307/2284277. JSTOR 2284277.
- Анскомб, Ф.Дж. (1948). «Достоверность сравнительных экспериментов». Журнал Королевского статистического общества. Генерал). 111 (3): 181–211. Дои:10.2307/2984159. JSTOR 2984159. МИСТЕР 0030181.
- Бейли, Р. А (2008). Дизайн сравнительных экспериментов. Издательство Кембриджского университета. ISBN 978-0-521-68357-9. Архивировано из оригинал на 2018-03-22. Главы перед публикацией доступны в режиме онлайн.
- Бапат, Р. Б. (2000). Линейная алгебра и линейные модели (Второе изд.). Springer. ISBN 978-0-387-98871-9.
- Калински Т. и Кагеяма С. (2000). Блочные конструкции: подход рандомизации, том я: Анализ. Конспект лекций по статистике. 150. Нью-Йорк: Springer-Verlag. ISBN 0-387-98578-6.
- Калински Т. и Кагеяма С. (2003). Блочные конструкции: подход рандомизации, том II: Дизайн. Конспект лекций по статистике. 170. Нью-Йорк: Springer-Verlag. ISBN 0-387-95470-8. МИСТЕР 1994124.
- Гейтс, C.E. (ноябрь 1995 г.). «Что такое экспериментальная ошибка в конструкциях блоков?». Американский статистик. 49 (4): 362–363. Дои:10.2307/2684574. JSTOR 2684574.
- Кемпторн, Оскар (1979). Планирование и анализ экспериментов (Исправленная перепечатка (1952) изд. Wiley). Роберт Э. Кригер. ISBN 0-88275-105-0.
- Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов. I и II (Второе изд.). Вайли. ISBN 978-0-470-38551-7.CS1 maint: несколько имен: список авторов (связь)
- Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в план экспериментов (Второе изд.). Вайли. ISBN 978-0-471-72756-9.CS1 maint: несколько имен: список авторов (связь)
- Хинкельманн, Клаус и Кемпторн, Оскар (2005). Планирование и анализ экспериментов, Том 2: Расширенный экспериментальный план (Первое изд.). Вайли. ISBN 978-0-471-55177-5.CS1 maint: несколько имен: список авторов (связь)
- Лентнер, Марвин; Томас Бишоп (1993). «Обобщенный проект RCB (Глава 6.13)». Экспериментальный дизайн и анализ (Второе изд.). P.O. Box 884, Blacksburg, VA 24063: Valley Book Company. С. 225–226. ISBN 0-9616255-2-X.CS1 maint: location (связь)
- Рагхаварао, Дамараджу (1988). Конструкции и комбинаторные задачи планирования экспериментов. (исправленное переиздание изд. Wiley 1971 г.). Нью-Йорк: Дувр. ISBN 0-486-65685-3.
- Рагхаварао, Дамараджу и Пэджетт, Л. (2005). Блочные конструкции: анализ, комбинаторика и приложения. World Scientific. ISBN 981-256-360-1.CS1 maint: несколько имен: список авторов (связь)
- Шах, Кирти Р. и Синха, Бикас К. (1989). Теория оптимальных дизайнов. Конспект лекций по статистике. 54. Springer-Verlag. С. 171 + viii. ISBN 0-387-96991-8.
- Улица, Энн Пенфолд; Улица, Дебора Дж. (1987). Комбинаторика экспериментального дизайна. Оксфорд У. П. [Кларендон]. ISBN 0-19-853256-3.
- Вилк, М. Б. (1955). «Рандомизационный анализ обобщенного рандомизированного блочного дизайна». Биометрика. 42 (1–2): 70–79. Дои:10.2307/2333423. JSTOR 2333423.
- Зискинд, Джордж (1963). «Некоторые последствия рандомизации в обобщении сбалансированного неполного блочного дизайна». Анналы математической статистики. 34 (4): 1569–1581. Дои:10.1214 / aoms / 1177703889. JSTOR 2238364.