Z-фактор - Z-factor
В Z-фактор это мера статистический размер эффекта. Было предложено использовать в высокопроизводительный скрининг (где он также известен как Z-простое число,[1] и обычно пишется как Z ', чтобы судить, есть ли ответ в конкретном проба достаточно велик, чтобы заслужить дополнительное внимание.
Фон
На экранах с высокой пропускной способностью экспериментаторы часто сравнивают большое количество (от сотен тысяч до десятков миллионов) отдельных измерений неизвестных образцов с положительными и отрицательными. контроль образцы. Конкретный выбор условий эксперимента и измерений называется анализом. Большие экраны дороги по времени и ресурсам. Поэтому перед запуском большого экрана используются меньшие тестовые (или пилотные) скрины для оценки качества анализа в попытке предсказать, будет ли он полезен в условиях высокой пропускной способности. Z-фактор - это попытка количественно оценить пригодность конкретного анализа для использования в полномасштабном высокопроизводительном скрининге.
Определение
Z-фактор определяется четырьмя параметрами: средства () и Стандартное отклонение () как положительного (p), так и отрицательного (n) контролей (, , и , ). Учитывая эти значения, Z-фактор определяется как:
На практике Z-фактор оценивается из образец означает и стандартные отклонения выборки
Интерпретация
Следующие интерпретации Z-фактора взяты из:[2]
Z-фактор | Интерпретация |
---|---|
1.0 | Идеально. Z-фактор никогда не может превышать 1. |
от 0,5 до 1,0 | Отличная проба. Обратите внимание, что если , 0,5 эквивалентно разделению 12 стандартные отклонения между и . |
от 0 до 0,5 | Маргинальная проба. |
меньше 0 | Между положительным и отрицательным контролями слишком много совпадений, чтобы анализ был полезен. |
Обратите внимание, что по стандартам многих типов экспериментов нулевой Z-фактор предполагает большую величину эффекта, а не пограничный бесполезный результат, как предлагалось выше. Например, если σп= σп= 1, то μп= 6 и μп= 0 дает нулевой Z-фактор. Но для нормально распределенных данных с этими параметрами вероятность того, что значение положительного контроля будет меньше, чем значение отрицательного контроля, меньше 1 из 10.5. Крайний консерватизм используется при высокопроизводительном скрининге из-за большого количества выполняемых тестов.
Ограничения
Постоянный фактор 3 в определении Z-фактора мотивирован нормальное распределение, для которого более 99% значений находятся в пределах 3 стандартных отклонений от среднего. Если данные имеют строго ненормальное распределение, контрольные точки (например, значение отрицательного значения) могут вводить в заблуждение. Другая проблема заключается в том, что обычные оценки среднего и стандартного отклонения не соответствуют действительности. крепкий; соответственно, многие пользователи в сообществе высокопроизводительного скрининга предпочитают "Robust Z-prime".[3] Экстремальные значения (выбросы) в положительном или отрицательном контроле могут отрицательно повлиять на Z-фактор, потенциально приводя к явно неблагоприятному Z-фактору, даже если анализ будет хорошо работать при фактическом скрининге.[4]Кроме того, применение единого критерия, основанного на Z-факторе, к двум или более положительным контролям с разной силой в одном и том же анализе приведет к недостоверным результатам.[5] Абсолютный знак в Z-факторе делает неудобным математический вывод статистического вывода Z-фактора. [6]. Недавно предложенный статистический параметр, строго стандартизированная разница средних (ССМД ), может решить эти проблемы [5][6][7]. Одна оценка ССМД устойчив к выбросам.
Смотрите также
Рекомендации
- ^ http://planetorbitrap.com/data/uploads/4fb692e73c07b.pdf
- ^ Чжан Дж. Х., Чунг TDY, Ольденбург, КР (1999). «Простой статистический параметр для использования при оценке и валидации высокопроизводительных скрининговых анализов». Журнал биомолекулярного скрининга. 4: 67–73. Дои:10.1177/108705719900400206. PMID 10838414.
- ^ Бирмингем, Аманда; и другие. (Август 2009 г.). «Статистические методы анализа высокопроизводительных экранов интерференции РНК». Нат методы. 6 (8): 569–575. Дои:10.1038 / nmeth.1351. ЧВК 2789971. PMID 19644458.
- ^ Суй Y, Wu Z (2007). «Альтернативный статистический параметр для оценки качества высокопроизводительного скринингового анализа». Журнал биомолекулярного скрининга. 12: 229–34. Дои:10.1177/1087057106296498. PMID 17218666.
- ^ а б Zhang XHD, Espeseth AS, Johnson E, Chin J, Gates A, Mitnaul L, Marine SD, Tian J, Stec EM, Kunapuli P, Holder DJ, Heyse JF, Stulovici B., Ferrer M (2008). «Интеграция экспериментальных и аналитических подходов для улучшения качества данных в полногеномных экранах РНКи». Журнал биомолекулярного скрининга. 13: 378–89. Дои:10.1177/1087057108317145. PMID 18480473.
- ^ а б Чжан XHD (2007). «Пара новых статистических параметров для контроля качества в высокопроизводительных скрининговых анализах РНК-интерференции». Геномика. 89: 552–61. Дои:10.1016 / j.ygeno.2006.12.014. PMID 17276655.
- ^ Чжан XHD (2008). «Новые аналитические критерии и эффективный дизайн планшетов для контроля качества при полногеномном скрининге РНКи». Журнал биомолекулярного скрининга. 13: 363–77. Дои:10.1177/1087057108317062. PMID 18567841.
дальнейшее чтение
- Крайбилл, Б. (2005) «Количественная оценка и оптимизация анализа» (неопубликованное примечание)
- Чжан XHD (2011) «Оптимальный высокопроизводительный скрининг: практический экспериментальный план и анализ данных для исследования РНКи в масштабе генома, Cambridge University Press»