Дизайн разрывов регрессии - Regression discontinuity design

В статистика, эконометрика, политическая наука, эпидемиология, и смежных дисциплин, a дизайн с разрывом регрессии (RDD) представляет собой квазиэкспериментальный план предварительного тестирования и последующего тестирования, который выявляет причинные эффекты вмешательств путем определения порогового значения или порога, выше или ниже которого назначается вмешательство. Сравнивая наблюдения, расположенные близко по обе стороны от порога, можно оценить средний лечебный эффект в средах, в которых рандомизация неосуществимо. Впервые применен Дональдом Тистлтуэйтом и Дональд Кэмпбелл к оценке стипендиальных программ,[1] RDD становится все более популярным в последние годы.[2] Недавние сравнения рандомизированных контролируемых исследований (РКИ) и RDD эмпирически продемонстрировали внутреннюю валидность дизайна.[3]

Пример

Интуиция, стоящая за RDD, хорошо иллюстрируется оценкой стипендий на основе заслуг. Основная проблема с оценкой причинно-следственного эффекта такого вмешательства - это однородность выполнения назначенных лечение (например, стипендия). Поскольку наиболее успешные студенты с большей вероятностью получат стипендию за заслуги и продолжат в то же время хорошо успевать, сравнение результатов награжденных и непоследователей приведет к увеличению предвзятость оценок. Даже если бы стипендия вообще не улучшала оценки, стипендиаты работали бы лучше, чем не получатели, просто потому, что стипендии предоставлялись студентам, которые хорошо успевали. ex-ante.

Несмотря на отсутствие экспериментальная конструкция, RDD может использовать экзогенный характеристики вмешательства, чтобы выявить причинные эффекты. Если все учащиеся получают стипендию с оценками выше заданной - например, 80%, то можно выявить местный лечебный эффект, сравнив учащихся с пороговым значением 80%. Здесь интуиция подсказывает, что ученик, набравший 79%, скорее всего, будет очень похож на ученика, набравшего 81% - с учетом заранее определенного порога в 80%. Однако один студент получит стипендию, а другой - нет. Сравнение результатов лауреата (группы лечения) с результатами контрфактический Результат нереципиента (контрольная группа), следовательно, обеспечит местный лечебный эффект.

Методология

Два наиболее распространенных подхода к оценке с использованием СДР: непараметрический и параметрический (обычно полиномиальная регрессия ).

Непараметрическая оценка

Наиболее распространенный непараметрический метод, используемый в контексте СДР, - это локальная линейная регрессия. Это имеет вид:

куда это время окончания лечения и является двоичной переменной, равной единице, если . Сдача - пропускная способность используемых данных, мы имеем . Различные уклоны и пересечения соответствуют данным по обе стороны от границы. Обычно либо прямоугольный ядро (без взвешивания) или треугольное ядро. Исследования в пользу треугольного ядра[4], но у прямоугольного ядра есть более прямая интерпретация.[5]

Основное преимущество использования непараметрических методов в СДР заключается в том, что они предоставляют оценки на основе данных, близких к пороговому значению, что интуитивно привлекательно. Это снижает некоторую систематическую ошибку, которая может возникнуть в результате использования данных, находящихся дальше от границы отсечки, для оценки неоднородности на границе отсечки.[5] Более формально предпочтительны локальные линейные регрессии, поскольку они обладают лучшими свойствами смещения.[4] и лучше сходимость.[6] Однако использование обоих типов оценки, если это возможно, является полезным способом доказать, что оценочные результаты не слишком сильно зависят от конкретного принятого подхода.

Параметрическая оценка

Пример параметрической оценки:

куда

и является отсечкой лечения. Обратите внимание, что полиномиальная часть может быть сокращена или расширена в соответствии с потребностями.

Другие примеры

  • Политика, при которой лечение определяется возрастным критерием приемлемости (например, пенсия, минимальный возраст для употребления алкоголя).[7][8]
  • Выборы, на которых один политик побеждает с незначительным большинством голосов.[9][10]
  • Оценки размещения в рамках образования, которые распределяют студентов по программам лечения.[11]

Требуемые предположения

Дизайн прерывания регрессии требует, чтобы все потенциально значимые переменные, кроме переменной лечения и переменной результата, были непрерывными в точке, где происходят прерывания лечения и исхода. Достаточно, но не обязательно [10], условием является то, что назначение лечения "практически случайно" на пороге лечения.[9] Если это так, то это гарантирует, что те, кто едва получал лечение, сопоставимы с теми, кто почти не получал лечения, поскольку статус лечения фактически случайный.

Назначение лечения на пороге может быть «практически случайным», если переменная назначения имеет случайность и рассматриваемые агенты (отдельные лица, фирмы и т. Д.) Не могут идеально управлять своим статусом лечения. Например, предположим, что лечение проходит экзамен, где требуется оценка 50%. В этом случае этот пример представляет собой действительный план с разрывом регрессии, если оценки в некоторой степени случайны из-за случайности оценок или случайности успеваемости учащихся.

Учащиеся также не должны уметь точно управлять своей оценкой, чтобы точно определить статус своего лечения. Два примера включают в себя учащиеся, способные убедить учителей «сдать экзамен», или возможность учащимся сдавать экзамен повторно, пока они не сдадут. В первом случае те ученики, которые почти не проигрывают, но могут получить «пропуск милосердия», могут отличаться от тех, кто едва терпит неудачу, но не может получить «пропуск милосердия». Это ведет к критерий отбора, поскольку экспериментальная и контрольная группы теперь различаются. В последнем случае некоторые студенты могут решить пересдать экзамен, остановившись после сдачи. Это также приводит к критерий отбора так как только некоторые студенты решат пересдать экзамен.[5]

Проверка обоснованности предположений

Невозможно окончательно проверить достоверность, если агенты могут точно определить статус своего лечения. Однако некоторые тесты могут предоставить доказательства, которые либо подтверждают, либо опровергают достоверность плана прерывности регрессии.

Тест на плотность

МакКрари (2008)[12] тест плотности на данных Ли, Моретти и Батлера (2004).[13]

МакКрари (2008) предложил изучить плотность наблюдений за переменной присваивания.[12] Предположим, есть разрыв в плотности переменной присваивания на пороге для лечения. В этом случае это может указывать на то, что некоторые агенты смогли идеально манипулировать своим статусом лечения.

Например, если несколько учеников могут получить «пропуск милосердия», то будет больше учеников, которые едва сдали экзамен, чем тех, кто едва не сдал. Точно так же, если студентам разрешено пересдавать экзамен до тех пор, пока они не сдадут экзамен, результат будет аналогичным. В обоих случаях это, скорее всего, проявится при проверке плотности оценок за экзамен. Подобная «игра с системой» может исказить оценку эффекта лечения.

Непрерывность наблюдаемых переменных

Поскольку валидность плана прерывности регрессии зависит от того, чтобы те, кого почти не лечили, были такими же, как и те, кого почти не лечили, имеет смысл проверить, основаны ли эти группы аналогичным образом на наблюдаемых переменных. В предыдущем примере можно было проверить, имеют ли те, кто едва сдал экзамен, другие характеристики (демографические данные, семейный доход и т. Д.), Чем те, кто едва сдал экзамен. Хотя некоторые переменные могут различаться для двух групп на основе случайного совпадения, большинство этих переменных должны быть одинаковыми.[13]

Тесты на фальсификацию

Предопределенные переменные

Подобно непрерывности наблюдаемых переменных, можно было бы ожидать, что будет непрерывность в заранее определенных переменных в момент прекращения лечения. Поскольку эти переменные были определены до принятия решения о лечении, статус лечения не должен на них влиять. Рассмотрим предыдущий пример стипендии на основе заслуг. Если интересующий результат - будущие оценки, то мы не ожидаем, что стипендия повлияет на предыдущие оценки. Если разрыв предопределенных переменных присутствует в точке отсечения лечения, то это ставит под сомнение обоснованность плана прерывания регрессии.

Прочие нарушения непрерывности

Если разрывы присутствуют в других точках переменной присваивания, где они не ожидаются, то это может вызвать подозрение в отношении дизайна разрывов регрессии. Рассмотрим пример Карпентера и Добкина (2011), которые изучали влияние легального доступа к алкоголю в Соединенных Штатах.[8] Поскольку доступ к алкоголю увеличивается в возрасте 21 года, это приводит к изменению различных исходов, таких как уровень смертности и уровень заболеваемости. Если показатели смертности и заболеваемости также скачкообразно увеличиваются в других возрастах, то это ставит под сомнение интерпретацию разрыва в возрасте 21 года.

Включение и исключение ковариат

Если оценки параметров чувствительны к удалению или добавлению ковариаты к модели, то это может поставить под сомнение обоснованность плана прерывности регрессии. Значительное изменение может указывать на то, что те, кто почти не лечился, отличаются по этим ковариатам от тех, кто практически не лечился. Включение ковариат частично устранит эту систематическую ошибку. Если присутствует большое количество систематической ошибки, и ковариаты объясняют ее значительную часть, то их включение или исключение существенно изменит оценку параметра.[5]

Недавняя работа показала, как добавлять ковариаты, при каких условиях это допустимо, а также потенциал для повышения точности.[14]

Преимущества

  • При правильном применении и анализе RDD дает объективную оценку местного лечебного эффекта.[15] RDD может быть почти таким же хорошим, как рандомизированный эксперимент по измерению лечебного эффекта.
  • RDD, как квазиэксперимент, не требует ex-ante рандомизация и позволяет избежать этических проблем случайное присвоение.
  • Хорошо выполненные RDD-исследования могут генерировать оценки эффекта лечения, аналогичные оценкам рандомизированных исследований.[16]

Недостатки

  • Предполагаемые эффекты только беспристрастный правильно ли смоделирована функциональная форма связи между лечением и результатом. Самые популярные предостережения - это нелинейные отношения, которые ошибочно принимают за разрыв.
  • Загрязнение от других методов лечения. Предположим, что другая обработка происходит при том же значении отсечки той же переменной присваивания. В этом случае измеренная нестабильность в переменной результата может быть частично отнесена к этому другому лечению. Например, предположим, что исследователь хочет изучить влияние легального доступа к алкоголю на психическое здоровье, используя план прерывности регрессии при минимальном разрешенном для употребления возрасте возрасте. Измеренное воздействие можно спутать с легальным доступом к азартным играм, который может иметь место в том же возрасте.

Расширения

Нечеткий RDD

В идентификация причинных эффектов зависит от ключевого предположения, что действительно существует резкое ограничение, вокруг которого существует разрыв в вероятности присвоения от 0 до 1. В действительности, однако, ограничения часто не выполняются строго (например, осуществляются дискреционные полномочия для студентов, которые только что не достигли порога), поэтому оценки будут пристрастный.

В отличие от дизайна с резким разрывом регрессии, нечеткий дизайн разрывов регрессии (FRDD) не требует резкого скачка вероятности присвоения. Тем не менее, это применимо до тех пор, пока вероятность присвоения различна. Интуиция, лежащая в основе этого, связана с инструментальная переменная стратегия и намерение лечить.

Конструкция регрессионного перегиба

Когда переменная назначения является непрерывной (например, помощь студентам) и предсказуемо зависит от другой наблюдаемой переменной (например, дохода семьи), можно определить эффекты лечения, используя резкие изменения наклона функции лечения. Эта техника была изобретена регрессионный кинк дизайн Нильсена, Соренсена и Табе (2010), хотя они цитируют аналогичные более ранние исследования.[17] Они пишут: «Этот подход напоминает идею прерывности регрессии. Вместо разрыва уровня функции стипендия-доход у нас есть разрыв в наклоне функции». Строгие теоретические основы были предоставлены Card et al. (2012)[18] и эмпирическое приложение Bockerman et al. (2018).[19]

Обратите внимание, что изгибы регрессии (или же извилистая регрессия) также может означать тип сегментированная регрессия, который представляет собой другой тип анализа.

Заключительные соображения

Дизайн RD принимает форму квази-экспериментального исследования с четкой структурой, лишенной рандомизированных экспериментальных особенностей. Некоторые аспекты отрицают, что дизайн RD допускает сохранение статус-кво. Например, конструкции часто содержат серьезные проблемы, не оставляющие места для случайных экспериментов. Кроме того, план экспериментов зависит от точности процесса моделирования и соотношения между входами и выходами.

Смотрите также

Рекомендации

  1. ^ Thistlethwaite, D .; Кэмпбелл, Д. (1960). «Регрессионно-разрывной анализ: альтернатива эксперименту ex post facto». Журнал педагогической психологии. 51 (6): 309–317. Дои:10,1037 / ч0044319.
  2. ^ Imbens, G .; Лемье, Т. (2008). «Проекты с разрывом регрессии: практическое руководство» (PDF). Журнал эконометрики. 142 (2): 615–635. Дои:10.1016 / j.jeconom.2007.05.001.
  3. ^ Чаплин, Дункан Д .; Кук, Томас Д .; Зуровак, Елена; Куперсмит, Джаред С .; Finucane, Mariel M .; Vollmer, Lauren N .; Моррис, Ребекка Э. (2018). «Внутренняя и внешняя валидность дизайна разрывов регрессии: метаанализ 15 сравнений в рамках исследования». Журнал анализа политики и управления. 37 (2): 403–429. Дои:10.1002 / pam.22051. ISSN  1520-6688.
  4. ^ а б Поклонник; Gijbels (1996). Локальное полиномиальное моделирование и его приложения. Лондон: Чепмен и Холл. ISBN  978-0-412-98321-4.
  5. ^ а б c d Ли; Лемье (2010). «Модели разрыва регрессии в экономике». Журнал экономической литературы. 48 (2): 281–355. Дои:10.1257 / jel.48.2.281. S2CID  14166110.
  6. ^ Портер (2003). «Оценка в модели разрыва регрессии» (PDF). Неопубликованная рукопись.
  7. ^ Дюфло (2003). «Бабушки и внучки: пенсии по старости и распределение внутри домохозяйства в Южной Африке». Экономический обзор Всемирного банка. 17 (1): 1–25. Дои:10.1093 / wber / lhg013. HDL:10986/17173.
  8. ^ а б Плотник; Добкин (2011). «Минимальный возраст для употребления алкогольных напитков и общественное здоровье». Журнал экономических перспектив. 25 (2): 133–156. Дои:10.1257 / jep.25.2.133. JSTOR  23049457. ЧВК  3182479. PMID  21595328.
  9. ^ а б Ли (2008). «Рандомизированные эксперименты на основе неслучайного отбора на выборах в Палату представителей США». Журнал эконометрики. 142 (2): 675–697. CiteSeerX  10.1.1.409.5179. Дои:10.1016 / j.jeconom.2007.05.004.
  10. ^ а б де ла Куэста, B; Имаи, К. (2016). «Недоразумения по поводу дизайна прерывистой регрессии при изучении закрытых выборов». Ежегодный обзор политологии. 19 (1): 375–396. Дои:10.1146 / annurev-polisci-032015-010115.
  11. ^ Moss, B.G .; Yeaton, W. H .; Ллойд, Дж. Э. (2014). «Оценка эффективности развивающей математики путем встраивания рандомизированного эксперимента в план с разрывом регрессии». Оценка образования и анализ политики. 36 (2): 170–185. Дои:10.3102/0162373713504988. S2CID  123440758.
  12. ^ а б МакКрари (2008). «Манипулирование текущей переменной в дизайне разрыва регрессии: тест на плотность». Журнал эконометрики. 142 (2): 698–714. CiteSeerX  10.1.1.395.6501. Дои:10.1016 / j.jeconom.2007.05.005.
  13. ^ а б Ли; Моретти; Батлер (2004). «Влияют ли избиратели на политику или избирают ее? Данные из Палаты представителей США». Ежеквартальный журнал экономики. 119 (3): 807–859. Дои:10.1162/0033553041502153.
  14. ^ Calonico; Каттанео; Фаррелл; Титюник (2018). «Планы разрыва регрессии с использованием ковариат». arXiv:1809.03904 [econ.EM ].
  15. ^ Рубин (1977). «Назначение лечения на основании ковариаты». Журнал образовательной и поведенческой статистики. 2 (1): 1–26. Дои:10.3102/10769986002001001. S2CID  123013161.
  16. ^ Moss, B.G .; Yeaton, W. H .; Ллойд, Дж. Э. (2014). «Оценка эффективности развивающей математики путем встраивания рандомизированного эксперимента в план с разрывом регрессии». Оценка образования и анализ политики. 36 (2): 170–185. Дои:10.3102/0162373713504988. S2CID  123440758.
  17. ^ Nielsen, H. S .; Sørensen, T .; Табер, К. Р. (2010). «Оценка влияния помощи студентам на прием в колледж: данные реформы политики государственных грантов». Американский экономический журнал: экономическая политика. 2 (2): 185–215. Дои:10.1257 / pol.2.2.185. HDL:10419/35588. JSTOR  25760068.
  18. ^ Карточка, Дэвид; Ли, Дэвид С .; Пей, Чжуань; Вебер, Андреа (2012). «Правила нелинейной политики и идентификация и оценка причинных эффектов в обобщенном регрессионном кинк-дизайне». Рабочий документ NBER № W18564. Дои:10.3386 / w18564. SSRN  2179402.
  19. ^ Бокерман, Петри; Каннинен, Охто; Суониеми, Илпо (2018). «Излом, от которого вы заболеете: влияние оплаты труда на отсутствие». Журнал прикладной эконометрики. 33 (4): 568–579. Дои:10.1002 / jae.2620.

дальнейшее чтение

внешняя ссылка