Причинно-следственная модель Рубина - Rubin causal model

В Причинно-следственная модель Рубина (RCM), также известный как Причинная модель Неймана – Рубина,^[1] это подход к статистический анализ из причина и следствие на основе рамки из потенциальные результаты, названный в честь Дональд Рубин. Название «причинная модель Рубина» было впервые придумано Пол В. Холланд.^[2] Схема потенциальных результатов была впервые предложена Ежи Нейман в своей магистерской диссертации 1923 г.,^[3] хотя он обсуждал это только в контексте полностью рандомизированных экспериментов.^[4] Рубин расширил его до общей схемы размышлений о причинно-следственной связи как в наблюдательных, так и в экспериментальных исследованиях.^[1]

Вступление

Причинная модель Рубина основана на идее потенциальных результатов. Например, человек имел бы определенный доход в возрасте 40 лет, если бы он учился в колледже, тогда как у него был бы другой доход в возрасте 40 лет, если бы он не учился в колледже. Чтобы измерить причинный эффект от поступления в колледж для этого человека, нам нужно сравнить результат для одного и того же человека в обоих альтернативных вариантах будущего. Поскольку невозможно увидеть оба потенциальных результата одновременно, один из потенциальных результатов всегда отсутствует. Эта дилемма - «фундаментальная проблема причинный вывод ".

Из-за фундаментальной проблемы причинного вывода, причинные эффекты на уровне единицы не могут быть непосредственно наблюдаемы. Однако рандомизированные эксперименты позволяют оценить причинно-следственные эффекты на популяционном уровне.^[5] В ходе рандомизированного эксперимента людям случайным образом назначается лечение: в колледже или без него. Из-за этого случайного распределения группы (в среднем) эквивалентны, и разницу в доходах в возрасте 40 лет можно отнести к распределению в колледж, поскольку это было единственное различие между группами. Оценка средний причинный эффект (также называемый средний лечебный эффект) затем можно получить, вычислив разницу средних значений между обработанной (посещающей колледж) и контрольной (не посещающей колледж) выборкой.

Однако во многих случаях рандомизированные эксперименты невозможны по этическим или практическим соображениям. В таких сценариях используется механизм неслучайного назначения. Это случай посещения колледжа: люди не распределяются случайным образом для посещения колледжа. Скорее люди могут выбрать поступление в колледж в зависимости от своего финансового положения, образования родителей и так далее. Многие статистические методы были разработаны для причинно-следственного вывода, например: соответствие баллов предрасположенности. Эти методы пытаются исправить механизм назначения, находя блоки управления, похожие на лечебные.

Расширенный пример

Рубин определяет причинный эффект:

Интуитивно понятно, что причинный эффект одного лечения, E, над другим, C, для конкретной единицы и интервала времени от ${ displaystyle t_ {1}}$ к ${ displaystyle t_ {2}}$ разница между тем, что произошло бы во время ${ displaystyle t_ {2}}$ если блок подвергся воздействию E, инициированного в ${ displaystyle t_ {1}}$ и что бы случилось в ${ displaystyle t_ {2}}$ если блок подвергся воздействию C, инициированного в ${ displaystyle t_ {1}}$ : «Если бы час назад я принял два аспирина вместо одного стакана воды, моя головная боль ушла бы» или «потому что час назад я принял два аспирина вместо стакана воды, моя головная боль теперь исчезла. . ' Наше определение причинного эффекта лечения E по сравнению с C будет отражать это интуитивное значение ».^[5]

Согласно RCM, причинный эффект от приема или отказа от приема аспирина час назад - это разница между тем, как ваша голова чувствовала бы себя в случае 1 (прием аспирина) и случае 2 (отказ от аспирина). Если ваша головная боль останется без аспирина, но исчезнет, если вы приняли аспирин, то причинным эффектом от приема аспирина является облегчение головной боли. В большинстве случаев нас интересует сравнение двух вариантов будущего, одно из которых обычно называется «лечение», а другое - «контроль». Эти ярлыки несколько произвольны.

Возможные результаты

Предположим, что Джо участвует в тестировании FDA на новое лекарство от гипертонии. Если бы мы были всеведущими, мы бы знали результаты для Джо как при лечении (новый препарат), так и при контроле (либо отсутствие лечения, либо текущее стандартное лечение). Причинный эффект или эффект лечения - это разница между этими двумя потенциальными исходами.

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	135	−5

${ displaystyle Y_ {t} (u)}$ Джо артериальное давление если он примет новую таблетку. В общем, это обозначение выражает потенциальный результат лечения, т, на единице, ты. По аналогии, ${ displaystyle Y_ {c} (u)}$ эффект от другого лечения, c или управление на единице, ты. В этом случае, ${ displaystyle Y_ {c} (u)}$ артериальное давление Джо, если он не примет таблетку. ${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$ - это причинный эффект от приема нового препарата.

Из этой таблицы мы знаем только причинное влияние на Джо. У всех остальных участников исследования может наблюдаться повышение артериального давления, если они принимают таблетки. Однако, независимо от причинного эффекта для других субъектов, причинным эффектом для Джо является более низкое кровяное давление по сравнению с тем, каким было бы его кровяное давление, если бы он не принял таблетку.

Рассмотрим более крупную выборку пациентов:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	135	−5
Мэри	140	150	−10
Салли	135	125	10
Боб	135	150	−15

Причинно-следственный эффект различен для каждого субъекта, но препарат работает для Джо, Мэри и Боба, потому что причинный эффект отрицательный. Их кровяное давление ниже при приеме препарата, чем было бы, если бы каждый из них не принимал препарат. С другой стороны, у Салли препарат вызывает повышение артериального давления.

Чтобы потенциальный результат имел смысл, он должен быть возможен, по крайней мере, априори. Например, если у Джо нет возможности получить новое лекарство ни при каких обстоятельствах, тогда ${ displaystyle Y_ {t} (u)}$ для него невозможно. Этого не может быть никогда. И если ${ displaystyle Y_ {t} (u)}$ невозможно наблюдать даже теоретически, тогда причинный эффект лечения на кровяное давление Джо не определен.

Нет причинно-следственной связи без манипуляций

Причинный эффект нового препарата хорошо определен, потому что это простое различие двух потенциальных результатов, оба из которых могут произойти. В этом случае мы (или что-то еще) можем манипулировать миром, по крайней мере, концептуально, так что не исключено, что может произойти одно или другое.

Это определение причинно-следственных связей становится гораздо более проблематичным, если один из возможных результатов никогда не может произойти. Например, как влияет рост Джо на его вес? Наивно, это похоже на другие наши примеры. Нам просто нужно сравнить два возможных результата: каким будет вес Джо при лечении (где лечение определяется как рост на 3 дюйма) и какой вес Джо будет под контролем (где контроль определяется как его текущий рост).

Немного подумав, высветится проблема: мы не можем увеличить рост Джо. Невозможно даже концептуально наблюдать, какой был бы вес Джо, будь он выше, потому что нет способа сделать его выше. Мы не можем манипулировать Рост Джо, поэтому нет смысла исследовать причинное влияние роста на вес. Отсюда слоган: Нет причинно-следственной связи без манипуляций.

Допущение стабильной стоимости единицы обработки (SUTVA)

Мы требуем, чтобы «наблюдение [потенциального результата] на одном отделении не зависело от конкретного назначения лечения другим отделениям» (Cox 1958, §2.4). Это называется допущением о стабильной единице лечения (SUTVA), которое выходит за рамки концепции независимости.

В контексте нашего примера артериальное давление Джо не должно зависеть от того, получает Мэри препарат или нет. Но что, если это так? Предположим, что Джо и Мэри живут в одном доме, а Мэри всегда готовит. Наркотик вызывает у Мэри тягу к соленой пище, поэтому, если она примет лекарство, она будет готовить с большим количеством соли, чем в противном случае. Диета с высоким содержанием соли повышает кровяное давление Джо. Следовательно, его результат будет зависеть как от того, какое лечение он получил, так и от того, какое лечение получит Мэри.

Нарушение SUTVA затрудняет причинный вывод. Мы можем учесть зависимые наблюдения, рассматривая больше вариантов лечения. Мы создаем 4 процедуры с учетом того, получает ли Мэри лечение.

предмет	Джо = c, Мэри = t	Джо = т, Мэри = т	Джо = c, Мэри = c	Джо = т, Мэри = с
Джо	140	130	125	120

Напомним, что причинный эффект определяется как разница между двумя потенциальными исходами. В этом случае есть несколько причинных эффектов, потому что существует более двух возможных результатов. Один из них - это причинное воздействие препарата на Джо, когда Мэри получает лечение, и рассчитывается: ${ displaystyle 130–140}$ . Другой - причинное воздействие на Джо, когда Мэри не получает лечения, и рассчитывается ${ displaystyle 120–125}$ . Третий - это причинный эффект от лечения Мэри на Джо, когда Джо не лечили. Это рассчитывается как ${ displaystyle 140–125}$ . Лечение, которое получает Мэри, оказывает на Джо больший причинный эффект, чем лечение, которое получил Джо, на Джо, и это в противоположном направлении.

Рассматривая таким образом больше потенциальных результатов, мы можем заставить SUTVA оставаться в силе. Однако, если от Мэри зависят какие-либо подразделения, кроме Джо, мы должны рассмотреть дальнейшие возможные результаты. Чем больше количество зависимых единиц, тем больше потенциальных результатов мы должны учитывать и тем сложнее становятся расчеты (рассмотрим эксперимент с 20 разными людьми, статус лечения каждого из которых может повлиять на результаты для всех остальных). Чтобы (легко) оценить причинный эффект однократного лечения по сравнению с контролем, SUTVA следует придерживаться.

Средний причинный эффект

Учитывать:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	135	−5
Мэри	130	145	−15
Салли	130	145	−15
Боб	140	150	−10
Джеймс	145	140	+5
ИМЕТЬ В ВИДУ	135	143	−8

Один может вычислить средний причинный эффект, взятый из среднего значения всех причинных эффектов.

То, как мы измеряем реакцию, влияет на то, какие выводы мы делаем. Предположим, что мы измеряем изменения артериального давления в процентах, а не в абсолютных величинах. Затем, в зависимости от точных цифр, средним причинным эффектом может быть повышение артериального давления. Например, предположим, что артериальное давление Джорджа будет 154 под контролем и 140 при лечении. Абсолютный размер причинного эффекта составляет -14, но процентная разница (с точки зрения уровня лечения 140) составляет -10%. Если артериальное давление Сары составляет 200 на лечении и 184 под контролем, то причинный эффект составляет 16 в абсолютном выражении, но 8% с точки зрения ценности лечения. Меньшее абсолютное изменение артериального давления (-14 против 16) дает большее процентное изменение (-10% против 8%) для Джорджа. Хотя средний причинный эффект для Джорджа и Сары равен +1 в абсолютном выражении, он равен -1 в процентном отношении.

Основная проблема причинного вывода

Результаты, которые мы видели до этого момента, никогда не будут измерены на практике. По определению невозможно наблюдать эффект от более чем одного лечения на субъект в течение определенного периода времени. Джо не может принимать таблетку и не принимать ее одновременно. Следовательно, данные будут выглядеть примерно так:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	?	?

Вопросительные знаки - это ответы, которые невозможно было наблюдать. В Фундаментальная проблема причинного вывода^[2] заключается в том, что непосредственное наблюдение причинных эффектов невозможно. Однако это не делает причинный вывод невозможно. Определенные методы и допущения позволяют преодолеть фундаментальную проблему.

Предположим, что у нас есть следующие данные:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	?	?
Мэри	?	125	?
Салли	100	?	?
Боб	?	130	?
Джеймс	?	120	?
ИМЕТЬ В ВИДУ	115	125	−10

Мы можем сделать вывод, каким был бы потенциальный исход Джо под контролем, если бы мы сделали предположение о постоянном эффекте:

{ Displaystyle Y_ {t} (u) = T + Y_ {c} (u)}

и

{ displaystyle Y_ {t} (u) -T = Y_ {c} (u).}

Если бы мы хотели вывести ненаблюдаемые значения, мы могли бы предположить постоянный эффект. В следующих таблицах показаны данные, согласующиеся с предположением о постоянном эффекте.

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	140	−10
Мэри	115	125	−10
Салли	100	110	−10
Боб	120	130	−10
Джеймс	110	120	−10
ИМЕТЬ В ВИДУ	115	125	−10

Все субъекты имеют одинаковый причинный эффект, даже если у них разные результаты лечения.

Механизм присвоения

Механизм назначения, метод, по которому единицам назначается лечение, влияет на расчет среднего причинного эффекта. Одним из таких механизмов назначения является рандомизация. Для каждого субъекта мы могли подбросить монетку, чтобы определить, получает ли она лечение. Если бы мы хотели, чтобы лечение получили пять субъектов, мы могли бы назначить лечение первым пяти именам, которые мы выбрали из шляпы. Когда мы случайным образом назначаем лечение, мы можем получить разные ответы.

Предположим, что эти данные верны:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	115	15
Мэри	120	125	−5
Салли	100	125	−25
Боб	110	130	−20
Джеймс	115	120	−5
ИМЕТЬ В ВИДУ	115	123	−8

Истинный средний причинно-следственный эффект равен -8. Но причинный эффект для этих людей никогда не бывает равным этому среднему значению. Причинно-следственный эффект варьируется, как обычно (всегда?) В реальной жизни. После случайного назначения лечения мы можем оценить причинный эффект следующим образом:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	?	?
Мэри	120	?	?
Салли	?	125	?
Боб	?	130	?
Джеймс	115	?	?
ИМЕТЬ В ВИДУ	121.66	127.5	−5.83

Другое случайное распределение обработок дает другую оценку среднего причинного эффекта.

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	?	?
Мэри	120	?	?
Салли	100	?	?
Боб	?	130	?
Джеймс	?	120	?
ИМЕТЬ В ВИДУ	116.67	125	−8.33

Средний причинный эффект варьируется, потому что наша выборка мала, а ответы имеют большой отклонение. Если бы выборка была больше, а дисперсия была бы меньше, средний причинный эффект был бы ближе к истинному среднему причинному эффекту, независимо от конкретных единиц, случайным образом назначенных для лечения.

В качестве альтернативы предположим, что механизм назначает лечение всем мужчинам и только им.

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	?	?
Боб	110	?	?
Джеймс	105	?	?
Мэри	?	130	?
Салли	?	125	?
Сюзи	?	135	?
ИМЕТЬ В ВИДУ	115	130	−15

Согласно этому механизму назначения, женщины не могут получить лечение и, следовательно, невозможно определить средний причинный эффект для женщин. Чтобы сделать какие-либо выводы о причинном воздействии на субъекта, вероятность того, что субъект получит лечение, должна быть больше 0 и меньше 1.

Идеальный врач

Рассмотрим использование идеальный доктор как механизм уступки. Идеальный врач знает, как каждый субъект отреагирует на лекарство или контроль, и назначает каждому пациенту лечение, которое принесет ему наибольшую пользу. Идеальный врач знает следующую информацию об выборке пациентов:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	130	115	15
Боб	120	125	−5
Джеймс	100	150	−50
Мэри	115	125	−10
Салли	120	130	−10
Сюзи	135	105	30
ИМЕТЬ В ВИДУ	120	125	−5

Основываясь на этих знаниях, она будет назначать следующие лечебные процедуры:

предмет	${ displaystyle Y_ {t} (u)}$	${ displaystyle Y_ {c} (u)}$	${ displaystyle Y_ {t} (u) -Y_ {c} (u)}$
Джо	?	115	?
Боб	120	?	?
Джеймс	100	?	?
Мэри	115	?	?
Салли	120	?	?
Сюзи	?	105	?
ИМЕТЬ В ВИДУ	113.75	110	3.75

Идеальный врач искажает оба средних значения, отфильтровывая плохие ответы как на лечение, так и на контроль. Разница между средствами, которая представляет собой предполагаемый средний причинный эффект, искажается в направлении, которое зависит от деталей. Например, такой субъект, как Сьюзи, которому причинен вред в результате приема лекарства, будет отнесен к контрольной группе идеальным врачом, и, таким образом, отрицательный эффект лекарства будет замаскирован.

Вывод

Причинный эффект лечения для одного блока в определенный момент времени - это разница между переменной результата с лечением и без лечения. Фундаментальная проблема причинного вывода состоит в том, что невозможно наблюдать причинное воздействие на отдельную единицу. Вы либо принимаете аспирин сейчас, либо нет. Как следствие, необходимо делать предположения, чтобы оценить недостающие контрфакты.

Причинная модель Рубина также была связана с инструментальные переменные (Ангрист, Имбенс и Рубин, 1996)^[6] и другие методы причинно-следственного вывода. Для получения дополнительной информации о связи между причинной моделью Рубина, моделированием структурных уравнений и другими статистическими методами причинного вывода см. Morgan and Winship (2007).^[7]

Смотрите также

внешняя ссылка

"Причинная модель Рубина": статья для New Palgrave Dictionary of Economics, автор Гвидо Имбенс и Дональд Рубин.
«Контрфактический причинно-следственный анализ»: веб-страница, поддерживаемая Стивеном Морганом, Кристофером Виншипом и другими, со ссылками на многие исследовательские статьи о причинном выводе.

[sekhon-1] а ^б Сехон, Джасджит (2007). "Модель причинно-следственного вывода и оценки Неймана – Рубина методами сопоставления" (PDF). Оксфордский справочник по политической методологии.

[holland:causal86-2] а ^б Голландия, Пол В. (1986). «Статистика и причинный вывод». J. Amer. Статист. Доц. 81 (396): 945–960. Дои:10.1080/01621459.1986.10478354. JSTOR 2289064.

[neyman:masters-3] Нейман, Ежи. Sur les applications de la theorie des probabilites aux experience Agricoles: Essai des Principes. Магистерская диссертация (1923 г.). Выдержки перепечатаны на английском языке, Statistical Science, Vol. 5. С. 463–472. (Д. М. Домбровска, and T. P. Speed, Translators.)

[Jasa1-4] Рубин, Дональд (2005). «Причинно-следственный вывод с использованием возможных результатов». J. Amer. Статист. Доц. 100 (469): 322–331. Дои:10.1198/016214504000001880.

[:01-5] а ^б Рубин, Дональд (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». J. Educ. Psychol. 66 (5): 688–701 [стр. 689]. Дои:10,1037 / ч0037350.

[angrist:etal96-6] Angrist, J .; Imbens, G .; Рубин, Д. (1996). «Выявление причинных эффектов с использованием инструментальных переменных» (PDF). J. Amer. Статист. Доц. 91 (434): 444–455. Дои:10.1080/01621459.1996.10476902.

[7] Morgan, S .; Уиншип, К. (2007). Противоречия и причинный вывод: методы и принципы социальных исследований. Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-67193-4.

[1]

[2]

[3]

[4]

[5]

[6]

[7]