Частично линейная модель - Partially linear model
эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к сделать понятным для неспециалистов, не снимая технических деталей. (Июнь 2019) (Узнайте, как и когда удалить этот шаблон сообщения) |
А частично линейная модель это форма полупараметрическая модель, поскольку содержит параметрические и непараметрические элементы. Применение оценок наименьших квадратов возможно для частично линейной модели, если верна гипотеза известного непараметрического элемента. Частично линейные уравнения были впервые использованы при анализе взаимосвязи между температурой и потреблением электроэнергии Энглом, Грейнджером, Райсом и Вейссом (1986). Типичное применение частично линейной модели в области микроэкономики представлено Трипати в случае рентабельности производства фирмы в 1997 году. Также частично линейная модель успешно применяется в некоторых других академических областях. В 1994 году Зегер и Диггл ввели частично линейную модель в биометрию. В области науки об окружающей среде Парда-Санчес и др. Использовали частично линейную модель для анализа собранных данных в 2000 году. До сих пор частично линейная модель была оптимизирована во многих других статистических методах. В 1988 году Робинсон применил ядерную оценку Надарая-Вастона для проверки непараметрического элемента для построения оценки методом наименьших квадратов. После этого, в 1997 году, Труонг нашел локальный линейный метод.
Частично линейная модель
Синопсис
Уравнение алгебры
Алгебраное выражение частично линейной модели записывается как:
Схема компонентов уравнения
и : Векторы независимых переменных. Независимо случайные или фиксированные распределенные переменные.
: Измеряемый параметр.
: Случайная ошибка в статистике с нулевым средним значением.
: Деталь, подлежащая измерению в частично линейной модели.
Предположение[1]
Вольфганг, Хуа Лян и Цзити Гао рассматривают допущения и замечания частично линейной модели при фиксированных и случайных расчетных условиях.
При случайном распределении введите
и (1)
меньше положительной бесконечности, когда значение t находится между 0 и 1, а сумма ковариации положительный. Случайные ошибки µ не зависят от ,
Когда и Ti фиксированы, распределены, оценивается от 0 до 1, и удовлетворяет , где коэффициент i составляет от 1 до n, а коэффициент j - от 1 до p, коэффициент ошибки удовлетворяет, .
Оценка методом наименьших квадратов (LS)[1]
Предварительным условием применения оценщиков наименьших квадратов является наличие непараметрической составляющей и выполнение случайно распределенных и фиксированных распределенных случаев.
Прежде чем применять оценки методом наименьших квадратов, следует сначала ввести модель сглаживания Энгла, Грейнджера, Райса и Вайсса (1986). Алгебрационная функция их модели выражается как (2).
Вольфганг, Лян и Гао (1988) делают предположение, что пара (ß, g) удовлетворяет (3).
Это означает, что для всех 1≤i≤n, .
Так, .
В случае случайного распределения Вольфганг, Хуа Лян и Цзити Гао предполагают, что для всех 1 ≤ i ≤ n, (4)
так, , из-за - положительное число, как доказала функция (1). установлено для всех 1≤i≤n и j равно 1 и 2, когда .
В фиксированном распределенном случае Путем параметризации коэффициента из модели сглаживания (2) как где .
Делая то же предположение, что и (4), которое следует из предположения (1), и по факту .
Допустимые факторы (я здесь натуральные числа) удовлетворяет и установить положительные весовые функции . Любые оценщики , для каждого , у нас есть . Применяя критерий LS, оценка LS . Непараметрическая оценка выражается как . Итак, когда случайные ошибки распределены одинаково, оценки дисперсии выражается как, .
История и применение частично линейной модели
Реальное применение частично линейной модели впервые было рассмотрено для анализа данных Энглом, Грейнджером, Райсом и Вайссом в 1986 году.[1]
С их точки зрения, связь между температурой и потреблением электроэнергии не может быть выражена в линейной модели, потому что существует множество смешивающих факторов, таких как средний доход, цена товаров, покупательная способность потребителей и некоторые другие виды экономической деятельности. Некоторые факторы связаны друг с другом и могут повлиять на наблюдаемый результат. Поэтому они ввели частично линейную модель, которая содержала как параметрические, так и непараметрические факторы. Частично линейная модель позволяет и упрощает линейное преобразование данных (Engle, Granger, Rice and Weiss, 1986). Они также применили в своих исследованиях технику сглаживающих сплайнов.
Был случай применения частично линейной модели в биометрии Зегером и Дигглом в 1994 году. Целью исследования их статьи является цикл периода эволюции количества клеток CD4 в сероконвертерах ВИЧ (вируса иммунодефицита человека) (Zeger and Diggle, 1994). ).[2] Клетка CD4 играет важную роль в иммунной функции человеческого организма. Зегер и Диггл стремились оценить развитие болезни путем измерения изменяющегося количества клеток CD4. Количество клеток CD4 зависит от возраста тела, курения и так далее. Чтобы очистить группу данных наблюдения в своем эксперименте, Зегер и Диггл применили частично линейную модель для своей работы. Частично линейная модель в первую очередь способствует оценке среднего времени потери клеток CD4 и корректирует временную зависимость некоторых других коварим, чтобы упростить процесс сравнения данных, а также частично линейная модель характеризует отклонение типичной кривой для наблюдаемых группа для оценки кривой прогрессирования изменения количества клеток CD4. Отклонение, предоставленное частично линейной моделью, потенциально помогает распознать наблюдаемые цели, у которых наблюдается медленное изменение количества клеток CD4.
В 1999 году Шмалензее и Стокер (1999) использовали частично линейную модель в области экономики. Независимой переменной их исследования является спрос на бензин в Соединенных Штатах. Основная цель исследования в их статье - взаимосвязь между потреблением бензина и долгосрочной эластичностью дохода в США. Точно так же существует множество смешанных переменных, которые могут влиять друг на друга. Таким образом, Шмалемзее и Стокер решили решать проблемы линейного преобразования данных между параметрическими и непараметрическими данными, применяя частично линейную модель.[3]
В области науки об окружающей среде Prada-Sanchez использовал частично линейную модель для прогнозирования загрязнения диоксидом серы в 2000 году (Prada-Sanchez, 2000).[4], а в следующем году Лин и Кэрролл применили частично линейную модель для кластеризованных данных (Lin and Carroall, 2001).[5]
Разработка частично линейной модели
Согласно статье Ляна, опубликованной в 2010 году (Liang, 2010), метод сглаживающих сплайнов был введен в частично линейную модель Энглом, Хекманом и Райсом в 1986 году. После этого Робинсон нашел доступную LS-оценку для непараметрических факторов в частично линейной модели в 1988 году. В том же году Спекман рекомендовал профильный метод LS.[6]
Другие инструменты эконометрики в частично линейной модели
Регрессия ядра также была введена в частично линейную модель. Метод локальной константы, разработанный Спекманом, и локальный линейный метод, который был обнаружен Гамильтоном и Труонгом в 1997 году и был пересмотрен Опсомером и Руппертом в 1997 году, - все они включены в ядерную регрессию. Грин и др., Опсомер и Рупперт обнаружили, что одной из важных характеристик ядерных методов является недостаточное сглаживание, чтобы найти оценку корня n для бета. Однако исследование Спекмана в 1988 году и исследование Северини и Станисвалиса в 1994 году доказали, что это ограничение может быть отменено.
Выбор полосы пропускания в частично линейной модели[7]
Выбор полосы пропускания в частично линейной модели вызывает затруднения. Лян рассмотрел возможное решение для этого выбора полосы пропускания в своей литературе, применив метод на основе профильного ядра и методы обратной подгонки. Также Лян обосновал необходимость сглаживания для метода обратной подгонки и причину, по которой метод на основе профильного ядра может обеспечить выбор оптимальной полосы пропускания. Общая стратегия вычислений применяется в литературе Ляна для оценки непараметрической функции. Кроме того, для частично линейных моделей и интенсивных экспериментов по моделированию был введен метод штрафных сплайнов, чтобы выявить численные особенности метода штрафных сплайнов, профилей и методов обратной сборки.
Профиль на основе ядра и метод обратной вставки[7]
Представляя
После
Интуитивная оценка ß может быть определена как оценка LS после соответствующей оценки .
Тогда для всех случайных векторных переменных , предполагать оценка ядерной регрессии . Позволять . Например, . Обозначить X, g и T аналогично. Позволять . Так
Оценки на основе ядра профиля совы
где являются оценками ядра mx и my.
Штрафной метод сплайна[7]
Метод штрафных сплайнов был разработан Эйлерсом и Марксом в 1996 году. Рупперт и Кэрролл в 2000 году и Brumback, Рупперт и Ванд в 1999 году использовали этот метод в рамках LME.
Предполагая функцию можно оценить по
где целое число, а фиксированные узлы, Обозначить Рассматривать . Оценщик сплайнов со штрафом определяется следующим образом
куда - параметр сглаживания.
Как упоминал Брамбак и др. В 1999 г.[8], оценщик то же, что и оценка на основе модели LME.
,
где ,
куда , и . Матрица показывает более гладкий сплайн со штрафом для вышеприведенной структуры.
использованная литература
- ^ а б c d Хардл, Лян, ЦзиТи, WolfGang, Хуа, Гао (2000). Частично линейная модель. PHYSICA-VERLAG.CS1 maint: несколько имен: список авторов (ссылка на сайт)
- ^ Zeger, Scott L .; Диггл, Питер Дж. (1994). «Полупараметрические модели для продольных данных с приложением к количеству клеток CD4 в сероконвертерах ВИЧ». Биометрия. 50 (3): 689–699. Дои:10.2307/2532783. ISSN 0006-341X. JSTOR 2532783.
- ^ Шмалензее, Ричард; Стокер, Томас М. (1999). «Бытовой спрос на бензин в США» (PDF). Econometrica. 67 (3): 645–662. Дои:10.1111/1468-0262.00041. ISSN 1468-0262.
- ^ Prada ‐ Sánchez, J.M .; Фебреро ‐ Банде, М .; Котос-Яньес, Т .; González ‐ Manteiga, W .; Bermúdez ‐ Cela, J. L .; Лукас-Домингес, Т. (2000). «Прогнозирование инцидентов, вызывающих загрязнение SO2 вблизи электростанции, с использованием частично линейных моделей и исторической матрицы векторов прогнозирующего ответа». Окружающая среда. 11 (2): 209–225. Дои:10.1002 / (SICI) 1099-095X (200003/04) 11: 2 <209 :: AID-ENV403> 3.0.CO; 2-Z. ISSN 1099-095X.
- ^ Кэрролл, Раймонд Дж .; Линь, Сихун (2001-12-01). «Полупараметрическая регрессия для кластеризованных данных». Биометрика. 88 (4): 1179–1185. Дои:10.1093 / biomet / 88.4.1179. ISSN 0006-3444.
- ^ Лян, Хуа (10 февраля 2006 г.). «Оценка в частично линейных моделях и численные сравнения». Вычислительная статистика и анализ данных. 50 (3): 675–687. Дои:10.1016 / j.csda.2004.10.007. ISSN 0167-9473. ЧВК 2824448. PMID 20174596.
- ^ а б c Лян, Хуа (10 февраля 2006 г.). «Оценка в частично линейных моделях и численные сравнения». Вычислительная статистика и анализ данных. 50 (3): 675–687. Дои:10.1016 / j.csda.2004.10.007. ISSN 0167-9473. ЧВК 2824448. PMID 20174596.
- ^ Брамбак, Бабетта А.; Рупперт, Дэвид; Жезл, М. П. (1999). «Выбор переменных и оценка функций в аддитивной непараметрической регрессии с использованием априорной оценки на основе данных: комментарий». Журнал Американской статистической ассоциации. 94 (447): 794–797. Дои:10.2307/2669991. ISSN 0162-1459. JSTOR 2669991.