Нарушение равновесия сцепления - Linkage disequilibrium

В популяционная генетика, нарушение равновесия по сцеплению (LD) является неслучайной ассоциацией аллели в разных места в данной популяции. Считается, что локусы находятся в неравновесном сцеплении, когда частота ассоциации их различных аллелей выше или ниже, чем можно было бы ожидать, если бы локусы были независимыми и ассоциировались случайным образом.[1]

На неравновесие сцепления влияют многие факторы, в том числе: отбор, скорость генетическая рекомбинация, скорость мутации, генетический дрейф, то система вязки, структура населения, и генетическая связь. В результате картина неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют.

Несмотря на название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем).[1] Кроме того, неравновесие по сцеплению иногда называют гаметическая фаза нарушение равновесия;[2] однако эта концепция также применима к бесполый организмов и, следовательно, не зависит от наличия гаметы.

Формальное определение

Предположим, что среди гамет, образующихся в популяции, размножающейся половым путем, аллель А происходит с частотой в одном локусе (т.е. доля гамет с А в этом локусе), в то время как в другом локусе аллеля B происходит с частотой . Аналогично пусть быть частотой, с которой оба А и B встречаются вместе в одной гамете (т.е. это частота AB гаплотип ).

Связь между аллелями А и B можно рассматривать как полностью случайный, что известно в статистика так как независимость - когда возникновение одного не влияет на возникновение другого, и в этом случае вероятность того, что оба А и B происходить вместе дается товар вероятностей. Говорят, что существует неравновесие сцепления между двумя аллелями всякий раз, когда отличается от по любой причине.

Уровень неравновесия по сцеплению между А и B можно количественно оценить коэффициент неравновесия по сцеплению , который определяется как

при условии, что оба и больше нуля. неравновесие сцепления соответствует . В этом случае у нас есть и аллели А и B говорят, что находятся в равновесие сцепления. Индекс "AB" на подчеркивает, что неравновесие по сцеплению является свойством пары {А, B} аллелей, а не их соответствующих локусов. Другие пары аллелей в тех же двух локусах могут иметь разные коэффициенты неравновесия по сцеплению.

Для двух двуаллельных локусов, где a и b - другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно для представления всех неравновесных соотношений сцепления между этими аллелями. В таком случае, . Их отношения можно охарактеризовать следующим образом.[3]

Знак D в этом случае выбирается произвольно. Величина D более важна, чем знак D, потому что величина D отражает степень неравновесия по сцеплению.[4] Однако положительное значение D означает, что гамета встречается чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.

Нарушение равновесия сцепления в бесполый популяции могут быть определены аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также возможно определить неравновесие по сцеплению между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике.[1]

Меры, полученные из

Коэффициент неравновесия по сцеплению не всегда является удобной мерой неравновесия по сцеплению, потому что диапазон его возможных значений зависит от частот аллелей, к которым он относится. Это затрудняет сравнение уровня неравновесия по сцеплению между разными парами аллелей.

Левонтин[5] предложил нормализовать D разделив его на теоретическую максимальную разницу между наблюдаемыми и ожидаемыми частотами гаплотипов следующим образом:

где

Альтернатива это коэффициент корреляции между парами локусов, выраженными как

Пример: два локуса и два аллеля

Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями в каждом - двухлокусная, двухаллельная модель. Затем в следующей таблице определены частоты каждой комбинации:

ГаплотипЧастота

Обратите внимание, что это относительные частоты. Вышеуказанные частоты можно использовать для определения частоты каждого из аллелей:

АллельЧастота

Если два локуса и аллели независимый друг от друга, то можно выразить наблюдение так как " найден и найдено ". В таблице выше указаны частоты для , , и для, , следовательно, частота является , а по правилам элементарной статистики .

Отклонение наблюдаемой частоты гаплотипа от ожидаемой - величина[6] называется неравновесием сцепления[7] и обычно обозначается заглавной буквойD:

Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.

Всего
       
Всего

Роль рекомбинации

В отсутствие других эволюционных сил, кроме случайная вязка, Менделирующая сегрегация, случайный хромосомный набор, и хромосомный кроссовер (т.е. при отсутствии естественный отбор, инбридинг, и генетический дрейф ), мера неравновесия по сцеплению сходится к нулю вдоль оси времени со скоростью, зависящей от величины скорости рекомбинации между двумя локусами.

Используя обозначения выше, , мы можем продемонстрировать эту сходимость к нулю следующим образом. В следующем поколении , частота гаплотипа , становится

Это следует потому, что дробь гаплотипов потомков не воссоединились и, таким образом, являются копиями случайного гаплотипа своих родителей. Фракция из них . Фракция рекомбинировали эти два локуса. Если родители являются результатом случайного спаривания, вероятность скопления в локусе имеющий аллель является и вероятность копии в локусе имеющий аллель является , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, это независимые события, так что вероятности могут быть умножены.

Эту формулу можно переписать как

так что

где на -я поколение обозначается как . Таким образом, мы имеем

Если , тогда так что сходится к нулю.

Если в какой-то момент мы наблюдаем неравновесие по сцеплению, оно исчезнет в будущем из-за рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость сближения к нулю.

Пример: аллели лейкоцитарного антигена человека (HLA).

HLA представляет собой группу антигенов клеточной поверхности, также известных как MHC людей. Поскольку гены HLA расположены в соседних локусах в определенной области хромосомы и, как предполагается, проявляют эпистаз друг с другом или с другими генами значительная часть аллелей находится в неравновесном сцеплении.

Примером такого неравновесия по сцеплению является аллели HLA-A1 и B8 у неродственных датчан.[8] упоминается Фогелем и Мотульским (1997).[9]

Таблица 1. Связь HLA-A1 и B8 у неродственных датчан[8]
Антиген jВсего
Антиген i
Всего
Кол-во лиц

Поскольку HLA является кодоминантным, а экспрессия HLA проверяется только локусом за локусом в опросах, показатель LD должен оцениваться из такой таблицы 2 × 2 справа.[9][10][11][12]

выражение () частота антигена  :

выражение () частота антигена  :

частота гена , учитывая, что люди с генотипами '+/-', '+ / +' и '- / +' все положительны на антиген :

и

Обозначение аллелей '-' у антигена я быть Икс, и по антигену j быть y, наблюдаемая частота гаплотипа ху является

и предполагаемая частота гаплотипа ху является

Тогда мера LD выражается как

Стандартные ошибки получаются следующим образом:

Тогда, если

превышает 2 по абсолютной величине, величина статистически значимо велико. Для данных в таблице 1 это 20,9, таким образом, наличие статистически значимой LD между A1 и B8 в популяции допустимо.

Таблица 2. Неравновесие по сцеплению между аллелями HLA в панъевропейцы[12]
Аллели HLA-A iАллели HLA-B j
A1B80.06516.0
A3B70.03910.3
A2Bw400.0134.4
A2Bw150.013.4
A1Bw170.0145.4
A2B180.0062.2
A2Bw35−0.009−2.3
A29B120.0136.0
A10Bw160.0135.9

В таблице 2 показаны некоторые комбинации аллелей HLA-A и B, при которых значительная LD наблюдалась среди европейцев.[12]

Фогель и Мотульский (1997)[9] Спорили, сколько времени потребуется, чтобы исчезло неравновесие по сцеплению между локусами HLA-A и B. Рекомбинация между локусами HLA-A и B считалась величиной порядка 0,008. Ниже мы рассуждаем аналогично Фогелю и Мотульскому. В случае, если показатель LD был 0,003 у панъевропейцев в списке Mittal[12] это в основном несущественно. Если снизилась с 0,07 до 0,003 под действием рекомбинации, как показано , тогда . Предположим, поколение заняло 25 лет, это означает 10 000 лет. Временной промежуток в истории человечества кажется довольно коротким. Таким образом, наблюдаемое неравновесие сцепления между локусами HLA-A и B может указывать на своего рода интерактивный отбор.[9]

Наличие неравновесия по сцеплению между локусом HLA и предполагаемым основным геном предрасположенности к заболеванию соответствует любому из следующих явлений:

  • Относительный риск для человека, имеющего определенный аллель HLA, заболеть определенным заболеванием, превышает 1.[13]
  • Частота встречаемости антигена HLA среди пациентов превышает таковую среди здорового населения. Это оценивается ценность[14] превысить 0.
Таблица 3. Связь анкилозирующего спондилита с аллелем HLA-B27[15]
Анкилозирующий спондилоартритВсего
ПациентыЗдоровый контроль
Аллели HLA
Всего
  • Таблица ассоциации 2 × 2 пациентов и здоровых людей контрольной группы с аллелями HLA показывает значительное отклонение от состояния равновесия, выведенного из предельных частот.

(1) Относительный риск

Относительный риск аллеля HLA для заболевания приблизительно отношение шансов в таблице ассоциации 2 × 2 аллеля с заболеванием. В таблице 3 показана связь HLA-B27 с анкилозирующим спондилитом среди голландского населения.[15] Относительный риск этого аллеля аппроксимируется

Метод Вульфа[16] применяется, чтобы увидеть, есть ли статистическая значимость. Позволять

и

потом

следует распределению хи-квадрат с . По данным таблицы 3 значимая связь существует на уровне 0,1%. Холдейна[17] модификация применяется к случаю, когда любой из равно нулю, где и заменены на

и

соответственно.

Таблица 4. Ассоциация аллелей HLA с ревматическими и аутоиммунными заболеваниями среди белого населения.[13]
БолезньАллель HLAОтносительный риск (%)FAD (%)ФАП (%)
Анкилозирующий спондилоартритB27909080.89
Реактивный артритB27407080.67
Спондилит при воспалительном заболевании кишечникаB27105080.46
Ревматоидный артритDR4670300.57
Системная красная волчанкаDR3345200.31
Рассеянный склерозDR2460200.5
Сахарный диабет 1 типаDR4675300.64

В таблице 4 представлены некоторые примеры ассоциации между аллелями HLA и заболеваниями.[13]

(1a) Превышение частоты аллелей среди пациентов по сравнению с контрольной группой

Наблюдались даже высокие относительные риски между аллелями HLA и заболеваниями, только величина относительного риска не могла определить силу ассоциации.[14] значение выражается

где и - частоты аллелей HLA среди пациентов и здоровых популяций соответственно.[14] В таблице 4 столбец был добавлен в эту цитату. Если отложить в сторону 2 болезни с высоким относительным риском, обе из которых также имеют высокий значения, среди других заболеваний, ювенильный сахарный диабет (тип 1) имеет сильную связь с DR4 даже при низком относительном риске.

(2) Расхождения с ожидаемыми значениями из предельных частот в таблице ассоциаций 2 × 2 аллелей HLA и заболевания

Это может быть подтверждено расчет теста

где . Для данных с небольшим размером выборки, например, без предельного итога больше 15 (и, следовательно, ) следует использовать Поправка Йетса на непрерывность или Точный тест Фишера.[18]

Ресурсы

Сравнение различных показателей LD предоставлено Devlin & Risch.[19]

В Международный проект HapMap позволяет изучать LD в человеческих популяциях онлайн. В Ансамбль проект объединяет данные HapMap с другой генетической информацией из dbSNP.

Программное обеспечение для анализа

  • PLINK - набор инструментов для анализа ассоциации всего генома, который, помимо прочего, может рассчитывать LD
  • LDHat
  • Haploview
  • LdCompare[20]- ПО с открытым кодом для расчета LD.
  • SNP и Variation Suite - коммерческое программное обеспечение с интерактивным графиком LD.
  • ЗОЛОТО - Графический обзор неравновесия сцепления
  • ТАССЕЛЬ - программное обеспечение для оценки неравновесия по сцеплению, ассоциаций признаков и эволюционных паттернов
  • rAggr - находит прокси-маркеры (SNP и инделки), которые находятся в неравновесном сцеплении с набором запрошенных маркеров, используя Проект 1000 геномов и HapMap базы данных генотипов.
  • СНЕП - Быстрое вычисление LD и Ne для больших наборов данных генотипа в формате PLINK.
  • LDlink - Набор веб-приложений для простого и эффективного изучения неравновесия по связям в подгруппах населения. Все данные о генотипе популяции взяты из фазы 3 проекта «1000 геномов», а номера вариантов RS индексируются на основе сборки 151 dbSNP.

Программное обеспечение для моделирования

  • Гаплоидный - а C библиотека для популяционного генетического моделирования (GPL )

Смотрите также

использованная литература

  1. ^ а б c Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего». Природа Обзоры Генетика. 9 (6): 477–485. Дои:10.1038 / nrg2361. ЧВК  5124487. PMID  18427557.
  2. ^ Фалконер, Д.С. Маккей, TFC (1996). Введение в количественную генетику (4-е изд.). Харлоу, Эссекс, Великобритания: Эддисон Уэсли Лонгман. ISBN  978-0-582-24302-6.
  3. ^ Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего». Природа Обзоры Генетика. 9 (6): 477–485. Дои:10.1038 / nrg2361. ISSN  1471-0056. ЧВК  5124487. PMID  18427557.
  4. ^ Калабрезе, Барбара (2019-01-01), Ранганатан, Шоба; Грибсков Михаил; Накаи, Кента; Шенбах, Кристиан (ред.), «Неравновесие сцепления», Энциклопедия биоинформатики и вычислительной биологии, Oxford: Academic Press, стр. 763–765, Дои:10.1016 / b978-0-12-809633-8.20234-3, ISBN  978-0-12-811432-2, получено 2020-10-21
  5. ^ Левонтин, Р. К. (1964). «Взаимодействие выбора и связывания. I.Общие Соображения; гетеротические модели ". Генетика. 49 (1): 49–67. ЧВК  1210557. PMID  17248194.
  6. ^ Роббинс, Р. Б. (1 июля 1918 г.). «Некоторые приложения математики к задачам разведения III». Генетика. 3 (4): 375–389. ЧВК  1200443. PMID  17245911.
  7. ^ R.C. Левонтин и К. Кодзима (1960). «Эволюционная динамика сложных полиморфизмов». Эволюция. 14 (4): 458–472. Дои:10.2307/2405995. ISSN  0014-3820. JSTOR  2405995.
  8. ^ а б Свейгаард А., Хауге М., Джерсилд С., Плаз П., Райдер Л. П., Стауб Нильсен Л., Томсен М. (1979). Система HLA: вводный обзор, 2-е изд. Базель; Лондон; Чичестер: Каргер; Распространяется Wiley, ISBN  3805530498(PBK).
  9. ^ а б c d Фогель Ф, Мотульский А.Г. (1997). Генетика человека: проблемы и подходы, 3-е изд.Берлин; Лондон: Спрингер, ISBN  3-540-60290-9.
  10. ^ Миттал К.К., Хасегава Т., Тинг А., Микки М.Р., Терасаки П.И. (1973). «Генетические вариации в системе HL-A между айнами, японцами и кавказцами», В Дауссет Дж., Коломбани Дж., Ред. Тестирование гистосовместимости, 1972 г., стр. 187–195, Копенгаген: Munksgaard, ISBN  87-16-01101-5.
  11. ^ Yasuda, N; Цудзи, К. (июнь 1975 г.). «Метод подсчета максимальной вероятности для оценки частоты гаплотипов в системе HL-A». Дзинруй Иденгаку Засши. 20 (1): 1–15. PMID  1237691.
  12. ^ а б c d Миттал, К.К. (1976). «Полиморфизм HLA и подверженность болезням». Vox Sang. 31?-73 (3): 161–73. Дои:10.1111 / j.1423-0410.1976.tb02206.x. PMID  969389.
  13. ^ а б c Грегерсен П.К. (2009). «Генетика ревматических заболеваний», ВФайрстейн Г.С., Бадд Р.С., Харрис Э.Д. младший, Макиннес И.Б., Радди С., Серджент Дж. С., ред. (2009). Учебник ревматологии Келли, стр. 305-321, Филадельфия, Пенсильвания: Saunders / Elsevier, ISBN  978-1-4160-3285-4.
  14. ^ а б c Bengtsson, BO; Томсон, Г. (ноябрь 1981 г.). «Измерение силы ассоциаций между антигенами HLA и заболеваниями». Тканевые антигены. 18 (5): 356–63. Дои:10.1111 / j.1399-0039.1981.tb01404.x. PMID  7344182.
  15. ^ а б Nijenhuis, LE (сентябрь 1977 г.). «Генетические соображения о связи между HLA и заболеванием». Гм. Genet. 38 (2): 175–82. Дои:10.1007 / bf00527400. PMID  908564.
  16. ^ Вульф, Б. (июнь 1955 г.). «Об оценке связи между группой крови и заболеванием». Анна. Гм. Genet. 19 (4): 251–3. Дои:10.1111 / j.1469-1809.1955.tb01348.x. PMID  14388528.
  17. ^ Холдейн, JB (май 1956). «Оценка и значение логарифма отношения частот». Анна. Гм. Genet. 20 (4): 309–11. Дои:10.1111 / j.1469-1809.1955.tb01285.x. PMID  13314400.
  18. ^ Сокал Р.Р., Рольф Ф.Дж. (1981). Биометрия: принципы и практика статистики в биологических исследованиях. Оксфорд: W.H. Фриман, ISBN  0-7167-1254-7.
  19. ^ Devlin B .; Риш Н. (1995). «Сравнение показателей неравновесия сцепления для мелкомасштабного картирования» (PDF). Геномика. 29 (2): 311–322. CiteSeerX  10.1.1.319.9349. Дои:10.1006 / geno.1995.9003. PMID  8666377.
  20. ^ Ха, хорошо.; Di X .; Коули С. (2007). «LdCompare: быстрое вычисление одно- и множественных маркеров r2 и генетического покрытия». Биоинформатика. 23 (2): 252–254. Дои:10.1093 / биоинформатика / btl574. PMID  17148510.

дальнейшее чтение