Нарушение равновесия сцепления - Linkage disequilibrium
В популяционная генетика, нарушение равновесия по сцеплению (LD) является неслучайной ассоциацией аллели в разных места в данной популяции. Считается, что локусы находятся в неравновесном сцеплении, когда частота ассоциации их различных аллелей выше или ниже, чем можно было бы ожидать, если бы локусы были независимыми и ассоциировались случайным образом.[1]
На неравновесие сцепления влияют многие факторы, в том числе: отбор, скорость генетическая рекомбинация, скорость мутации, генетический дрейф, то система вязки, структура населения, и генетическая связь. В результате картина неравновесия по сцеплению в геноме является мощным сигналом популяционных генетических процессов, которые его структурируют.
Несмотря на название, неравновесие по сцеплению может существовать между аллелями в разных локусах без какой-либо генетической связи между ними и независимо от того, находятся ли частоты аллелей в равновесии (не меняются со временем).[1] Кроме того, неравновесие по сцеплению иногда называют гаметическая фаза нарушение равновесия;[2] однако эта концепция также применима к бесполый организмов и, следовательно, не зависит от наличия гаметы.
Формальное определение
Предположим, что среди гамет, образующихся в популяции, размножающейся половым путем, аллель А происходит с частотой в одном локусе (т.е. доля гамет с А в этом локусе), в то время как в другом локусе аллеля B происходит с частотой . Аналогично пусть быть частотой, с которой оба А и B встречаются вместе в одной гамете (т.е. это частота AB гаплотип ).
Связь между аллелями А и B можно рассматривать как полностью случайный, что известно в статистика так как независимость - когда возникновение одного не влияет на возникновение другого, и в этом случае вероятность того, что оба А и B происходить вместе дается товар вероятностей. Говорят, что существует неравновесие сцепления между двумя аллелями всякий раз, когда отличается от по любой причине.
Уровень неравновесия по сцеплению между А и B можно количественно оценить коэффициент неравновесия по сцеплению , который определяется как
при условии, что оба и больше нуля. неравновесие сцепления соответствует . В этом случае у нас есть и аллели А и B говорят, что находятся в равновесие сцепления. Индекс "AB" на подчеркивает, что неравновесие по сцеплению является свойством пары {А, B} аллелей, а не их соответствующих локусов. Другие пары аллелей в тех же двух локусах могут иметь разные коэффициенты неравновесия по сцеплению.
Для двух двуаллельных локусов, где a и b - другие аллели в этих двух локусах, ограничения настолько сильны, что только одного значения D достаточно для представления всех неравновесных соотношений сцепления между этими аллелями. В таком случае, . Их отношения можно охарактеризовать следующим образом.[3]
Знак D в этом случае выбирается произвольно. Величина D более важна, чем знак D, потому что величина D отражает степень неравновесия по сцеплению.[4] Однако положительное значение D означает, что гамета встречается чаще, чем ожидалось, а отрицательное означает, что комбинация этих двух аллелей встречается реже, чем ожидалось.
Нарушение равновесия сцепления в бесполый популяции могут быть определены аналогичным образом с точки зрения частот популяционных аллелей. Кроме того, также возможно определить неравновесие по сцеплению между тремя или более аллелями, однако эти ассоциации более высокого порядка обычно не используются на практике.[1]
Меры, полученные из
Коэффициент неравновесия по сцеплению не всегда является удобной мерой неравновесия по сцеплению, потому что диапазон его возможных значений зависит от частот аллелей, к которым он относится. Это затрудняет сравнение уровня неравновесия по сцеплению между разными парами аллелей.
Левонтин[5] предложил нормализовать D разделив его на теоретическую максимальную разницу между наблюдаемыми и ожидаемыми частотами гаплотипов следующим образом:
где
Альтернатива это коэффициент корреляции между парами локусов, выраженными как
Пример: два локуса и два аллеля
Рассмотрим гаплотипы для двух локусов A и B с двумя аллелями в каждом - двухлокусная, двухаллельная модель. Затем в следующей таблице определены частоты каждой комбинации:
Гаплотип | Частота |
Обратите внимание, что это относительные частоты. Вышеуказанные частоты можно использовать для определения частоты каждого из аллелей:
Аллель | Частота |
Если два локуса и аллели независимый друг от друга, то можно выразить наблюдение так как " найден и найдено ". В таблице выше указаны частоты для , , и для, , следовательно, частота является , а по правилам элементарной статистики .
Отклонение наблюдаемой частоты гаплотипа от ожидаемой - величина[6] называется неравновесием сцепления[7] и обычно обозначается заглавной буквойD:
Следующая таблица иллюстрирует взаимосвязь между частотами гаплотипов и частотами аллелей и D.
Всего | |||
Всего |
Роль рекомбинации
В отсутствие других эволюционных сил, кроме случайная вязка, Менделирующая сегрегация, случайный хромосомный набор, и хромосомный кроссовер (т.е. при отсутствии естественный отбор, инбридинг, и генетический дрейф ), мера неравновесия по сцеплению сходится к нулю вдоль оси времени со скоростью, зависящей от величины скорости рекомбинации между двумя локусами.
Используя обозначения выше, , мы можем продемонстрировать эту сходимость к нулю следующим образом. В следующем поколении , частота гаплотипа , становится
Это следует потому, что дробь гаплотипов потомков не воссоединились и, таким образом, являются копиями случайного гаплотипа своих родителей. Фракция из них . Фракция рекомбинировали эти два локуса. Если родители являются результатом случайного спаривания, вероятность скопления в локусе имеющий аллель является и вероятность копии в локусе имеющий аллель является , и поскольку эти копии изначально находятся в двух разных гаметах, которые сформировали диплоидный генотип, это независимые события, так что вероятности могут быть умножены.
Эту формулу можно переписать как
так что
где на -я поколение обозначается как . Таким образом, мы имеем
Если , тогда так что сходится к нулю.
Если в какой-то момент мы наблюдаем неравновесие по сцеплению, оно исчезнет в будущем из-за рекомбинации. Однако чем меньше расстояние между двумя локусами, тем меньше будет скорость сближения к нулю.
Пример: аллели лейкоцитарного антигена человека (HLA).
HLA представляет собой группу антигенов клеточной поверхности, также известных как MHC людей. Поскольку гены HLA расположены в соседних локусах в определенной области хромосомы и, как предполагается, проявляют эпистаз друг с другом или с другими генами значительная часть аллелей находится в неравновесном сцеплении.
Примером такого неравновесия по сцеплению является аллели HLA-A1 и B8 у неродственных датчан.[8] упоминается Фогелем и Мотульским (1997).[9]
Антиген j | Всего | ||||
---|---|---|---|---|---|
Антиген i | |||||
Всего | |||||
Кол-во лиц |
Поскольку HLA является кодоминантным, а экспрессия HLA проверяется только локусом за локусом в опросах, показатель LD должен оцениваться из такой таблицы 2 × 2 справа.[9][10][11][12]
выражение () частота антигена :
выражение () частота антигена :
частота гена , учитывая, что люди с генотипами '+/-', '+ / +' и '- / +' все положительны на антиген :
и
Обозначение аллелей '-' у антигена я быть Икс, и по антигену j быть y, наблюдаемая частота гаплотипа ху является
и предполагаемая частота гаплотипа ху является
Тогда мера LD выражается как
Стандартные ошибки получаются следующим образом:
Тогда, если
превышает 2 по абсолютной величине, величина статистически значимо велико. Для данных в таблице 1 это 20,9, таким образом, наличие статистически значимой LD между A1 и B8 в популяции допустимо.
Аллели HLA-A i | Аллели HLA-B j | ||
---|---|---|---|
A1 | B8 | 0.065 | 16.0 |
A3 | B7 | 0.039 | 10.3 |
A2 | Bw40 | 0.013 | 4.4 |
A2 | Bw15 | 0.01 | 3.4 |
A1 | Bw17 | 0.014 | 5.4 |
A2 | B18 | 0.006 | 2.2 |
A2 | Bw35 | −0.009 | −2.3 |
A29 | B12 | 0.013 | 6.0 |
A10 | Bw16 | 0.013 | 5.9 |
В таблице 2 показаны некоторые комбинации аллелей HLA-A и B, при которых значительная LD наблюдалась среди европейцев.[12]
Фогель и Мотульский (1997)[9] Спорили, сколько времени потребуется, чтобы исчезло неравновесие по сцеплению между локусами HLA-A и B. Рекомбинация между локусами HLA-A и B считалась величиной порядка 0,008. Ниже мы рассуждаем аналогично Фогелю и Мотульскому. В случае, если показатель LD был 0,003 у панъевропейцев в списке Mittal[12] это в основном несущественно. Если снизилась с 0,07 до 0,003 под действием рекомбинации, как показано , тогда . Предположим, поколение заняло 25 лет, это означает 10 000 лет. Временной промежуток в истории человечества кажется довольно коротким. Таким образом, наблюдаемое неравновесие сцепления между локусами HLA-A и B может указывать на своего рода интерактивный отбор.[9]
Наличие неравновесия по сцеплению между локусом HLA и предполагаемым основным геном предрасположенности к заболеванию соответствует любому из следующих явлений:
- Относительный риск для человека, имеющего определенный аллель HLA, заболеть определенным заболеванием, превышает 1.[13]
- Частота встречаемости антигена HLA среди пациентов превышает таковую среди здорового населения. Это оценивается ценность[14] превысить 0.
Анкилозирующий спондилоартрит | Всего | |||
---|---|---|---|---|
Пациенты | Здоровый контроль | |||
Аллели HLA | ||||
Всего |
- Таблица ассоциации 2 × 2 пациентов и здоровых людей контрольной группы с аллелями HLA показывает значительное отклонение от состояния равновесия, выведенного из предельных частот.
(1) Относительный риск
Относительный риск аллеля HLA для заболевания приблизительно отношение шансов в таблице ассоциации 2 × 2 аллеля с заболеванием. В таблице 3 показана связь HLA-B27 с анкилозирующим спондилитом среди голландского населения.[15] Относительный риск этого аллеля аппроксимируется
Метод Вульфа[16] применяется, чтобы увидеть, есть ли статистическая значимость. Позволять
и
потом
следует распределению хи-квадрат с . По данным таблицы 3 значимая связь существует на уровне 0,1%. Холдейна[17] модификация применяется к случаю, когда любой из равно нулю, где и заменены на
и
соответственно.
Болезнь | Аллель HLA | Относительный риск (%) | FAD (%) | ФАП (%) | |
---|---|---|---|---|---|
Анкилозирующий спондилоартрит | B27 | 90 | 90 | 8 | 0.89 |
Реактивный артрит | B27 | 40 | 70 | 8 | 0.67 |
Спондилит при воспалительном заболевании кишечника | B27 | 10 | 50 | 8 | 0.46 |
Ревматоидный артрит | DR4 | 6 | 70 | 30 | 0.57 |
Системная красная волчанка | DR3 | 3 | 45 | 20 | 0.31 |
Рассеянный склероз | DR2 | 4 | 60 | 20 | 0.5 |
Сахарный диабет 1 типа | DR4 | 6 | 75 | 30 | 0.64 |
В таблице 4 представлены некоторые примеры ассоциации между аллелями HLA и заболеваниями.[13]
(1a) Превышение частоты аллелей среди пациентов по сравнению с контрольной группой
Наблюдались даже высокие относительные риски между аллелями HLA и заболеваниями, только величина относительного риска не могла определить силу ассоциации.[14] значение выражается
где и - частоты аллелей HLA среди пациентов и здоровых популяций соответственно.[14] В таблице 4 столбец был добавлен в эту цитату. Если отложить в сторону 2 болезни с высоким относительным риском, обе из которых также имеют высокий значения, среди других заболеваний, ювенильный сахарный диабет (тип 1) имеет сильную связь с DR4 даже при низком относительном риске.
(2) Расхождения с ожидаемыми значениями из предельных частот в таблице ассоциаций 2 × 2 аллелей HLA и заболевания
Это может быть подтверждено расчет теста
где . Для данных с небольшим размером выборки, например, без предельного итога больше 15 (и, следовательно, ) следует использовать Поправка Йетса на непрерывность или Точный тест Фишера.[18]
Ресурсы
Сравнение различных показателей LD предоставлено Devlin & Risch.[19]
В Международный проект HapMap позволяет изучать LD в человеческих популяциях онлайн. В Ансамбль проект объединяет данные HapMap с другой генетической информацией из dbSNP.
Программное обеспечение для анализа
- PLINK - набор инструментов для анализа ассоциации всего генома, который, помимо прочего, может рассчитывать LD
- LDHat
- Haploview
- LdCompare[20]- ПО с открытым кодом для расчета LD.
- SNP и Variation Suite - коммерческое программное обеспечение с интерактивным графиком LD.
- ЗОЛОТО - Графический обзор неравновесия сцепления
- ТАССЕЛЬ - программное обеспечение для оценки неравновесия по сцеплению, ассоциаций признаков и эволюционных паттернов
- rAggr - находит прокси-маркеры (SNP и инделки), которые находятся в неравновесном сцеплении с набором запрошенных маркеров, используя Проект 1000 геномов и HapMap базы данных генотипов.
- СНЕП - Быстрое вычисление LD и Ne для больших наборов данных генотипа в формате PLINK.
- LDlink - Набор веб-приложений для простого и эффективного изучения неравновесия по связям в подгруппах населения. Все данные о генотипе популяции взяты из фазы 3 проекта «1000 геномов», а номера вариантов RS индексируются на основе сборки 151 dbSNP.
Программное обеспечение для моделирования
- Гаплоидный - а C библиотека для популяционного генетического моделирования (GPL )
Смотрите также
- Haploview
- Принцип Харди – Вайнберга
- Генетическая связь
- Коадаптация
- Генеалогический ДНК-тест
- Тег SNP
- Сопоставление ассоциаций
- Отображение QTL на основе семейства
использованная литература
- ^ а б c Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего». Природа Обзоры Генетика. 9 (6): 477–485. Дои:10.1038 / nrg2361. ЧВК 5124487. PMID 18427557.
- ^ Фалконер, Д.С. Маккей, TFC (1996). Введение в количественную генетику (4-е изд.). Харлоу, Эссекс, Великобритания: Эддисон Уэсли Лонгман. ISBN 978-0-582-24302-6.
- ^ Слаткин, Монтгомери (июнь 2008 г.). «Неравновесие сцепления - понимание эволюционного прошлого и картирование медицинского будущего». Природа Обзоры Генетика. 9 (6): 477–485. Дои:10.1038 / nrg2361. ISSN 1471-0056. ЧВК 5124487. PMID 18427557.
- ^ Калабрезе, Барбара (2019-01-01), Ранганатан, Шоба; Грибсков Михаил; Накаи, Кента; Шенбах, Кристиан (ред.), «Неравновесие сцепления», Энциклопедия биоинформатики и вычислительной биологии, Oxford: Academic Press, стр. 763–765, Дои:10.1016 / b978-0-12-809633-8.20234-3, ISBN 978-0-12-811432-2, получено 2020-10-21
- ^ Левонтин, Р. К. (1964). «Взаимодействие выбора и связывания. I.Общие Соображения; гетеротические модели ". Генетика. 49 (1): 49–67. ЧВК 1210557. PMID 17248194.
- ^ Роббинс, Р. Б. (1 июля 1918 г.). «Некоторые приложения математики к задачам разведения III». Генетика. 3 (4): 375–389. ЧВК 1200443. PMID 17245911.
- ^ R.C. Левонтин и К. Кодзима (1960). «Эволюционная динамика сложных полиморфизмов». Эволюция. 14 (4): 458–472. Дои:10.2307/2405995. ISSN 0014-3820. JSTOR 2405995.
- ^ а б Свейгаард А., Хауге М., Джерсилд С., Плаз П., Райдер Л. П., Стауб Нильсен Л., Томсен М. (1979). Система HLA: вводный обзор, 2-е изд. Базель; Лондон; Чичестер: Каргер; Распространяется Wiley, ISBN 3805530498(PBK).
- ^ а б c d Фогель Ф, Мотульский А.Г. (1997). Генетика человека: проблемы и подходы, 3-е изд.Берлин; Лондон: Спрингер, ISBN 3-540-60290-9.
- ^ Миттал К.К., Хасегава Т., Тинг А., Микки М.Р., Терасаки П.И. (1973). «Генетические вариации в системе HL-A между айнами, японцами и кавказцами», В Дауссет Дж., Коломбани Дж., Ред. Тестирование гистосовместимости, 1972 г., стр. 187–195, Копенгаген: Munksgaard, ISBN 87-16-01101-5.
- ^ Yasuda, N; Цудзи, К. (июнь 1975 г.). «Метод подсчета максимальной вероятности для оценки частоты гаплотипов в системе HL-A». Дзинруй Иденгаку Засши. 20 (1): 1–15. PMID 1237691.
- ^ а б c d Миттал, К.К. (1976). «Полиморфизм HLA и подверженность болезням». Vox Sang. 31?-73 (3): 161–73. Дои:10.1111 / j.1423-0410.1976.tb02206.x. PMID 969389.
- ^ а б c Грегерсен П.К. (2009). «Генетика ревматических заболеваний», ВФайрстейн Г.С., Бадд Р.С., Харрис Э.Д. младший, Макиннес И.Б., Радди С., Серджент Дж. С., ред. (2009). Учебник ревматологии Келли, стр. 305-321, Филадельфия, Пенсильвания: Saunders / Elsevier, ISBN 978-1-4160-3285-4.
- ^ а б c Bengtsson, BO; Томсон, Г. (ноябрь 1981 г.). «Измерение силы ассоциаций между антигенами HLA и заболеваниями». Тканевые антигены. 18 (5): 356–63. Дои:10.1111 / j.1399-0039.1981.tb01404.x. PMID 7344182.
- ^ а б Nijenhuis, LE (сентябрь 1977 г.). «Генетические соображения о связи между HLA и заболеванием». Гм. Genet. 38 (2): 175–82. Дои:10.1007 / bf00527400. PMID 908564.
- ^ Вульф, Б. (июнь 1955 г.). «Об оценке связи между группой крови и заболеванием». Анна. Гм. Genet. 19 (4): 251–3. Дои:10.1111 / j.1469-1809.1955.tb01348.x. PMID 14388528.
- ^ Холдейн, JB (май 1956). «Оценка и значение логарифма отношения частот». Анна. Гм. Genet. 20 (4): 309–11. Дои:10.1111 / j.1469-1809.1955.tb01285.x. PMID 13314400.
- ^ Сокал Р.Р., Рольф Ф.Дж. (1981). Биометрия: принципы и практика статистики в биологических исследованиях. Оксфорд: W.H. Фриман, ISBN 0-7167-1254-7.
- ^ Devlin B .; Риш Н. (1995). «Сравнение показателей неравновесия сцепления для мелкомасштабного картирования» (PDF). Геномика. 29 (2): 311–322. CiteSeerX 10.1.1.319.9349. Дои:10.1006 / geno.1995.9003. PMID 8666377.
- ^ Ха, хорошо.; Di X .; Коули С. (2007). «LdCompare: быстрое вычисление одно- и множественных маркеров r2 и генетического покрытия». Биоинформатика. 23 (2): 252–254. Дои:10.1093 / биоинформатика / btl574. PMID 17148510.
дальнейшее чтение
- Хедрик, Филип В. (2005). Генетика популяций (3-е изд.). Садбери, Бостон, Торонто, Лондон, Сингапур: издательство «Джонс и Бартлетт». ISBN 978-0-7637-4772-5.
- Библиография: Анализ неравновесного сцепления : библиография из более чем тысячи статей о неравновесном сцеплении, опубликованных с 1918 года.