C16orf90 - C16orf90

C16orf90 или же хромосома 16 открытая рамка считывания 90 продуцирует не охарактеризованный белок C16orf90 у homo sapiens.[1] Белок C16orf90 имеет четыре предсказанных альфа-спиральных домена[2][3][4][5] и слабо выражается в семенниках[6][7] и слабо выражена по всему телу.[8] Хотя функция C16orf90 еще недостаточно изучена научным сообществом, есть подозрения, что он участвует в биологической реакции на стресс и апоптоз на основе данных экспрессии с микрочипов[9] и данные посттрансляционной модификации.[10][11]

Хромосома 16

Ген

C16orf90 или открытая рамка считывания 90 хромосомы 16 не имеют псевдонимов[12] и охватывает 3169 нуклеотидов от 3 493 484 до 3 496 652 на коротком плече хромосомы 16.[7] Он расположен в позиции 16p13.3 на обратной нити.[1] Существует 3 экзона, а цепь мРНК содержит 972 пары оснований. Белок C16orf90 имеет длину 182 аминокислоты.[13]

Экзоны

C16orf90 содержит 3 области экзона и 2 области интрона. Границы экзонов находятся между аминокислотами 30 и 31 и 147 и 148.[14] Первый экзон плохо консервативен, но экзоны 2 и 3 очень консервативны.[15]

C16orf90 маркирован на хромосоме 16 в 16p13.3

Протеин

C16orf90 имеет молекулярную массу 21 кДа и щелочную изоэлектрическую точку 9,2.[16] Это растворимый белок.[17]

Стенограммы

Существует 3 изоформы C16orf90.[1] Это не охарактеризованная изоформа a белка C16orf90 (197aa), продуцирующая все 3 экзона, не охарактеризованная изоформа b C16orf90 (175aa), продуцирующая 2-й и 3-й экзоны, и не охарактеризованная изоформа C16orf90 c (95aa), продуцирующая последние 95 аминокислот C16orf90.[1]

Выражение

C16orf90 имеет относительно высокую тканевую экспрессию в яичках.[6][7] и очень низкая (0,213) экспрессия во всех других тканях[8] у здоровых людей.[9] В стрессовых условиях C16orf90, по-видимому, активирован на графиках, найденных в NCBI Geo.[9]

Субклеточное расположение

Ядро является наиболее вероятным домом для белка, продуцируемого C16orf90.[18] и не является трансмембранным белком.[19] Эти результаты были подтверждены путем сравнения результатов для гомологичных белков C16orf90 мыши и дельфина.

Структура

Вторичная структура

мРНК

Вторичная структура мРНК, обнаруженная с помощью RNAfold, по-видимому, демонстрирует сродство от среднего до высокого к структуре, полученной с помощью витков стержень-петля и шпилька. Только две области указали на низкую вероятность образования вторичной структуры.[20]

Протеин

Белок C16orf90 содержит 4 альфа-спирали[4] и никаких бета-листов со спиралями, вероятно, соединяющими спирали.[2][3] Эти спирали примерно одинаково расположены по всему белку.[5] Сигнал ядерной локализации[21] было идентифицировано, а также четыре домена альфа-спирали[22] которые помогают определить вторичную структуру C16orf90s.

Схема гена C16orf90[23]

Третичная структура

Третичная структура C16orf90 включает линейные[5] альфа-спирали, разделенные неупорядоченной или спиральной областью.[24]

Регулирование

Промоутер

Использование Genomatix[25] Инструмент Gene2Promoter, C16orf90, как было обнаружено, имеет 4 возможные промоторные последовательности. Набор промоторов 3, GXP_644807, является промотором для обратной цепи, поскольку он содержит наибольшее количество тегов CAGE, выровненных по 5'-концу гена и содержит правильный GeneID.

Регулирование уровня протеина

А сигнал ядерной локализации (NLS) на С-конце белка из 173-197 поддерживает предсказание субклеточной локализации.[26][18]

Пост-трансляционные модификации

Фосфорилированиевстречается у многих аминокислот на C16orf90.[10] Красные маркеры на схеме белка указывают на вероятные сайты фосфорилирования. NetPhos, предсказатель сайтов фосфорилирования, вернул множество сайтов, включая аминокислоты 16, 34, 56, 63, 67, 86, 130, 144, 147, 148, 150, 151, 152, 153, 165, 167, 174, 177, 189. , и 191.[10]

А Сайт связывания CTCF (CCCTC-связывающий фактор) представляет собой фактор транскрипции из 11-цинковых пальцев, который обычно подавляет транскрипцию.[12] Существует одно указанное место для этого сайта связывания на белке C16orf90.[27] и его эффекты могут способствовать низким уровням экспрессии C16orf90.

O-GlcNAc места подавляют фосфорилирование. C16orf90 содержит две сериновые аминокислоты, которые являются домом для потенциальных сайтов O-GlcNAc в 34 и 144.[11] Сайты O-GlcNAc конкурируют с фосфорилированием за контроль сайта активации белка, поэтому в C16orf90 это свойство может инактивировать белок до тех пор, пока в нем не возникнет серьезная необходимость, а затем его можно будет активировать.

NetGlycate[28]гликирование инструмент прогнозирования) обнаружил 2 остатка лизина в аминокислотах 70 (0,709) и 158 (0,595), которые предсказывают гликирование места. Сайты гликирования добавляют сахара к лизинам посттрансляционно и могут быть необходимы для фолдинга или стабильности белка.[29]

Существует сайт расщепления расположен между 172R и 173K на белке C16orf90.[21][30] В этом месте также начинается сигнал ядерной локализации, что указывает на то, что NLS может быть расщеплен, чтобы, возможно, удалить белок из ядра или когда белок требует деградации.

Гомология и эволюция

Ортологи C16orf90 имеют относительно высокую частоту мутаций, как видно на графике справа при сравнении C16orf90 с фибринопептидами, гемоглобином и цитохромом C.[31]

Частота мутации C16orf90 по сравнению с фибринопептидами, гемоглобином и цитохромом c.

В ортологи сортируются по возрастанию даты расхождения и сходства последовательностей. C16orf90 ограничен млекопитающими, но обнаружен у однопроходных и сумчатых животных, что указывает на то, что ген вошел в геном около 180 миллионов лет назад.[32]

РодРазновидностьРаспространенное имяТаксономическая группаДата расхождения (MYA)Регистрационный номерДлина последовательности (AA)Идентичность последовательности для человекаСходство последовательности с человеческим
ГомоsapiensЛюдиПриматы0.00XP_024306160.1197100.00%100.00%
ГориллагориллаГориллаПриматы8.6XP_00405713918582.00%82.50%
MusMusculusМышьRodentia89NP_082760.217163.50%66.50%
БизонзубрБизонПарнокопытное животное94XP_01083868218665.50%69.00%
ЗалофускалифорнийскийМорской левХищник94XP_027973424.118565.2069.10%
Canis lupus
фамильярСобакаХищник94XP_003434913.2 21464.50%69.60%
EquusCaballusЛошадьОдноногие копытные94XP_001502184.118363.70%67.60%
SorexАранейОбыкновенная бурозубкаСорикоморф94XP_004600963.132063.87%70.00%
Ациноникс
jubatusГепардХищник94XP_02689921122561.90%67.30%
Птеропус
вампирБольшая летучая лисицаРукокрылые94XP_023376984.122461.80%64.50%
LagenorhynchusкосойТихоокеанский белобокий дельфинПарнокопытные94XP_02697416019254.30%58.00%
ДасипусnovemcinctusДевятиполосный броненосецCingulata102XP_004474400.118561.30%67.20%
OrycteropusаферТрубкозубTubulidentata102.00XP_007937762.118559.80%65.70%
МонодельфисDomesticaСерый короткохвостый опоссумСумчатый160.00XP_001363889.118753.80%60.50%
PhascolarctosсинереусКоалаСумчатый160.00XP_020851162.118753.10%60.20%
ОрниторинханатинУтконосMonotreme180.00XP_016082126.221633.90%40.40%

Клиническое значение

В ходе исследований последовательность была идентифицирована как содержащая возможный патогенный рецессивный вариант (K53N) для различных интеллектуальных нарушений среди 31 других.[33] Предполагается, что белок является адаптером / кофактором, который связывается с другими молекулами. В этом случае негомологичная замена может изменить связывание с другими молекулами и потенциально вызвать умственную отсталость, паховую грыжу, выпуклость волос спереди, макротию, высокое небо, гипертонию, гиперрефлексию, аномалии головного мозга или дефицит витамина D.[33]

Рекомендации

  1. ^ а б c d «Нуклеотид NCBI». Национальный центр биотехнологической информации. Получено 5 февраля, 2020.
  2. ^ а б Чжоу, Питер; Фасман, Джеральд Д. (1989), "Предсказание Чоу-Фасмана вторичной структуры белков", Прогнозирование структуры белка и принципы конформации белка, Springer, США, стр. 391–416, Дои:10.1007/978-1-4613-1571-1_9, ISBN  978-1-4612-8860-2
  3. ^ а б Праби-Герланд. «Прогноз вторичной структуры GOR4». npsa-prabi.ibcp.fr. Получено 2020-05-01.
  4. ^ а б «Прогноз вторичной структуры SOPMA». npsa-prabi.ibcp.fr. Получено 2020-05-01.
  5. ^ а б c «Сервер I-TASSER для предсказания структуры и функции белков». zhanglab.ccmb.med.umich.edu. Получено 2020-05-01.
  6. ^ а б «Краткое описание экспрессии белка C16orf90 - Атлас белков человека». www.proteinatlas.org. Получено 2020-05-01.
  7. ^ а б c «C16orf90 [Homo sapiens] - Ген - NCBI». www.ncbi.nlm.nih.gov. Получено 2020-05-01.
  8. ^ а б "AceView: Gene: C16orf90". www.ncbi.nlm.nih.gov. Получено 2020-05-01.
  9. ^ а б c "C16orf90 - Профили GEO - NCBI". www.ncbi.nlm.nih.gov. Получено 2020-05-01.
  10. ^ а б c «NetPhos 3.1: средство прогнозирования фосфорилирования». www.cbs.dtu.dk. Получено 2020-05-01.
  11. ^ а б "YinOYang 1.2: прогнозирование местоположения O-ß-GlcNAc". www.cbs.dtu.dk. Получено 2020-05-01.
  12. ^ а б "Ген C16orf90 - GeneCards | Белок CP090 | Антитело CP090". www.genecards.org. Получено 2020-05-01.
  13. ^ «C16orf90 [Homo sapiens] - белок - NCBI». www.ncbi.nlm.nih.gov. Получено 2020-05-01.
  14. ^ «Ген: C16orf90 - Резюме - Homo sapiens - Обозреватель генома ансамбля». useast.ensembl.org. Получено 2020-05-01.
  15. ^ "Класталь Омега". Выравнивание нескольких последовательностей. EMBL-EBI. Получено 17 февраля, 2020.
  16. ^ "Compute pI / Mw Tool". ExPASy. Портал ресурсов по биоинформатике. Получено 14 апреля, 2020.
  17. ^ «SOSUI: Прогноз растворимости». harrier.nagahama-i-bio.ac.jp. Получено 2020-05-01.
  18. ^ а б «Прогноз PSORT II k-NN». psort.hgc.jp. Получено 2020-05-01.
  19. ^ «TMHMM 2.0: прогнозирование трансмембранного домена». www.cbs.dtu.dk. Получено 2020-05-01.
  20. ^ «РНКфолд». Веб-службы Венской РНК. Universitat Wien. Получено 26 апреля, 2020.
  21. ^ а б ELM. "Ресурс эукариотических линейных мотивов". Ресурс Eukaryotic Linear Motif.
  22. ^ "ПРАБИ". Прогнозирование вторичной структуры SOPMA.
  23. ^ "ПРОСТА". prosite.expasy.org. Получено 2020-05-01.
  24. ^ «ФИРЭ2». Механизм распознавания гомологии / аналогии белков.
  25. ^ «Genomatix: поиск и анализ промоутеров». www.genomatix.de. Получено 2020-05-01.
  26. ^ "ELM - ресурс Eukaryotic Linear Motif". elm.eu.org. Получено 2020-05-01.
  27. ^ «Ген: C16orf90 - Резюме - Homo sapiens - Обозреватель генома ансамбля». uswest.ensembl.org. Получено 2020-05-01.
  28. ^ "NetGlycate 1.0: Прогнозирование места гликирования". www.cbs.dtu.dk. Получено 2020-05-01.
  29. ^ Бансоде, Снеха; Баштанова, Ульяна; Ли, Руи; Кларк, Джонатан; Мюллер, Карин Х .; Пушкарска, Анна; Гольдберга, Иева; Chetwood, Holly H .; Рид, Дэвид Дж .; Колвелл, Люси Дж .; Скеппер, Джереми Н. (25 февраля 2020 г.). «Гликация изменяет молекулярную организацию и распределение заряда в фибриллах коллагена I типа». Научные отчеты. 10 (1): 3397. Bibcode:2020НатСР..10.3397Б. Дои:10.1038 / s41598-020-60250-9. ISSN  2045-2322. ЧВК  7042214. PMID  32099005.
  30. ^ "ProP 1.0 Предиктор сайта расщепления протопептида". www.cbs.dtu.dk. Получено 2020-05-01.
  31. ^ "Ортологи C16orf90". Ген NCBI.
  32. ^ "Дерево времени, расхождение жизни". TimeTree. Получено 23 февраля, 2020.
  33. ^ а б Анази, С. «Клиническая геномика расширяет патологический геном умственной отсталости и предлагает высокую диагностическую ценность». Молекулярная психиатрия. Природа. PMID  27431290. Получено 26 апреля, 2020.