litceysel.ru
добавить свой файл
1
Курсовая работа


студентки факультета биоинженерии и биоинформатики

МГУ им. М. В. Ломоносова

Александры Рязановой.

Тема:

Сравнение белковых последовательностей

рецепторов к простагландинам

и их изменение в процессе филогенеза.

Тьютор – д.х.н. Алевтина Трофимовна Мевх


Постановка задачи

Создание высокоселективных лигандов к рецепторам простагландинов

Простагландины участвуют в процессах воспаления, поддерживают сердечно-сосудистый гомеостаз. Отклонение их содержания в любую сторону от базового уровня является патологическим. Рецепторы к ним находятся на плазматической мембране и относятся к классическим G-белок-связывающим рецепторам. В настоящее время высокоселективные агонисты к простагландиновым рецепторам отсутствуют. Создание таких агонистов (или антагонистов) позволит разработать новые терапевтические стратегии по «точечному» изменению эффектов простагландинов. Для этого необходимы трехмерные модели этих рецепторов; а так как данных рентгеноструктурного анализа для них нет, большое значение приобретают биоинформатические методы исследования.

Выявление консервативных мотивов в лиганд-связывающем участке рецептора позволяет теоретически смоделировать его трехмерную структуру. Также возможно моделирование на основе уже известной трехмерной структуры другого белка, если его аминокислотная последовательность окажется достаточно похожей на последовательность нашего белка.


Реферат по теме: Простаноиды и рецепторы к ним


Простагландины и тромбоксаны.

Простагландины (PG) — это вещества с очень высокой биологической активностью. Синтезируются они почти во всех клетках организма. Спектр их действия необычайно широк: они контролируют сокращения гладкой мускулатуры (кровеносных сосудов, бронхов, матки), принимают участие в высвобождении продуктов внутриклеточного синтеза (гормонов, соляной кислоты, мукоидов), оказывают влияние на метаболизм костной ткани, периферическую нервную систему, иммунную систему, передвижение и агрегацию клеток (лейкоцитов и тромбоцитов), являются эффективными лигандами болевых рецепторов. Как правило, в одном типе клеток синтезируется один тип простагландинов, а в органе или ткани проявляется действие пары простагландинов-антагонистов, от соотношения концентраций которых зависит нормальное или патологическое состояние органа или ткани [1].


PG и тромбоксаны (TX) являются производными арахидоновой и дигаммагомолиноленовой кислот и называются простаноидами. У PGI есть и другое название — простациклин.

Далее рассматриваются рецепторы к 5 основным простаноидам: PGE2, PGF2, PGD2, PGI2 и TXA2.

Каждый простаноид связывается лучше всего с определенным видом рецепторов, названным в соответствии с этим (см. далее). Но пространственное строение разных простаноидов очень схоже, поэтому они способны связываться и с рецепторами «чужого» вида, хотя и с меньшим сродством.


Простаноидные рецепторы (PG-рецепторы).

PG взаимодействуют с G-белок-связывающими рецепторами, которые носят названия EP, FP, IP, TP и DP в зависимости от того, с какими простаноидами они связываются. Для PGE существуют 4 различных рецептора (подтипы EP1 – EP4), каждый из которых кодируется отдельным геном; связывание PGE с разными подтипами рецепторов обеспечивает различные (иногда противоположные) эффекты. Для каждого из PG-рецепторов были осуществлены клонирование и экспрессия соответствующего гена, охарактеризован белок [2].

G-белки (гуаниннуклеотидсвязывающие регуляторные белки) ответственны за передачу сигналов множества гормонов и нейромедиаторов к разнообразным мишеням клетки. Каждый из них имеет уникальные мишени. Два из них (Gi и Gs) контролиуют активность аденилатциклазы — фермента, катализирующего образование цАМФ. Gs-белки активируют аденилатциклазу, Gi-белки ее ингибируют. Среди PG-рецепторов есть связывающиеся и с Gs-белками, и с Gi-белками. G-белки прочно связаны с плазматической мембраной, но не являются трансмембранными [3].

PG-рецепторы содержат 7 гидрофобных трансмембранных сегментов, структура которых является типичной для всех G-белок-связывающих рецепторов (рис. 1 – 3). Эти трансмембранные сегменты, соединенные тремя внутри- и тремя внеклеточными петлями, образуют центральный домен рецептора. Переход конформации рецептора из неактивной в активную связан, по-видимому, с изменением пространственной ориентации 3-го и 6-го трансмембранных участков друг относительно друга. При этом изменяется конформация 2-ой и 3-ей внутриклеточных петель, которые важны для узнавания и активации G-белка; участок, с которым связывается G-белок, открывается для связывания [4].


В результате альтернативного сплайсинга у рецепторов, принадлежащих к одному типу, могут различаться внутриклеточные С-концы (это характерно для TP, FP, EP1 и EP3 рецепторов).

Строение EP4-рецептора человека схематично представлено на рис. 1 – 3. Положение и длина трансмембранных фрагментов, а также наличие дисульфидного мостика показаны в соответствии с данными из базы SwissProt.

PG-рецепторы принадлежат к семейству A, или классу А, G-белок-связывающих рецепторов (семейству родопсина). По данным филогенетических исследований это семейство разбивается на 5 эволюционно консервативных групп, PG-рецепторы относятся к 5-ой из них, вместе с многими другими веществами, выполняющими эндокринные, аутокринные и паракринные функции (трипептидами, гормонами гипофиза, гликопротеиновыми гормонами, опиоидами и фактором активации тромбоцитов). Особенно близки PG-рецепторы к семейству рецепторов вазопрессина. Несмотря на то, что вазопрессин является белком, его рецепторы оказываются ближе к PG-рецепторам, чем рецепторы, связывающиеся с низкомолекулярными лигандами (например, адреналином — производным тирозина) [2].

Передача сигнала PG-рецепторами осуществляется двумя различными путями: через стимуляцию фосфолипазы С с образованием инозиттрифосфата и диацилглицерина или через ингибирование аденилатциклазы.

Внутри семейства PG-рецепторов последовательности похожи на 20 – 30 %, 65 аминокислотных остатков консервативны. 34 аминокислотных остатка идентичны (абсолютно консервативны) для этого семейства; 14 из них — для всех G-белок-связывающих рецепторов, остальные 20 характерны только для PG-рецепторов. Большинство этих консервативных остатков («подписи» PG-рецепторов) располагаются внутри трансмембранных сегментов, хотя заметная часть их находится во 2-ой внеклеточной петле. В связывании лиганда участвуют и трансмембранные, и внеклеточные сегменты. Большинство работ, посвященных связыванию лиганда, показывает, что лиганд-связывающие участки PG-рецепторов можно объединить в один класс [2].


Важная черта PG-рецепторов — это существование альтернативно сплайсированной мРНК для 4 из 8 PG-рецепторов: TP, FP, EP1 и EP3. У всех них альтернативный сплайсинг наблюдается во внутриклеточном С-конце. Это не влияет на характеристики, касающиеся связывания лиганда, но влияет на специфичность связывания PG-рецептора с G-белком [2].

На данный момент G-белок-связывающие рецепторы исследуются очень активно. Это необходимо для фармацевтических целей: более 50 % существующих сегодня медикаментов действуют на G-белок-связывающие рецепторы [7]. Моделирование трехмерной структуры PG-рецепторов нужно для создания эффективных агонистов или антагонистов к этим рецепторам. К сожалению, кристаллизация трансмембранных белков — очень сложная задача, поэтому рентгеноструктурный анализ PG-рецепторов пока не сделан.

Молекулярная масса PG-рецепторов достаточно велика (превышает 39 кДа). Поэтому для теоретического моделирования трехмерной структуры этих рецепторов желательно выяснить, какие части молекулы участвуют в узнавании и связывании лиганда, чтобы моделировать только их. Для этого можно воспользоваться биоинформатическими методами: так как все простаноиды способны связываться со всеми типами PG-рецепторов, можно предположить, что аминокислотные последовательности PG-рецепторов достаточно схожи между собой. Это значит, что наиболее консервативные участки будут наиболее важны для поддержания конформации и связывания с лигандом.

Возможно построение трехмерной структуры PG-рецепторов на основе данных рентгеноструктурного анализа другого белка — в данном случае, родопсина быка. Но необходимо подтверждение правомерности такого подхода: доказательство того, что структура этих белков достаточно сходна. Для этого требуется, в частности, сравнение их аминокислотных последовательностей.

Кроме того, может быть полезным изучение аминокислотных последовательностей внутриклеточных фрагментов PG-рецепторов, так как эти фрагменты участвуют в связывании рецептора с G-белком. Можно предположить, что будет найдена группа консервативных аминокислотных остатков, расположенных в определенной части белка и ответственных за поддержание определенной структуры, необходимой для связывания с G-белком. С одним и тем же типом G-белка могут связываться разные рецепторы; в то же время PG-рецепторы разных типов, лиганды которых достаточно близки друг к другу, связываются с разными типами G-белков. Это значит, что важные для связывания с G-белком участки не входят в состав лиганд-связывающих участков.


На данный момент наиболее изученным из рецепторов к простагландину E2 является EP3-рецептор [2, 5, 6], имеющий 5 изоформ за счет альтернативного сплайсинга. Наименее охарактеризованным по свойствам и функциям из этой группы рецепторов является белок ЕР4-рецептора, который и является основным предметом нашего исследования. Основное сравнение проводится с EP3-рецептором.

ЕР4-рецептор человека — это белок из 488 аминокислотных остатков, его молекулярная масса составляет 53119 Да. В базе данных Swiss-Prot его ID — PE24_HUMAN; Accession number — P35408. Связывается он с Gs-белком.


1. Методы исследования

1.1. Частота встречаемости аминокислот в белках PG-рецепторов по сравнению с среднестатистической встречаемостью в белках человека. Сделано с помощью программы compseq пакета EMBOSS.

1.2. Поиск гомологичных белковых последовательностей проведен с помощью программ BLAST и PSI-BLAST (обе — с сервера NCBI) в базе данных SwissProt.

1.3. Множественные выравнивания белковых последовательностей сделаны с помощью программы ClustalW пакета EMBOSS. Парные выравнивания сделаны аналогично. Полученные множественные выравнивания потребовали дальнейшего редактирования вручную в программе GeneDoc.

1.4. Филогенетические деревья построены с помощью программ protdist, neighbor и drawgram из пакета программ PHYLIP (c сервера Института Пастера). Для визуализации 2 деревьев, вставленных в данный текст (на рис. 4 и 5) использована программа TreeView.


1.5. Информация о доменной структуре белка взята из базы данных Pfam.

1.6. Сравнение полученных результатов с базой данных по G-белок-связывающим рецепторам — GPCRDB (http://www.gpcr.org).


2. Результаты и обсуждение



2.1. Изучение белковых последовательностей простаноидных рецепторов.


2.1.1. Средняя частота встречаемости аминокислотных остатков в EP4-рецепторе человека, всех PG-рецепторах человека и вообще всех белках человека представлена в таблице 1.


Таблица 1.

Средняя частота встречаемости аминокислотных остатков в EP4-рецепторе человека, всех PG-рецепторах человека и вообще всех белках человека





Частота встречаемости а/к, %

А/к

в pe24_human

в PG-рецепторах человека

в белках человека

L

12,7

14,6

9,8


S

12,1

9,8

7,9

A

7,8

10,2

7,1

V

7,2

7,0

6,2

G

6,8

7,2

6,8

R

6,6

7,1

5,5

T

5,9

5,2

5,3

I

5,7

4,2

4,4

P

4,9

4,9

1,6

F

3,9


4,9

3,8

E

3,9

2,9

7,0

Q

3,5

3,2

4,6

D

3,1

2,2

4,9

N

2,9

2,4

3,7

Y

2,9

2,3

2,8

C

2,7

3,4

2,3

K

2,7

2,1

5,7

M

2,3

2,8

2,2

H


1,8

1,9

2,5

W

0,8

1,8

1,2

U

0,0

0,0

0,0

Из приведенных данных видно, что и в PG-рецепторах, и во всех белках человека наиболее часто встречаются 3 аминокислоты: лейцин, серин и аланин. Их частоты для EP4-рецептора и для PG-рецепторов (лейцина — 12,7 % и 14,6 %, серина — 12,1 % и 9,8 %, аланина — 7,8 % и 10,2 %, соответственно) заметно превышают среднестатистические для человека (9,8 %, 7,9 % и 7,1 %).

Если бы все аминокислоты встречались одинаково часто, доля каждой из них была бы равна 4,8 %. В EP4-рецепторе человека с частотой, большей этого значения, встречаются лейцин, серин, аланин, валин, глицин, аргинин, треонин, изолейцин и пролин (перечислены в порядке убывания частоты). Во всех PG-рецепторах человека с частотой, превышающей это значение, встречаются те же аминокислоты, за исключением изолейцина, и фенилаланин. Среднестатистические же результаты для всех белков человека показывают, что частота, большая, чем 4,8 %, характерна для всех вышеназванных аминокислот, за исключением изолейцина и фенилаланина, а также для глутаминовой кислоты, лизина и аспарагиновой кислоты.

Глутаминовая кислота, лизин и аспарагиновая кислота — гидрофильные аминокислоты, а изолейцин и фенилаланин — гидрофобные. Из трех наиболее частых аминокислот лейцин и аланин — также гидрофобные. То есть количество гидрофильных аминокислотных остатков в PG-рецепторах (трансмембранных белках), как и ожидалось, меньше среднестатистического; а количество гидрофобных — больше.



2.1.2. Для выявления консервативных участков в белковых последовательностях PG-рецепторов проведено их множественное выравнивание.

Множественное выравнивание сделано для близких гомологов EP3-рецептора человека. Для этого с помощью программы BLAST получен список из 34 белков; все они принадлежат млекопитающим (человек, обезьяна, собака, мышь, крыса, кролик, бык и свинья). E Value для этих белков — не более 2*10 –15; остальные белки, предложенные программой BLAST в качестве возможных гомологов, имели E Value не менее 4*10 –5. В число этих 34 белков входят все PG-рецепторы, лежащие в SwissProt (и только они). Проведено выравнивание их аминокислотных последовательностей.

Сравнение сделанного автоматически выравнивания с представленным в базе данных показало, что результаты значительно различаются (в выравнивании, выставленном в Интернете, больше консервативных аминокислотных остатков). От сведений, приведенных в статье [2], оно также отличалось меньшим чилом консервативных аминокислотных остатков. А авторы статьи [9] предупреждали, что автоматические программы плохо справляются с выравниванием большого числа трансмембранных белков. Поэтому было проведено редактирование выравнивания вручную в программе GeneDoc.

Мутации в трансмембранных участках (α-спиралях) менее вероятны, чем во вне- или внутриклеточных участках, поэтому при выравнивании трансмембранных белков стоит опираться прежде всего на консервативные аминокислоты в α-спиралях как на более достоверные. В основе редактирования лежал поиск мотивов, приведенных в статье [10], которые встречаются у большинства представителей семейства родопсиновых рецепторов (так называемых “отпечатков пальцев” — fingerprints):


  • G72N100 — в 1-ом трансмембранном участке;

  • L92XXXD91 — во 2-ом трансмембранном участке;
  • C94(17X)L79(5X)D80R98Y74 — в 3-ем трансмембранном участке и начале 2-ой внутриклеточной петли;


  • W86 — в 4-ом трансмембранном участке;

  • F49XXP77(7X)Y89 — в 5-ом трансмембранном участке;

  • F80XXC76W58XP73 — в 6-ом трансмембранном участке и

  • N86P97 — в 7-ом трансмембранном участке.

В этом списке нижние индексы — это проценты консервативности соответствующих аминокислотных остатков.

D во 2-ом трансмембранном участке, а также DRY (или ERW) в 3-ем трансмембранном участке и начале 2-ой внутриклеточной петли важны для активации рецептора. Они консервативны для всего семейства А и не консервативны для других семейств G-белок-связывающих рецепторов. Это позволяет считать, что изменение конформации центрального домена или процессы, приводящие к данному изменению конформации, различны для разных семейств [4].

Не все вышеперечисленные мотивы встречались у PG-рецепторов точно в таком виде. Непосредственно для PG-рецепторов абсолютно консервативными мотивами являются следующие:

  • GXXXNXXA — в 1-ом трансмембранном участке;

  • LXXXDXXG — во 2-ом трансмембранном участке;

  • L(8X)MXXE — в 3-ем трансмембранном участке;

  • LP — в 4-ом трансмембранном участке;

  • N(6X)L — в 5-ом трансмембранном участке;

  • CXXP — в 6-ом трансмембранном участке и

  • R(6X)IXDPW(5X)R — в 7-ом трансмембранном участке.

После такого редактирования число консервативных аминокислотных остатков увеличилось до 27. Они расположены

  • во всех 7 трансмембранных участках;

  • в 1-ой внутриклеточной петле;

  • в 1-ой внеклеточной петле;

  • во 2-ой внутриклеточной петле;

  • во 2-ой внеклеточной петле;

  • в 4 внутриклеточном участке.

Консервативные аминокислотные остатки показаны на рис. 1.


2.1.3. Сравнение последовательностей PG-рецепторов человека путем их множественного выравнивания с последующим ручным редактированием показало, что консервативными являются 28 аминокислотных остатков. Они отмечены на рис. 1. Это те же аминокислотные остатки, что и в предыдущем пункте, а также треонин-64 (выделен на рис. 1 серым цветом).


2.1.4. Сравнение последовательностей EP-рецепторов у млекопитающих путем их множественного выравнивания с последующим ручным редактированием показало, что консервативными являются 40 аминокислотных остатков (рис. 2). В их число входят все аминокислотные остатки, консервативные для PG-рецепторов.


2.1.5. Для выявления общих черт в строении более далеких гомологов PG-рецепторов проведено сравнение последовательностей типичных представителей семейства G-белок-связывающих рецепторов.

С помощью программы PSI-BLAST получен список белков — более далеких гомологов EP3-рецептора человека. Для построения выравнивания и филогенетического древа из него взяты первые 100 белков (E Value меньше 10 -66). Все они являются представителями класса А G-белок-связывающих рецепторов. Эти белки принадлежат уже не только млекопитающим (список белков и организмов, а также множественное выравнивание см. в Интернете, http://kodomo.cmm.msu.ru/~venel/index.html). Стоит отметить, что из всех простаноидных рецепторов в эти 100 белков не вошли DP-рецепторы, EP1-рецепторы и EP3-рецептор овцы.

Множественное выравнивание этих белков так же, как и в пункте 2.2, значительно отличалось от результатов, представленных в базе данных и статье [2] (изначально оно содержало только 1 консервативную аминокислоту — цистеин-91). Поэтому оно тоже было отредактировано вручную (путем поиска мотивов, указанных в статье [10]), после чего число консервативных аминокислот в нем стало равно 6 (рис. 3).



2.1.6. По результатам проведенных выравниваний построены филогенетические деревья. При этом последовательность EP3-рецептора овцы была удалена, так как она содержит только 2 трансмембранных участка: 4-ый и 5-ый. Присутствие в выравнивании такой короткой последовательности сильно осложнило бы работу программы, строящей деревья, и могло бы привести к искаженным результатам.

Филогенетическое древо PG-рецепторов (рис. 4) показывает, что эти белки в соответствии со степенью сходства их последовательностей можно разделить на 2 группы:


  1. EP2-, EP4-, PD- и PI-рецепторы и

  2. EP1-, EP3-, PF- и TA-рецепторы.

Внутри каждой из групп видно деление на более мелкие группы, в каждую из которых входят рецепторы одного конкретного типа. То есть рецепторы одного типа, встречающиеся у разных животных, более близки друг к другу, чем разные рецепторы, принадлежащие одному организму.

Филогенетические деревья для EP-рецепторов (рис. 5) и 100 представителей семейства родопсиновых рецепторов так же показывают, что рецепторы одного типа, встречающиеся у разных животных, более близки друг к другу, чем разные рецепторы, принадлежащие одному организму. Для большей наглядности второе древо сокращено до 47 белков (каждый вид белка представлен не более 2 раз — из 2 разных животных); оно выставлено в Интернете (http://kodomo.cmm.msu.ru/~venel/rhodfam_tree.html).



Все вышесказанное позволяет предположить, что создание высокоселективных агонистов или антагонистов к какому-либо одному виду PG-рецепторов является осуществимой задачей. Также можно предположить, что эти агонисты/антагонисты будут одинаково действенны для данного вида рецептора, вне зависимости от вида животного. Это значит, что при разработке лекарств для человека можно будет проводить исследования на других животных (мышах, крысах).

2.2. Изучение белковой последовательности EP4-рецептора человека.



2.2.1. С помощью программы BLAST проведен поиск гомологов EP4-рецептора человека по его отдельным участкам:


  • C-концу (1 – 19 аминокислоты) и

  • N-концу (333 – 488 аминокислоты).

Найдено, что достаточно близкими его гомологами (E Value меньше 1/1000) являются (в порядке уменьшения сходства)

  • для C-конца — EP4-рецепторы мыши, крысы и кролика;

  • для N-конца — EP4-рецепторы кролика, мыши и крысы.

Таким образом, можно утверждать, что последовательности C- и N-концов EP4-рецептора человека уникальны для EP4-рецепторов.



2.2.2. В базе данных Pfam представлена доменная структура EP4-рецептора и приводятся выравнивания для отдельных доменов. Основной домен EP4-рецептора (аминокислоты с 44 по 329) носит название 7tm_1 и имеется у всех представителей семейства родопсиновых рецепторов. Состоит он из 7 трансмембранных α-спиралей, соединенных внемембранными участками.

Приводится выравнивание 7tm_1-домена EP4-рецептора человека с 7tm_1-доменом различных представителей семейства родопсиновых рецепторов.

Также выделены

  1. сигнальный участок — аминокислоты с 1 по 43, находящиеся вне клетки, и

  2. участок, состоящий из сравнительно немногих видов аминокислот (low complexity region), состоящий из аминокислот с 389 по 405.

Выравнивается каждый из этих двух участков EP4-рецептора человека с соответствующими участками EP4-рецепторов кролика, крысы и мыши, а также четырех неаннотированных белков (из базы данных EMBL). 3 из них являются EP4-рецепторами собаки, шимпанзе и макаки, а 4-ый — это неизвестный белок мыши, очень похожий на белок EP4-рецептора. Это приводит к тому же выводу, что и в предыдущем пункте: серьезное сходство последовательностей С- и N-конца проявляется только у рецепторов одного подтипа, принадлежащих разным животным.



2.2.3. Для выявления возможного сходства аминокислотных последовательностей тех участков, которые важны для связывания рецептора с G-белком, выполнено множественное выравнивание (с последующим ручным редактированием) последовательности EP4-рецептора человека с последовательностями других представителей семейства G-белок-связывающих рецепторов, которые, как и EP4-рецептор, связываются с Gs-белком. Взяты последовательности рецепторов к фолликулостимулирующему гормону, лютеинизирующему гормону, тиреотропному гормону, меланокортину МС3, вазопрессину М2, серотонину 5НТ4, аденозину А2А; 1-рецептора к адреналину, Н2-рецептора к гистамину и D1-рецептора к дофамину. Все эти белки являются белками человека.

Консервативными являются 9 аминокислотных остатков (рис. 6). Находятся они в трансмембранных участках белков. Значительного сходства аминокислотных последовательностей тех участков, которые важны для связывания с G-белком, не наблюдается. Это значит, что основную роль при связывании с G-белком играет пространственная структура соответствующих участков, а не непосредственно аминокислотная последовательность.


2.2.4. Выполнено парное выравнивание белковых последовательностей EP4-рецептора человека и родопсина быка — единственного представителя класса А G-белок-связывающих рецепторов, для которого есть данные рентгеноструктурного анализа.

В данных двух белковых последовательностях совпадают 47 аминокислотных остатков. Они не собраны в крупные группы, а рассредоточены по всей длине белков. То есть сходство последовательностей не настолько велико, чтобы на это можно было серьезно опираться при построении трехмерной модели EP4-рецептора. К тому же, трехмерная структура известна только для неактивной формы родопсина, в то время как для фармацевтических целей важна активная форма белка. Также необходимо учесть, что структура внеклеточных петель родопсина, возможно, значительно изменена: она определялась прежде всего контактами в кристалле [8].



2.2.5. Сравнение полученных результатов с базой данных по G-белок-связывающим рецепторам (GPCRDB).

В GPCRDB приведены множественные выравнивания для различных групп G-белок-связывающих рецепторов. Выравнивание представителей класса А содержит 1122 белковых последовательностей (включая неаннотированные — из базы данных EMBL). Стоит отметить, что представлены не целые последовательности, а только фрагменты с наибольшим сходством — в основном, трансмембранные, так как вероятность мутации в трансмембранной части ниже, чем во внутри- или внеклеточной части белка.

Авторы пишут о необходимости ручного выравнивания с учетом всех известных экспериментальных данных, если речь идет о большом числе белковых последовательностей [9].

Также в GPCRDB представлены трехмерные модели многих белков, в том числе и EP4-рецептора человека. Множественные выравнивания и трехмерные модели созданы с помощью программы WHAT IF. Она позволяет учесть многочисленные данные, в том числе и трехмерную структуру родопсина, но тем не менее полученный результат не может считаться достаточно точным для фармацевтических целей (об этом предупреждают сами авторы моделей). Пользование программой WHAT IF платное.


Кроме того, в GPCRDB приводятся описания и результаты других методик исследования, способных выявлять более сложные взаимосвязи и закономерности, чем просто анализ расположения консервативных позиций в множественном выравнивании. Далее приводится описание этих методик (в соответствии со статьей [9]).

Для анализа функциональной значимости отдельных аминокислотных позиций выравнивания используется расчет для каждой позиции двух величин: энтропии и вариабельности. Энтропия в позиции p (Sp) определяется так:

20

Sp = - ∑ fpi * ln (fpi),

i=1


где i пробегает все 20 видов аминокислот, а fpi — это относительная частота аминокислотного остатка i в позиции p выравнивания. Значение Sp максимально,

если fp1 = fp2 = ... = fp20­; минимально (то есть равно нулю), если в позиции встречается только 1 вид аминокислотных остатков. Таким образом, Sp можно назвать мерой информации, содержащейся в позиции p выравнивания.

Вариабельность в позиции p (Vp) определяется как число разных видов аминокислот, встречающихся в позиции p не менее чем в 0,5 % последовательностей. Можно сказать, что Vp является мерой свободы, или хаоса, в позиции p выравнивания.

Все аминокислотные позиции разделяются на 5 блоков в зависимости от своей энтропии и вариабельности (не указано, какие значения приняты пороговыми):


  1. блок 11 содержит позиции с низкой энтропией и низкой вариабельностью, которые формируют главный функциональный сайт (для G-белок-связывающих рецепторов —участок связывания с G-белком) или играют важную структурную роль (например, образуют дисульфидные мостики);

  2. блок 12 содержит аминокислотные остатки из внутренней части (“сердцевины”) белка; пространственно они расположены вокруг главного функционального сайта;

  3. блок 22 содержит по большей части аминокислотные остатки из “сердцевины” белка, расположенные дальше от главного функционального сайта; они играют структурную роль и , возможно, участвуют в передаче сигнала от лиганда к главному функциональному сайту;
  4. блок 23 содержит большинство остатков, участвующих во взаимодействиях с лигандом; они могут быть расположены как в “сердцевине” белка, так и на его поверхности;


  5. блок 33 содержит в основном позиции, расположенные на поверхности белка и участвующие во взаимодействии с лигандом, но не в передаче сигнала к главному функциональному сайту. Здесь также находится большинство “непокорных” (recalcitrant) позиций — позиций, для которых выравнивание является сомнительным.

Сигнал передается по такому пути: лиганд —> блок 23 —> блок 22 —> блок 12 —> блок 11 —> взаимодействие с G-белком.


Для исследования белковых семейств, состоящих из очень большого числа белков, предлагается анализ коррелированных мутаций (correlated mutation analysis, или CMA). Он используется для выяснения роли отдельных аминокислотных остатков в структуре и функциональной активности белка. СМА позволяет выявить группы (“сетки”) аминокислотных остатков, мутации которых происходят взаимосвязанно (а значит, для поддержания функциональной активности белка важно не столько положение отдельных аминокислотных остатков, сколько образуемая группой остатков структура в целом).

Основными входными данными для СМА являются множественные выравнивания, поэтому они делаются с учетом всех имеющихся экспериментальных данных и доступной на данный момент информации о трехмерной структуре белков. В процессе анализа учитываются только те части, пространственная укладка которых является общей для всех белков в данном выравнивании. Участки, где есть вставки и делеции, не анализируются.

В зависимости от целей в СМА применяются различные матрицы:

  • для изучения структурных аспектов используются матрицы Dayhof (Dayhof-style residue similarity matrices);

  • для изучения функциональных аспектов используется единичная матрица (identity matrix for residue similarities) — аминокислотные остатки или одинаковы, или различны; никаких промежуточных значений нет.

Степень сходства (correlation score) между позициями p и q вычисляется по следующей формуле:


n-1 n

С(p, q) = W(i, j) * ∑ ∑ δ(ip, iq, jp, jq),

p=1 q=p+1

где n — число белковых последовательностей в выравнивании. Пара чисел p и q пробегает все пары позиций в последовательностях i и j. ip, iq, jp и jq образуют две пары позиций (p, q) в двух последовательностях — i и j, соответственно. Функция δ такова, что


  • δ(ip, iq, jp, jq) = 1, если ip = jp и iq = jq или ip ≠ jp и iq ≠ jq;

  • δ(ip, iq, jp, jq) = 0, если ip = jp и iq ≠ jq или ip ≠ jp и iq = jq.

W(i, j) — вес (weight factor) пары последовательностей i и j, который вычисляется так:

n-1 n

W(i, j) = wi * wj / ∑ ∑ wk * wl,

k=1 l=k+1

где wi и wj — веса последовательностей i и j.


Следующий пример (таблицы 2 и 3 с пояснениями) иллюстрирует первую формулу. Для простоты все веса приняты равными 1,0.

Таблица 2.


№ последовательности

№ позиции




1

2

3

4

5

6

7

1

A

S

P

W

L

R

L

2

A

S

P

W

I

D

L

3

T

T

P

W

V

K


G

4

T

G

P

W

M

E

G


Взяты 4 произвольные последовательности, из 7 аминокислотных остатков каждая.

Степень сходства С(1, 2) рассчитывается так:

n-1 n

С(1, 2) = (2 / n*(n-1)) * ∑ ∑ δ(1p, 1q, 2p, 2q) = 1/6 * (δ(ASAS) + δ(ASTT) + δ(ASTG) +

p=1 q=p+1

+ δ(ASTT) + δ(ASTG) + δ(TTTG)) = 1/6 * (1+1+1+1+1+0) = 0,84


Остальные степени сходства рассчитываются аналогично; их значения для указанных 10 пар позиций приведены в таблице 3.


Таблица 3.


p, q

1, 2

1, 3

1, 4

1, 5

1, 6

1, 7

2, 3

3, 4

5, 6

6, 7

С(p, q)


0,84

0,33

0,33

0,67

0,67

1,00

0,16

1,00

1,00

0,67


Если все попарные степени сходства в некоторой группе позиций превышают величину, принятую за точку отсчета (обычно 0,7 – 0,9), то эта группа называется “сетью” (network).

Позиции, в которых наблюдается консервативность у некоторых подсемейств внутри анализируемого семейства белков, называются “непокорными” (recalcitrant). Они не используются ни в одном из видов СМА. Эти позиции часто демонстрируют высокие степени сходства, но функционально важными не являются. В G-белок-связывающих рецепторах они часты в близких к трансмембранным спиралям внемембранных участках.

Высокая степень сходства каких-либо двух позиций может свидетельствовать об одной из трех вещей:

  1. обе данные позиции полностью консервативны;

  2. обе позиции вариабельны, причем имеют одинаковые вариабельность и энтропию;

  3. мутации в этих позициях скоррелированы (аминокислотные остатки или вместе остаются консервативными, или вместе заменяются).

Пункт 1 — это частный случай пункта 3; а если число последовательностей в выравнивании очень велико, то и пункт 2 становится частным случаем пункта 3.


С помощью СМА в G-белок-связывающих рецепторах выделены 3 “сетки” (network):

  • 1-ая состоит из наиболее консервативных аминокислотных остатков, участвующих в связывании G-белка;
  • 2-ая состоит из остатков, участвующих в связывании лиганда;


  • 3-ая состоит из остатков, участвующих в связывании и активации G-белка.

То есть “сетки” состоят из аминокислотных остатков, важных для связывания или с лигандом, или с G-белком. А “сеток”, связанных с передачей сигнала, нет. Это можно объяснить или отсутствием строгого давления эволюции на аминокислотные остатки, расположенные в центральной части белка; или тем, что важна структура центральной части в целом, и СМА не может выявить столь сложные взаимосвязи.


Выводы.


PG-рецепторы — это трансмембранные белки, поэтому количество гидрофильных аминокислотных остатков в PG-рецепторах меньше среднестатистического для белков человека, а количество гидрофобных — больше.

PG-рецепторы являются близкими гомологами друг для друга, при этом их аминокислотные последовательности заметно отличаются от аминокислотных последовательностей прочих белков. Максимальное сходство аминокислотных последовательностей наблюдается у представителей одного типа (или, если есть, подтипа) PG-рецепторов, принадлежащих разным организмам. Это позволяет предположить, что создание высокоселективных агонистов или антагонистов к какому-либо одному виду PG-рецепторов является осуществимой задачей. Также можно предположить, что эти агонисты/антагонисты будут одинаково действенны для данного вида рецептора, вне зависимости от вида животного. Это значит, что при разработке лекарств для человека можно будет проводить исследования на других животных.

Более далекие гомологи PG-рецепторов принадлежат, как и сами PG-рецепторы, к семейству А G-белок-связывающих рецепторов. Сходство аминокислотных последовательностей в данной группе невелико, и консервативными для 100 представителей этого семейства являются только 6 аминокислотных остатков.

Выполненное автоматически множественное выравнивание большого числа трансмембранных белков требует последующего ручного редактирования. При этом следует опираться на аминокислотные последовательности трансмембранных α-спиралей.


Выявлены мотивы, характерные для всех PG-рецепторов. Они частично совпадают с мотивами, свойственными большинству представителей семейства А G-белок-связывающих рецепторов.

Для всех PG-рецепторов абсолютно консервативными являются 27 аминокислотных остатков; для PG-рецепторов человека — 28 аминокислотных остатков; для ЕP-рецепторов — 40 аминокислотных остатков. На основании этих результатов нельзя сделать каких-либо определенных выводов о пространственной структуре PG-рецепторов. Достоверное моделирование трехмерной структуры PG-рецепторов на основе данных рентгеноструктурного анализа для родопсина также невозможно.

Для Gs-связывающих белков консервативными являются 9 аминокислотных остатков, расположенные преимущественно в трансмембранных участках. Это свидетельствует о том, что для связывания с G-белком важна не столько аминокислотная последовательность соответствующих участков, сколько их пространственная структура.

Все вышесказанное демонстрирует, что исследование трансмембранных белков требует значительно более сложного подхода, чем просто анализ множественных выравниваний, сделанных автоматически. Необходимо редактирование выравниваний с учетом всех имеющихся экспериментальных данных. Для получения из выравниваний информации о функциональной важности участков белка требуется рассмотрение более сложных взаимозависимостей, чем одна только консервативность аминокислот. Одна из возможных методик анализа множественных выравниваний — СМА.


Использованная литература





  1. Варфоломеев С. Д. Простагландины – новый тип биологических регуляторов. (1996) Соросовский Образовательный журнал.

  2. Breyer R., Bagdassarian C., Myers S., Breyer M. (2001) Prostanoid Receptors: Subtypes and Signaling. Annu. Rev. Pharmacol. Toxicol. 41:661-90.
  3. Геннис Р. Биомембраны: Молекулярная структура и функции. М., Мир, 1997.


  4. Bockaert J., Pin J.P. (1999) Molecular tinkering of G protein-coupled receptors: an evolutionary success. The EMBO Journal, Vol.18, No.7, pp. 1723-1729

  5. Audoly L., Breyer R. (1997) Substitution of Charged Amino Acid Residues in Transmembrane Regions 6 and 7 Affect Ligand Binding and Signal Transduction of the Prostaglandin EP3 Receptor. Molecular Pharmacology, 51:61-68.

  6. Audoly L., Breyer R. (1997) The Second Extracellular Loop of the Prostaglandin EP3 Receptor Is an Essential Determinant of Ligand Selectivity. The Journal of Biological Chemistry, Vol. 272, No. 21, Issue of May, pp. 13475-13478.

  7. Horn F., Bettler E., Oliveira L., Campagne F., Cohen F., Vriend G. GRCRDB information system for G protein-coupled receptors. (2003) Nucleic Acids Research, Vol. 31, No. 1, pp. 294-297.

  8. Oliveira L., Hulsen T., Lutje Hulsik D., Paiva A., Vriend G. Modelling G protein-coupled receptors. GRCRDB, http://www.gpcr.org/7tm/articles.

  9. Oliveira L., Paiva A., Vriend G. Correlated Mutation Analyses on Very Large Sequence Families. GRCRDB, http://www.gpcr.org/7tm/articles/2002_3.

  10. Oliveira L., Paiva P., Paiva A., Vriend G. Sequence analysis reveals how G protein-coupled receptors transduce the signal to the G protein. GRCRDB, http://www.gpcr.org/7tm/articles/2002_2.















Р

ис. 4. Филогенетическое древо для простаноидных рецепторов. Корень – EP3-рецептор человека. Получено с помощью программы BLAST (с сервера NCBI) по 34 белкам из базы данных SwissProt.

(“rec” означает “receptor”.)


Р
ис. 5. Филогенетическое древо для EP-рецепторов. Корень – EP4-рецептор человека.