Генетический код

Чтобы выйти из омонимического тупика, необходима простая, но ключевая идея: вновь обратиться к лингвистике и почерпнуть оттуда понятие контекста, которое снимает эту проблему. Омоним утрачивает неоднозначность только в контексте, т.е. роль части становится ясной, когда ее рассматривают в составе целого. В этом смысле понятие контекста (целостного текста) информационной РНК — отнюдь не метафорично. Как-то исподволь, задним числом, молекулярные биологи и генетики признают это, используя идею «второго генетического кода» [13]. Цитируем Л.П.Овчинникова, одного из видных молекулярных биологов: «Инициирующий кодон узнается только в определенном контексте. Если мы зададим вопрос, можно ли, имея перед собой последовательность нуклеотидов какой-либо иРНК, таблицу генетического кода и зная, что трансляция иРНК идет в направлении от 5’- к 3’-концу, а белковая цепочка растет от N-конца к C-концу, написать последовательность аминокислот белка, закодированного в этой иРНК, то будем вынуждены ответить на поставленный вопрос отрицательно. … Нельзя определить, с какого места иРНК мы должны начать переводить последовательность нуклеотидов в последовательность аминокислот. Уже очень давно стало ясно, что начало трансляции иРНК не совпадает с началом самой иРНК. Свидетельством этому служат полицистронные иРНК бактерий, в которых инициация белкового синтеза происходит на каждом цистроне, а также в присутствии в иРНК про- и эукариот 5’-концевых нетранслируемых последовательностей. Вместе с тем установлено, что биосинтез белка как у про-, так и у эукариот, всегда начинается с одной и той же аминокислоты — метионина. Можно было бы предположить, что трансляция информации, закодированной в иРНК, начинается с первого от 5’-конца метионинового кодона, которым является триплет AUG. Для многих моноцистронных эукариотических иРНК это действительно так, хотя бывают и исключения. Однако это совсем не так для полицистронных иРНК бактерий, где инициация часто происходит на триплетах AUG, отстоящих очень далеко от начала иРНК. Этим триплетам может предшествовать большое количество других AUG, на которых инициации не происходит. Более того, оказалось, что первый метионин в белке в некоторых случаях включается не на метиониновом кодоне AUG, а на кодоне GUG, который соответствует в таблице генетического кода аминокислоте валину. Иногда инициация с метионина может происходить и на других кодонах: AUA и AUU (кодонах изолейцина), UUG и, возможно, CUG (кодонах лейцина). Стало очевидным, что для узнавания кодона в качестве инициирующего важен не только сам и, может быть, не столько сам кодон, но какой-то контекст, делающий его инициирующим. У эукариот инициация происходит… чаще всего с первого AUG, однако только в том случае, если этот AUG находится в оптимальном контексте: за два нуклеотида до него обязательно должен находиться пурин (A или G), а непосредственно за ним должен следовать G. Если первый AUG в эукариотической иРНК находится не в оптимальном контексте, он пропускается и инициация начинается со следующего AUG. Для такой инициации очень важно также наличие кэп-структуры на 5’-конце иРНК и, как ни странно, поли(А) последовательности на противоположном конце молекулы. Кэп-структура и поли(А) последовательность узнаются специфическими белками, которые также необходимы для инициации. При таком способе инициации трансляции у эукариот последовательность иРНК как бы просматривается (сканируется) с начала иРНК (от ее кэп-структуры) для поиска кодона AUG в оптимальном контексте. Такая инициация получила название «кэп-зависимая» инициация по сканирующему механизму. Сравнительно недавно было показано, что аминокислота селеноцистеин (очень редкая, но функционально очень важная аминокислота) непосредственно включается в белок. Возникает закономерный вопрос, как же закодирована эта аминокислота. Ведь значение всех 64 возможных кодонов уже четко определено, и все они используются в кодировании двадцати стандартных аминокислот и сигналов терминации. Исследования показали, что селеноцистеин кодируется UGA (терминирующим кодоном в таблице генетического кода), если за ним находится особая стимулирующая последовательность. Эта последовательность может отстоять от UGA на очень большом расстоянии — иногда она может быть на расстоянии 200 нуклеотидов и находиться в 3’-нетранслируемой области иРНК». Как видим, из этой длинной, но чрезвычайно важной цитаты, классическая молекулярная биология, в лице акад. РАН Л.П.Овчинникова, вынуждена занять снимающую трудности модели кода – идею контекста в омонимических кодонных ситуациях. Занять у П.П.Гаряева (правда, без ссылки на него [12]) и у лингвистики. Но делается это исключительно в метафорическом смысле. И второе, не менее важное положение, также вводится – это фактор дальнего влияния определенных иРНК-блоков (кэп, поли(А), стимулирующие последовательности) на далеко удаленное в иРНК место включение рибосомой первой определенной аминокислоты в синтезирующуюся белковую цепь. Понадобилась также и дополнительная идея «просмотра-сканирования» всей иРНК, т.е. контекста иРНК. Все эти объясняющие факторы в общем виде предсказаны П.П.Гаряевым ранее. В том числе и механизм сканирования полинуклеотидов за счет солитонных возбуждений РНК и ДНК [12]. Заметим также и другой важный момент – перекодировки кодонов в зависимости от контекстов, что также никак не укладывается в прокрустово ложе канонической триплетной модели.