Подпишись и читай
самые интересные
статьи первым!

В каком году был расшифрован генетический код. Генетический код: описание, характеристики, история исследования

Генетический код – это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.

Свойства генетического кода.

Генетический код имеет несколько свойств.

    Триплетность.

    Вырожденность или избыточность.

    Однозначность.

    Полярность.

    Неперекрываемость.

    Компактность.

    Универсальность.

Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.

а. Триплетность. Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет – наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон – наименьшая функциональная единица генетического кода. Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см. далее). Как видно из определения, триплет – это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов). Кодон – характеризует элементарную смысловую единицу генома – три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.

Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 4 3 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).

Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую либо аминокислоту, их называют смысловые кодоны . Три триплета не кодируют

аминокислот а являются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три – УАА, УАГ, УГА , их ещё называют «бессмысленные» (нонсенс кодоны). В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называютнонсенс-мутация . Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться – синтезироваться будет только первая (до стоп-сигнала) часть белка. У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается. В результате формируется молекула гемоглобина лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» — Средиземное море, где эта болезнь впервые обнаружена).

Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.

Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции .

б. Вырожденность или избыточность.

61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования. Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами. Исследования показали, что природа использовала последний вариант.

Его предпочтение очевидно. Если бы из 64 варианта триплетов в кодировании аминокислот участвовало только 20, то 44 триплета (из 64) оставались бы не кодирующими, т.е. бессмысленными (нонсенс-кодонами). Ранее мы указывали, насколько опасно для жизнедеятельности клетки превращение кодирующего триплета в результате мутации в нонсенс-кодон — это существенно нарушает нормальную работу РНК-полимеразы, приводя в конечном итоге к развитию заболеваний. В настоящее время в нашем геноме три кодона являются бессмысленными, а теперь представьте, что было бы если число нонсенс-кодонов увеличится в примерно в 15 раз. Понятно, что в такой ситуации переход нормальных кодонов в нонсенс-кодоны будет неизмеримо выше.

Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов. Так, аминокислота лейцин может кодироваться шестью триплетами - УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин - двумя и только триптофан и метионин кодируются одним кодоном. Свойство, которое связано с записью одной и той же информации разными символами носит названиевырожденность.

Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках.

И это, скорее всего, не случайно. Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами. Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.

Необходимо отметить, что термин вырожденность используется в молекулярной генетики и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют “вырожденностью третьего основания”. Последняя особенность сводит до минимума эффект мутаций. Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент - гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части – глобина, который кодируется соответствующим геном. Кроме белка в молекулу гемоглобина входит гем, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона , который может кодировать новую аминокислоту в полипептидной цепи гемоглобина. В триплете, в результате мутации может быть заменён любой нуклеотид – первый, второй или третий. Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых. 300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше “вырожденность третьего основания”, когда замена третьего нуклеотида в триплете кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту. Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам. Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.

Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка - глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные -цепи и две -цепи. Молекула -цепи содержит 141 аминокислотных остатков, -цепочка - 146, — и -цепи различаются по многим аминокислотным остаткам. Аминокислотная последовательность каждой глобиновой цепи кодируется своим собственным геном. Ген, кодирующий -цепь располагается в коротком плече 16 хромосомы, -ген - в коротком плече 11 хромосомы. Замена в гене, кодирующем -цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного. Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” - приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту - тирозин Фенотипически это проявится в тяжёлом заболевании.. Аналогичная замена в 63 положении -цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении -цепи является причиной тяжелейшего заболевания - серповидно-клеточной анемии. Не будем продолжать печальный список. Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю. Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в -цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин. Глутаминовая кислота и лизин сходны по физико-химическим свойствам - они обе гидрофильны. Валин - гидрофобная аминокислота. Поэтому, замена гидрофильной глютаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глютаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина - у больных возникает легкая форма малокровия. В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту – гистидин.

В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.

в. Однозначность.

Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон – аминокислота генетический код однозначен, в направлении аминокислота – кодон – неоднозначен (вырожденный).

Однозначен

Кодон аминокислота

Вырожденный

И в этом случае необходимость однозначности в генетическом коде очевидна. При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией. Метаболизм клетки перешёл бы в режим работы «один ген – несколько поипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.

г. Полярность

Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка. Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы. В то время когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).

Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.

д. Неперекрываемость.

Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.

Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона. Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) (рис.33,А) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) (рис. 33, Б) или пять (если общими являются два нуклеотида) (см. рис. 33, В). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.

Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся.

Поясним это на рисунке 34. Жирными линиями показаны триплеты кодирующие аминокислоты в случае не перекрывающегося и перекрывающегося кода. Эксперименты однозначно показали, что генетический код является не перекрывающимся. Не вдаваясь в детали эксперимента отметим, что если заменить в последовательности нуклеотидов (см. рис.34) третий нуклеотид У (отмечен звёздочкой) на какой-либо другой то:

1. При неперекрывающемся коде контролируемый этой последовательностью белок имел бы замену одной (первой) аминокислоте (отмечена звёздочками).

2. При перекрывающемся коде в варианте А произошла бы замена в двух (первой и второй) аминокислотах (отмечены звёздочками). При варианте Б замена коснулась бы трёх аминокислот (отмечены звёздочками).

Однако многочисленные опыты показали, что при нарушении одного нуклеотида в ДНК, нарушения в белке всегда касаются только одной аминокислоты, что характерно для неперекрывающегося кода.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

ГЦУ ГЦУ ГЦУ УГЦ ЦУГ ГЦУ ЦУГ УГЦ ГЦУ ЦУГ

*** *** *** *** *** ***

Аланин – Аланин Ала – Цис – Лей Ала – Лей – Лей – Ала – Лей

А Б В

Не перекрывающийся код Перекрывающийся код

Рис. 34. Схема, объясняющая наличие в геноме не перекрывающегося кода (объяснение в тексте).

Неперекрываемость генетического кода связана с ещё одним свойством – считывание информации начинается с определённой точки – сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ.

Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.

е. Компактность.

Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.

ж. Универсальность.

Код един для всех организмов живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.

Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.

Кодовая система ДНК.

Генетический код днк состоит из 64 триплетов нуклеотидов. Эти триплеты называют кодонами. Каждый кодон кодирует одну из 20 аминокислот, используемых в синтезе белков. Это дает некоторую избыточность в коде: большинство аминокислот кодируется более чем одним кодоном.
Один кодон выполняет две взаимосвязанные функции: сигнализирует о начале перевода и кодирует включения аминокислоты метионина (Met) в растущую полипептидную цепь. Кодовая система днк устроена так, что генетический код может быть выражен либо как РНК-кодонами, либо кодонамиДНК. РНК-кодоны встречаются в РНК (мРНК) и эти кодоны способны читать информацию в процессе синтеза полипептидов (процесс, называемый переводом). Но каждая молекула мРНК приобретает последовательность нуклеотидов в транскрипции с соответствующего гена.

Все, кроме двух аминокислот (Met и Trp) могут быть закодированы посредством от 2 до 6 различных кодонов. Тем не менее, геном большинства организмов показывает, что определенные кодоны предпочтительны по сравнению с другими. У человека, например, аланин кодируется GCC четыре раза чаще, чем в GCG. Это, вероятно, свидетельствует о большей эффективности перевода аппарата трансляции (например, рибосомы) для некоторых кодонов.

Генетический код является почти универсальным. Те же кодоны назначены на тот же участок аминокислот и тем же сигналы пуска и остановки в подавляющем большинстве совпадают у животных, растений и микроорганизмов. Тем не менее, некоторые исключения были найдены. Большинство из них включают назначение одного или двух из трех стоп-кодонов к аминокислоте.

Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .

ГЕНЕТИЧЕСКИЙ КОД , способ записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности образующих эти кислоты нуклеотидов. Определённой последовательности нуклеотидов в ДНК и РНК соответствует определённая последовательность аминокислот в полипептидных цепях белков. Код принято записывать с помощью заглавных букв русского или латинского алфавита. Каждый нуклеотид обозначается буквой, с которой начинается название входящего в состав его молекулы азотистого основания: А (А) – аденин, Г (G) – гуанин, Ц (С) – цитозин, Т (Т) – тимин; в РНК вместо тимина урацил – У (U). Каждую кодирует комбинация из трёх нуклеотидов – триплет, или кодон. Кратко путь переноса генетической информации обобщён в т. н. центральной догме молекулярной биологии: ДНК ` РНК f белок.

В особых случаях информация может переноситься от РНК к ДНК, но никогда не переносится от белка к генам.

Реализация генетической информации осуществляется в два этапа. В клеточном ядре на ДНК синтезируется информационная, или матричная, РНК (транскрипция). При этом нуклеотидная последовательность ДНК «переписывается» (перекодируется) в нуклеотидную последовательность мРНК. Затем мРНК переходит в цитоплазму, прикрепляется к рибосоме, и на ней, как на матрице, синтезируется полипептидная цепь белка (трансляция). Аминокислоты с помощью транспортной РНК присоединяются к строящейся цепи в последовательности, определяемой порядком нуклеотидов в мРНК.

Из четырёх «букв» можно составить 64 различных трёхбуквенных «слова» (кодона). Из 64 кодонов 61 кодирует определённые аминокислоты, а три отвечают за окончание синтеза полипептидной цепи. Так как на 20 аминокислот, входящих в состав белков, приходится 61 кодон, некоторые аминокислоты кодируются более чем одним кодоном (т. н. вырождённость кода). Такая избыточность повышает надёжность кода и всего механизма биосинтеза белка. Другое свойство кода – его специфичность (однозначность): один кодон кодирует только одну аминокислоту.

Кроме того, код не перекрывается – информация считывается в одном направлении последовательно, триплет за триплетом. Наиболее удивительное свойство кода – его универсальность: он одинаков у всех живых существ – от бактерий до человека (исключение составляет генетический код митохондрий). Учёные видят в этом подтверждение концепции о происхождении всех организмов от одного общего предка.

Расшифровка генетического кода, т. е. определение «смысла» каждого кодона и тех правил, по которым считывается информация, осуществлена в 1961–1965 гг. и считается одним из наиболее ярких достижений молекулярной биологии.

ГЕНЕТИЧЕСКИЙ КОД (греч, genetikos относящийся к происхождению; син.: код, биологический код, аминокислотный код, белковый код, код нуклеиновых к-т ) - система записи наследственной информации в молекулах нуклеиновых кислот животных, растений, бактерий и вирусов чередованием последовательности нуклеотидов.

Генетическая информация (рис.) из клетки в клетку, из поколения в поколение, за исключением РНК-содержащих вирусов, передается путем редупликации молекул ДНК (см. Репликация). Реализация наследственной информации ДНК в процессе жизнедеятельности клетки осуществляется через 3 типа РНК: информационную (иРНК или мРНК), рибосомную (рРНК) и транспортную (тРНК), которые с помощью фермента РНК-полимеразы синтезируются на ДНК как на матрице. При этом последовательность нуклеотидов в молекуле ДНК однозначно определяет последовательность нуклеотидов во всех трех типах РНК (см. Транскрипция). Информацию гена (см.), кодирующего белковую молекулу, несет только иРНК. Конечным продуктом реализации наследственной информации является синтез белковых молекул, специфичность которых определяется последовательностью входящих в них аминокислот (см. Трансляция).

Поскольку в составе ДНК или РНК представлено только по 4 разных азотистых основания [в ДНК - аденин (А), тимин (Т), гуанин (Г), цитозин (Ц); в РНК - аденин (А), урацил (У), цитозин (Ц), гуанин (Г)], последовательность которых определяет последовательность 20 аминокислот в составе белка, возникает проблема Г. к., т. е. проблема перевода 4-буквенного алфавита нуклеиновых к-т в 20-буквенный алфавит полипептидов.

Впервые идея матричного синтеза белковых молекул с правильным предсказанием свойств гипотетической матрицы была сформулирована Н. К. Кольцовым в 1928 г. В 1944 г. Эйвери (О. Avery) с соавт, установил, что за передачу наследственных признаков при трансформации у пневмококков ответственны молекулы ДНК. В 1948 г. Чаргафф (E. Chargaff) показал, что во всех молекулах ДНК имеет место количественное равенство соответствующих нуклеотидов (А-T, Г-Ц). В 1953 г. Ф. Крик, Дж. Уотсон и Уилкинс (М. H. F. Wilkins), исходя из этого правила и данных рентгеноструктурного анализа (см.), пришли к выводу, что молекул а ДНК представляет собой двойную спираль, состоящую из двух полинуклеотидных нитей, соединенных между собой водородными связями. Причем против А одной цепи во второй может находиться только Т, против Г - только Ц. Эта комплементарность приводит к тому, что последовательность нуклеотидов одной цепи однозначно определяет последовательность другой. Второй существенный вывод, вытекающий из этой модели,- молекула ДНК способна к самовоспроизведению.

В 1954 г. Гамов (G. Gamow) сформулировал проблему Г. к. в ее современном виде. В 1957 г. Ф. Крик высказал Гипотезу адаптера, предположив, что аминокислоты взаимодействуют с нуклеиновой к-той не непосредственно, а через посредников (теперь известных под названием тРНК). В ближайшие после этого годы все принципиальные звенья общей схемы передачи генетической информации, вначале гипотетичные, были подтверждены экспериментально. В 1957 г. были открыты иРНК [А. С. Спирин, А. Н. Белозерский с соавт.; Фолькин и Астрахан (E. Volkin, L. Astrachan)] и тРНК [Хоугленд (М. В. Hoagland)]; в 1960 г. синтезирована ДНК вне клетки с использованием в качестве матрицы существующих макромолекул ДНК (А. Корнберг) и открыт ДНК-зависимый синтез РНК [Вейсс (S. В. Weiss) с соавт.]. В 1961 г. была создана бесклеточная система, в к-рой в присутствии естественной РНК или синтетических полирибонуклеотидов осуществлялся синтез белковоподобных веществ [М. Ниренберг и Маттеи (J. H. Matthaei)]. Проблема познания Г. к. состояла из исследования общих свойств кода и собственно его расшифровки, т. е. выяснения, какие комбинации нуклеотидов (кодоны) кодируют определенные аминокислоты.

Общие свойства кода были выяснены независимо от его расшифровки и в основном до нее путем анализа молекулярных закономерностей образования мутаций (Ф. Крик и соавт., 1961; Н. В. Лучник, 1963). Они сводятся к следующему:

1. Код универсален, т. е. идентичен, по крайней мере в основном, для всех живых существ.

2. Код триплетен, т. е. каждая аминокислота кодируется тройкой нуклеотидов.

3. Код неперекрывающийся, т. е. данный нуклеотид не может входить в состав более чем одного кодона.

4. Код вырожден, т. е. одна аминокислота может кодироваться несколькими триплетами.

5. Информация о первичной структуре белка считывается с иРНК последовательно, начиная с фиксированной точки.

6. Большинство возможных триплетов имеет «смысл», т. е. кодирует аминокислоты.

7. Из трех «букв» кодона преимущественное значение имеют лишь две (облигатные), третья же (факультативная) несет значительно меньшую информацию.

Прямая расшифровка кода состояла бы в сравнении последовательности нуклеотидов в структурном гене (или синтезированной на нем иРНК) с последовательностью аминокислот в соответствующем белке. Однако такой путь пока технически невозможен. Были применены два других пути: синтез белка в бесклеточной системе с использованием в качестве матрицы искусственных полирибонуклеотидов известного состава и анализ молекулярных закономерностей образования мутаций (см.). Первый принес положительные результаты раньше и исторически сыграл в расшифровке Г. к. большую роль.

В 1961 г. М. Ниренберг и Маттеи применили в качестве матрицы гомо-полимер - синтетическую полиуридиловую к-ту (т. е. искусственную РНК состава УУУУ...) и получили полифенилаланин. Из этого следовало, что кодон фенилаланина состоит из нескольких У, т. е. в случае триплетного кода расшифровывается как УУУ. Позже наряду с гомополимерами были использованы полирибонуклеотиды, состоявшие из разных нуклеотидов. При этом был известен только состав полимеров, расположение же нуклеотидов в них было статистическим, поэтому и анализ результатов был статистическим и давал косвенные выводы. Довольно быстро удалось найти хотя бы по одному триплету для всех 20 аминокислот. Выяснилось, что присутствие органических растворителей, изменение pH или температуры, некоторые катионы и особенно антибиотики делают код неоднозначным: те же кодоны начинают стимулировать включение других аминокислот, в некоторых случаях один кодон начинал кодировать до четырех разных аминокислот. Стрептомицин влиял на считывание информации как в бесклеточных системах, так и in vivo, причем был эффективен только на стрептомицинчувствительных штаммах бактерий. У стрептомицинзависимых штаммов он «исправлял» считывание с кодонов, изменившихся в результате мутации. Подобные результаты давали основание сомневаться в правильности расшифровки Г. к. с помощью бесклеточной системы; требовалось подтверждение, и в первую очередь данными in vivo.

Основные данные о Г. к. in vivo получены при анализе аминокислотного состава белков у организмов, обработанных мутагенами (см.) с известным механизмом действия, напр, азотистой к-той, к-рая вызывает в молекуле ДНК замену Ц на У и А на Г. Полезную информацию дают также анализ мутаций, вызванных неспецифическими мутагенами, сравнение различий в первичной структуре родственных белков у разных видов, корреляция между составом ДНК и белков и т. п.

Расшифровка Г. к. на основании данных in vivo и in vitro дала совпадающие результаты. Позже были разработаны три других метода расшифровки кода в бесклеточных системах: связывание аминоацил-тРНК (т. е. тРНК с присоединенной активированной аминокислотой) тринуклеотидами известного состава (М. Ниренберг и соавт., 1965), связывание аминоацил-тРНК полинуклеотидами, начинающимися с определенного триплета (Маттеи с соавт., 1966), и использование в качестве иРНК полимеров, в которых известен не только состав, но и порядок нуклеотидов (X. Корана и соавт., 1965). Все три метода дополняют друг друга, а результаты находятся в соответствии с данными, полученными в опытах in vivo.

В 70-х гг. 20 в. появились методы особенно надежной проверки результатов расшифровки Г. к. Известно, что мутации, возникающие под действием профлавина, состоят в выпадении или вставке отдельных нуклеотидов, что приводит к сдвигу рамки считывания. У фага Т4 был вызван профлавином ряд мутаций, при которых изменился состав лизоцима. Этот состав был проанализирован и сопоставлен с теми кодонами, которые должны были получиться при сдвиге рамки считывания. Получилось полное соответствие. Дополнительно этот метод позволил установить, какие именно триплеты вырожденного кода кодируют каждую из аминокислот. В 1970 г. Адамсу (J. М. Adams) с сотрудниками удалось провести частичную расшифровку Г. к. прямым методом: у фага R17 определили последовательность оснований во фрагменте длиной в 57 нуклеотидов и сравнили с аминокислотной последовательностью белка его оболочки. Результаты полностью совпали с полученными менее прямыми методами. Т. о., код расшифрован полностью и верно.

Результаты расшифровки сведены в таблицу. В ней указан состав кодонов и РНК. Состав антикодонов тРНК комплементарен кодонам иРНК, т. е. вместо У в них находится А, вместо А - У, вместо Ц - Г и вместо Г - Ц, и соответствует кодонам структурного гена (той нити ДНК, с к-рой считывается информация) с той лишь разницей, что место тимина занимает урацил. Из 64 триплетов, которые могут быть образованы сочетанием 4 нуклеотидов, 61 имеет «смысл», т. е. кодирует аминокислоты, а 3 являются «нонсенсами» (лишенными смысла). Между составом триплетов и их смыслом имеется довольно четкая зависимость, к-рая была обнаружена еще при анализе общих свойств кода. В ряде случаев триплеты, кодирующие определенную аминокислоту (напр., пролин, аланин), характеризуются тем, что два первых нуклеотида (облигатные) у них одинаковы, а третий (факультативный) может быть любым. В других случаях (при кодировании, напр., аспарагина, глутамина) один и тот же смысл имеют два сходных триплета, у которых совпадают два первых нуклеотида, а на месте третьего стоит любой пурин или любой пиримидин.

Нонсенс-кодоны, 2 из которых имеют специальные названия, соответствующие обозначению фаговых мутантов (УАА-охра, УАГ-амбер, УГА-опал), хотя и не кодируют каких-либо аминокислот, но имеют большое значение при считывании информации, кодируя конец полипептидной цепи.

Считывание информации происходит в направлении от 5 1 -> 3 1 - к концу нуклеотидной цепи (см. Дезоксирибонуклеиновые кислоты). При этом синтез белка идет от аминокислоты со свободной аминогруппой к аминокислоте со свободной карбоксильной группой. Начало синтеза кодируется триплетами АУГ и ГУГ, которые в этом случае включают специфичную стартовую аминоацил-тРНК, а именно N-формилметио-нил-тРНК. Эти же триплеты при локализации внутри цепи кодируют соответственно метионин и валин. Неоднозначность снимается тем, что началу считывания предшествует нонсенс. Есть данные, говорящие в пользу того, что граница между участками иРНК, кодирующими разные белки, состоит более чем из двух триплетов и что в этих местах меняется вторичная структура РНК; этот вопрос находится в стадии исследования. Если нонсенс-кодон возникает внутри структурного гена, то соответствующий белок строится только до места расположения этого кодона.

Открытие и расшифровка генетического кода - выдающееся достижение молекулярной биологии - оказало влияние на все биол, науки, положив в ряде случаев начало развитию специальных крупных разделов (см. Молекулярная генетика). Эффект открытия Г. к. и связанных с ним исследований сравнивают с тем эффектом, который оказала на биол, науки теория Дарвина.

Универсальность Г. к. является прямым доказательством универсальности основных молекулярных механизмов жизни у всех представителей органического мира. Между тем большие различия в функциях генетического аппарата и его строении при переходе от прокариотов к эукариотам и от одноклеточных к многоклеточным, вероятно, связаны и с молекулярными различиями, исследование которых - одна из задач будущего. Поскольку исследования Г. к.- дело лишь последних лет, значение полученных результатов для практической медицины носит лишь Косвенный характер, позволяя пока понять природу заболеваний, механизм действия возбудителей болезней и лекарственных веществ. Однако открытие таких явлений, как трансформация (см.), трансдукция (см.), супрессия (см.), указывает на принципиальную возможность исправления патологически измененной наследственной информации или ее коррекции - так наз. генная инженерия (см.).

Таблица. ГЕНЕТИЧЕСКИЙ КОД

Первый нуклеотид кодона

Второй нуклеотид кодона

Третий, нуклеотид кодона

Фенилаланин

J Нонсенс

Триптофан

Гистидин

Глутаминовая кислота

Изолейцин

Аспарагиновая

Метионин

Аспарагин

Глутамин

* Кодирует конец цепи.

** Кодирует также начало цепи.

Библиография: Ичас М. Биологический код, пер. с англ., М., 1971; Лучник Н.Б. Биофизика цитогенетических поражений и генетический код, Л., 1968; Молекулярная генетика, пер. с англ., под ред. А. Н. Белозерского, ч. 1, М., 1964; Нуклеиновые кислоты, пер. с англ., под ред. А. Н. Белозерского, М., 1965; Уотсон Дж. Д. Молекулярная биология гена, пер. с англ., М., 1967; Физиологическая генетика, под ред. М. Е. Лобашева С. Г., Инге-Вечтомо-ва, Л., 1976, библиогр.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„ E. Geissler, B., 1972; The genetic code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. The genetic code, N. Y. a. o., 1967.

ГЕНЕТИЧЕСКИЙ КОД, система записи наследственной информации в виде последовательности оснований нуклеотидов в молекулах ДНК (у некоторых вирусов - РНК), определяющая первичную структуру (расположение аминокислотных остатков) в молекулах белков (полипептидов). Проблема генетического кода была сформулирована после доказательства генетической роли ДНК (американские микробиологи О. Эйвери, К. Мак-Леод, М. Маккарти, 1944) и расшифровки её структуры (Дж. Уотсон, Ф. Крик, 1953), после установления того, что гены определяют структуру и функции ферментов (принцип «один ген - один фермент» Дж. Бидла и Э. Тейтема, 1941) и что существует зависимость пространственной структуры и активности белка от его первичной структуры (Ф. Сенгер, 1955). Вопрос о том, как комбинации из 4 оснований нуклеиновых кислот определяют чередование 20 обычных аминокислотных остатков в полипептидах, впервые поставил Г. Гамов в 1954 году.

На основании эксперимента, в котором исследовали взаимодействия вставок и выпадений пары нуклеотидов, в одном из генов бактериофага Т4 Ф. Крик и другие учёные в 1961 году определили общие свойства генетического кода: триплетность, т. е. каждому аминокислотному остатку в полипептидной цепи соответствует набор из трёх оснований (триплет, или кодон) в ДНК гена; считывание кодонов в пределах гена идёт с фиксированной точки, в одном направлении и «без запятых», то есть кодоны не отделены какими-либо знаками друг от друга; вырожденность, или избыточность, - один и тот же аминокислотный остаток могут кодировать несколько кодонов (кодоны-синонимы). Авторы предположили, что кодоны не перекрываются (каждое основание принадлежит только одному кодону). Прямое изучение кодирующей способности триплетов было продолжено с использованием бесклеточной системы синтеза белка под контролем синтетической матричной РНК (мРНК). К 1965 году генетический код был полностью расшифрован в работах С. Очоа, М. Ниренберга и Х. Г. Кораны. Раскрытие тайны генетического кода явилось одним из выдающихся достижений биологии в 20 веке.

Реализация генетического кода в клетке происходит в ходе двух матричных процессов - транскрипции и трансляции. Посредником между геном и белком является мРНК, образующаяся в процессе транскрипции на одной из нитей ДНК. При этом последовательность оснований ДНК, несущая информацию о первичной структуре белка, «переписывается» в виде последовательности оснований мРНК. Затем в ходе трансляции на рибосомах последовательность нуклеотидов мРНК считывается транспортными РНК (тРНК). Последние имеют акцепторный конец, к которому присоединяется аминокислотный остаток, и адаптерный конец, или антикодон-триплет, который узнаёт соответствующий кодон мРНК. Взаимодействие кодона и анти-кодона происходит на основании комплементарного спаривания оснований: Аденин (А) - Урацил (U), Гуанин (G) - Цитозин (С); при этом последовательность оснований мРНК переводится в аминокислотную последовательность синтезирующегося белка. Различные организмы используют для одной и той же аминокислоты разные кодоны-синонимы с разной частотой. Считывание мРНК, кодирующей полипептидную цепь, начинается (инициируется) с кодона AUG, соответствующего аминокислоте метионину. Реже у прокариот инициирующими кодонами служат GUG (валин), UUG (лейцин), AUU (изолейцин), у эукариот - UUG (лейцин), AUA (изолейцин), ACG (треонин), CUG (лейцин). Это задаёт так называемую рамку, или фазу, считывания при трансляции, то есть далее всю нуклеотидную последовательность мРНК считывают триплет за триплетом тРНК до тех пор, пока на мРНК не встретится любой из трёх кодонов-терминаторов, часто называемых стоп-кодонами: UAA, UAG, UGA (таблица). Считывание этих триплетов приводит к завершению синтеза полипептидной цепи.

Кодоны AUG и стоп-кодоны стоят соответственно в начале и в конце участков мРНК, кодирующих полипептиды.

Генетический кода квазиуниверсален. Это значит, что существуют небольшие вариации в значении некоторых кодонов у разных объектов, и это касается, прежде всего, кодонов-терминаторов, которые могут быть значащими; например, в митохондриях некоторых эукариот и у микоплазм UGA кодирует триптофан. Кроме того, в некоторых мРНК бактерий и эукариот UGA кодирует необычную аминокислоту - селеноцистеин, а UAG у одной из архебактерий - пирролизин.

Существует точка зрения, согласно которой генетический кода возник случайно (гипотеза «замороженного случая»). Более вероятно, что он эволюционировал. В пользу такого предположения говорит существование более простого и, по-видимому, более древнего варианта кода, который считывается в митохондриях согласно правилу «два из трёх», когда аминокислоту определяют только два из трёх оснований в триплете.

Лит.: Crick F. Н. а. о. General nature of the genetic code for proteins // Nature. 1961. Vol. 192; The genetic code. N. Y., 1966; Ичас М. Биологический код. М., 1971; Инге-Вечтомов С. Г. Как читается генетический код: правила и исключения // Современное естествознание. М., 2000. Т. 8; Ратнер В. А. Генетический код как система // Соросовский образовательный журнал. 2000. Т. 6. № 3.

С. Г. Инге-Вечтомов.



Включайся в дискуссию
Читайте также
Определение места отбывания наказания осужденного
Осужденному это надо знать
Блатной жаргон, по фене Как относятся к наркоторговцам в тюрьме