Каковы основные свойства генетического кода. Вырожденность генетического кода: общие сведения

Каждый живой организм обладает особым набором белков. Определенные соединения нуклеотидов и их последовательность в молекуле ДНК образуют генетический код. Он передает информацию о строении белка. В генетике была принята определенная концепция. Согласно ей, одному гену соответствовал один фермент (полипептид). Следует сказать, что исследования о нуклеиновых кислотах и белках проводились в течение достаточно продолжительного периода. Далее в статье подробнее рассмотрим генетический код и его свойства. Будет также приведена краткая хронология исследований.

Терминология

Генетический код - это способ зашифровки последовательности белков аминокислот с участием нуклеотидной последовательности. Этот метод формирования сведений характерен для всех живых организмов. Белки - природные органические вещества с высокой молекулярностью. Эти соединения также присутствуют в живых организмах. Они состоят из 20 видов аминокислот, которые называются каноническими. Аминокислоты выстроены в цепочку и соединены в строго установленной последовательности. Она определяет структуру белка и его биологические свойства. Встречается также несколько цепочек аминокислот в белке.

ДНК и РНК

Дезоксирибонуклеиновая кислота - это макромолекула. Она отвечает за передачу, хранение и реализацию наследственной информации. ДНК использует четыре азотистых основания. К ним относятся аденин, гуанин, цитозин, тимин. РНК состоит из тех же нуклеотидов, кроме того из них, в составе которого находится тимин. Вместо него присутствует нуклеотид, содержащий урацил (U). Молекулы РНК и ДНК представляют собой нуклеотидные цепочки. Благодаря такой структуре образовываются последовательности - "генетический алфавит".

Реализация информации

Синтез белка, который кодируется геном, реализовывается при помощи объединения мРНК на матрице ДНК (транскрипции). Также происходит передача генетического кода в последовательность аминокислот. То есть имеет место синтез полипептидной цепи на мРНК. Для зашифровки всех аминокислот и сигнала окончания белковой последовательности достаточно 3-х нуклеотидов. Эта цепь называется триплетом.

История исследования

Изучение белка и нуклеиновых кислот проводилось длительное время. В середине 20 века, наконец, появились первые идеи о том, какую природу имеет генетический код. В 1953 году выяснили, что некоторые белки состоят из последовательностей аминокислот. Правда, тогда еще не могли определить их точное количество, и по этому поводу велись многочисленные споры. В 1953 году авторами Уотсоном и Криком было опубликовано две работы. Первая заявляла о вторичной структуре ДНК, вторая говорила о ее допустимом копировании при помощи матричного синтеза. Кроме того, был сделан акцент на то, что конкретная последовательность оснований - это код, несущий наследственную информацию. Американский и советский физик Георгий Гамов допустил гипотезу кодирования и нашел метод ее проверки. В 1954 году была опубликована его работа, в ходе которой он выдвинул предложение установить соответствия между боковыми аминокислотными цепями и "дырами", имеющими ромбообразную форму, и использовать это как механизм кодирования. Потом его назвали ромбическим. Разъясняя свою работу, Гамов допустил, что генетический код может являться триплетным. Труд физика стал одним из первых среди тех, которые считались близкими к истине.

Классификация

По истечении нескольких лет предлагались различные модели генетических кодов, представляющие собой два вида: перекрывающиеся и неперекрывающиеся. В основе первой было вхождение одного нуклеотида в состав нескольких кодонов. К ней принадлежит треугольный, последовательный и мажорно-минорный генетический код. Вторая модель предполагает два вида. К неперекрывающимся относятся комбинационный и "код без запятых". В основе первого варианта лежит кодировка аминокислоты триплетами нуклеотидов, и главным является его состав. Согласно "коду без запятых", определенные триплеты соответствуют аминокислотам, а остальные нет. В этом случае считалось, что при расположении любых значащих триплетов последовательно другие, находящиеся в иной рамке считывания, получатся ненужными. Ученые полагали, что существует возможность подбора нуклеотидной последовательности, которая будет удовлетворять этим требованиям, и что триплетов ровно 20.

Хотя Гамов с соавторами ставили под сомнение такую модель, она считалась наиболее правильной на протяжении следующих пяти лет. В начале второй половины 20-го века появились новые данные, которые позволили обнаружить некоторые недочеты в "коде без запятых". Было выявлено, что кодоны способны провоцировать синтез белка в пробирке. Ближе к 1965 году осмыслили принцип всех 64 триплетов. В результате обнаружили избыточность некоторых кодонов. Другими словами, последовательность аминокислот кодируется несколькими триплетами.

Отличительные особенности

К свойствам генетического кода относятся:

Вариации

Впервые отклонение генетического кода от стандартного было обнаружено в 1979 году во время изучения генов митохондрий в организме человека. Далее выявили еще подобные варианты, в том числе множество альтернативных митохондриальных кодов. К ним относятся расшифровка стоп-кодона УГА, используемого в качестве определения триптофана у микоплазм. ГУГ и УУГ у архей и бактерий нередко применяются в роли стартовых вариантов. Иногда гены кодируют белок со старт-кодона, отличающийся от стандартно используемого этим видом. Кроме того, в некоторых белках селеноцистеин и пирролизин, которые являются нестандартными аминокислотами, вставляются рибосомой. Она прочитывает стоп-кодон. Это зависит от последовательностей, находящихся в мРНК. В настоящее время селеноцистеин считается 21-ой, пирролизан - 22-ой аминокислотой, присутствующей в составе белков.

Общие черты генетического кода

Однако все исключения являются редкостью. У живых организмов в основном генетический код имеет ряд общих признаков. К ним относятся состав кодона, в который входят три нуклеотида (два первых принадлежат к определяющим), передача кодонов тРНК и рибосомами в аминокислотную последовательность.

Генетический код разных организмов обладает некоторыми общими свойствами:
1) Триплетность. Для записи любой, в том числе и наследственной информации используется определенный шифр, элементом которого является буква, или символ. Совокупность таких символов составляет алфавит. Отдельные сообщения записываются комбинацией символов, которые называются кодовыми группами, или кодонами. Известен алфавит, состоящий всего из двух символов, - это азбука Морзе. В ДНК 4 буквы – первые буквы названий азотистых оснований (А, Г, Т, Ц), значит, генетический алфавит состоит всего из 4 символов. Что же является кодовой группой, или, словом генетического кода? Известно 20 основных аминокислот, содержание которых должно быть записано генетическим кодом, т. е. 4 буквы должны дать 20 кодовых слов. Допустим, слово состоит из одного символа, тогда мы получим только 4 кодовые группы. Если же слово состоит из двух символов, то таких групп будет только 16, а этого явно мало, чтобы закодировать 20 аминокислот. Следовательно, в кодовом слове должно быть минимум 3 нуклеотида, что даст 64 (43) сочетания. Такого количества триплетных сочетаний вполне достаточно для кодирования всех аминокислот. Таким образом, кодон генетического кода – это триплет нуклеотидов.
2) Вырожденность (избыточность) – свойство генетического кода состоящее с одной стороны, в том, что он содержит избыточные триплеты, т. е. синонимы, а с другой – «бессмысленные» триплеты. Поскольку код включает 64 сочетания, а кодируются только 20 аминокислот, то некоторые аминокислоты кодируются несколькими триплетами (аргинин, серин, лейцин – шестью; валин, пролин, аланин, глицин, треонин – четырьмя; изолейцин – тремя; фенилаланин, тирозин, гистидин, лизин, аспарагин, глутамин, цистеин, аспарагиновая и глутаминовая кислоты – двумя; метионин и триптофан – одним триплетом). Некоторые кодовые группы (УАА, УАГ, УГА) вообще не несут смысловой нагрузки, т. е. являются «бессмысленными» триплетами. «Бессмысленные», или nonsense, кодоны выполняют функцию терминаторов цепей – знаков препинания в генетическом тексте – служат сигналом окончания синтеза белковой цепи. Такая избыточность кода имеет большое значение для повышения надежности передачи генетической информации.
3) Неперекрываемость. Кодовые триплеты никогда не перекрываются, т. е. всегда транслируются вместе. При считывании информации с молекулы ДНК невозможно использование азотистого основания одного триплета в комбинации с основаниями другого триплета.
4) Однозначность. Нет случаев, когда один и тот же триплет соответствовал бы более чем одной кислоте.
5) Отсутствие разделительных знаков внутри гена. Генетический код считывается с определенного места без запятых.
6) Универсальность. У различных видов живых организмов (вирусов, бактерий, растений, грибов и животных) одинаковые триплеты кодируют одни и те же аминокислоты.
7) Видовая специфичность. Количество и последовательность азотистых оснований в цепи ДНК у разных организмов различные.

В обмене веществ организма ведущая роль принадлежит белкам и нуклеиновым кислотам.
Белковые вещества составляют основу всех жизненно важных структур клетки, обладают необычайно высокой реакционной способностью, наделены каталитическими функциями.
Нуклеиновые кислоты входят в состав важнейшего органа клетки - ядра, а также цитоплазмы, рибосом, митохондрий и т. д. Нуклеиновые кислоты играют важную, первостепенную роль в наследственности, изменчивости организма, в синтезе белка.

План синтеза белка хранится в ядре клетки, а непосредственно синтез происходит вне ядра, поэтому необходима служба доставки закодированного плана из ядра к месту синтеза. Такую службу доставки исполняют молекулы РНК.

Процесс начинается в ядре клетки: раскручивается и открывается часть «лестницы» ДНК. Благодаря этому буквы РНК образуют связи с открытыми буквами ДНК одной из нитей ДНК. Фермент переносит буквы РНК, чтобы соединить их в нить. Так буквы ДНК «переписываются» в буквы РНК. Новообразованная цепочка РНК отделяется, и «лестница» ДНК снова закручивается. Процесс считки информации с ДНК и синтеза по ее матрице РНК называется транскрипцией , а синтезированная РНК называется информационной или и-РНК .

После дальнейших изменений этот вид закодированной и-РНК готов. и-РНК выходит из ядра и направляется к месту синтеза белка, где буквы и-РНК расшифровываются. Каждый набор из трех букв и-РНК образует «букву», обозначающее одну конкретную аминокислоту.

Другой вид РНК отыскивает эту аминокислоту, захватывает ее с помощью фермента и доставляет к месту синтеза белка. Эта РНК называется транспортной, или т-РНК. По мере прочтения и перевода сообщения и-РНК цепочка аминокислот растет. Эта цепочка закручивается и укладывается в уникальную форму, создавая один вид белка. Примечателен даже процесс укладки белка: на то, чтобы с помощью компьютера просчитать все варианты укладки белка среднего размера, состоящего из 100 аминокислот, потребовалось бы 1027 (!) лет. А для образования в организме цепочки из 20 аминокислот требуется не более одной секунды, и этот процесс происходит непрерывно во всех клетках тела.

Гены, генетический код и его свойства.

На Земле живет около 7 млрд людей. Если не считать 25-30 млн пар однояйцовых близнецов, то генетически все люди разные : каждый уникален, обладает неповторимыми наследственными особенностями, свойствами характера, способностями, темпераментом.

Такие различия объясняются различиями в генотипах -наборах генов организма; у каждого он уникален. Генетические признаки конкретного организма воплощаются в белках - следовательно, и строение белка одного человека отличается, хотя и совсем немного, от белка другого человека.

Это не означает , что у людей не встречается совершенно одинаковых белков. Белки, выполняющие одни и те же функции, могут быть одинаковыми или совсем незначительно отличаться одной-двумя аминокислотами друг от друга. Но не существует на Земле людей (за исключением однояйцовых близнецов), у которых все белки были бы одинаковы .

Информация о первичной структуре белка закодирована в виде последовательности нуклеотидов в участке молекулы ДНК, гене – единице наследственной информации организма. Каждая молекула ДНК содержит множество генов. Совокупность всех генов организма составляет его генотип . Таким образом,

Ген – единица наследственной информации организма, которой соответствует отдельный участок ДНК

Кодирование наследственной информации происходит с помощью генетического кода , который универсален для всех организмов и отличается лишь чередованием нуклеотидов, образующих гены, и кодирующих белки конкретных организмов.

Генетический код состоит из троек (триплетов) нуклеотидов ДНК, комбинирующихся в разной последовательности (ААТ, ГЦА, АЦГ, ТГЦ и т.д.), каждый из которых кодирует определенную аминокислоту (которая будет встроена в полипептидную цепь).

Собственно кодом считается последовательность нуклеотидов в молекуле и-РНК , т.к. она снимает информацию с ДНК (процесс транскрипции ) и переводит ее в последовательность аминокислот в молекулах синтезируемых белков (процесс трансляции ).
В состав и-РНК входят нуклеотиды А-Ц-Г-У, триплеты которых называются кодонами : триплет на ДНК ЦГТ на и-РНК станет триплетом ГЦА, а триплет ДНК ААГ станет триплетом УУЦ. Именно кодонами и-РНК отражается генетический код в записи.

Таким образом, генетический код - единая система записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности нуклеотидов . Генетический код основан на использовании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода:

1. Генетический код триплетен . Триплет (кодон) - последовательность трех нуклеотидов, кодирующая одну аминокислоту. Поскольку в состав белков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот остаются незакодированными ). Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, должно быть не менее трех. В этом случае число возможных триплетов нуклеотидов составляет 43 = 64.

2. Избыточность (вырожденность ) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими триплетами (поскольку аминокислот 20, а триплетов - 64), за исключением метионина и триптофана, которые кодируются только одним триплетом. Кроме того, некоторые триплеты выполняют специфические функции: в молекуле и-РНК триплеты УАА, УАГ, УГА - являются терминирующими кодонами, т. е. стоп -сигналами, прекращающими синтез полипептидной цепи. Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Однозначность кода - одновременно с избыточностью коду присуще свойство однозначности : каждому кодону соответствует только одна определенная аминокислота.

4. Коллинеарность кода, т.е. последовательность нуклеотидов в гене точно соответствует последовательности аминокислот в белке.

5. Генетический код неперекрываем и компактен , т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп -сигналов (терминирующих кодонов ).

6. Генетический код универсален , т. е. ядерные гены всех организмов одинаковым образом кодируют информацию о белках вне зависимости от уровня организации и систематического положения этих организмов.

Существуют таблицы генетического кода для расшифровки кодонов и- РНК и построения цепочек белковых молекул.

Реакции матричного синтеза.

В живых системах встречается реакции, неизвестные в неживой природе - реакции матричного синтеза.

Термином "матрица" в технике обозначают форму, употребляемую для отливки монет, медалей, типографского шрифта: затвердевший металл в точности воспроизводит все детали формы, служившей для отливки. Матричный синтез напоминает отливку на матрице: новые молекулы синтезируются в точном соответствии с планом, заложенным в структуре уже существующих молекул.

Матричный принцип лежит в основе важнейших синтетических реакций клетки, та-ких, как синтез нуклеиновых кислот и белков. В этих реакциях обеспечивается точная, строго специфичная последовательность мономерных звеньев в синтезируемых полимерах.

Здесь происходит направленное стягивание мономеров в определенное место клетки - на молекулы, служащие матрицей, где реакция протекает. Если бы такие реакции происходили в результате случайного столкновения молекул, они протекали бы бесконечно медленно. Синтез сложных молекул на основе матричного принципа осуществляется быстро и точно. Роль матрицы в матричных реакциях играют макромолекулы нуклеиновых кислот ДНК или РНК .

Мономерные молекулы , из которых синтезируется полимер, - нуклеотиды или аминокислоты - в соответствии с принципом комплементарности располагаются и фиксируются на матрице в строго определенном, заданном порядке.

Затем происходит "сшивание" мономерных звеньев в полимерную цепь , и готовый полимер сбрасывается с матрицы.

После этого матрица готова к сборке новой полимерной молекулы. Понятно, что как на данной форме может производиться отливка только какой-то одной монеты, одной буквы, так и на данной матричной молекуле может идти "сборка" только какого-то одного полимера.

Матричный тип реакций - специфическая особенность химизма живых систем. Они являются основой фундаментального свойства всего живого - его способности к воспроизведению себе подобного.

Реакции матричного синтеза

1. Репликация ДНК - реплика́ция (от лат. replicatio - возобновление) - процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской молекулы ДНК. В ходе последующего деления материнской клетки каждая дочерняя клетка получает по одной копии молекулы ДНК, которая является идентичной ДНК исходной материнской клетки. Этот процесс обеспечивает точную передачу генетической информации из поколения в поколение. Репликацию ДНК осуществляет сложный ферментный комплекс, состоящий из 15-20 различных белков, называемый реплисомой . Материалом для синтеза служат свободные нуклеотиды, имеющиеся в цитоплазме клеток. Биологический смысл репликации заключается в точной передаче наследственной информации от материнской молекулы к дочерним, что в норме и происходит при делении соматических клеток.

Молекула ДНК состоит из двух комплементарных цепей. Эти цепи удерживаются слабыми водородными связями, способными разрываться под действием ферментов. Молекула ДНК способна к самоудвоению (репликации), причем на каждой старой половине молекулы синтезируется новая ее половина.
Кроме того, на молекуле ДНК может синтезироваться молекула и-РНК, которая затем переносит полученную от ДНК информацию к месту синтеза белка.

Передача информации и синтез белка идут по матричному принципу, сравнимому с работой печатного станка в типографии. Информация от ДНК многократно копируется. Если при копировании произойдут ошибки, то они повторятся во всех последующих копиях.

Правда, некоторые ошибки при копировании информации молекулой ДНК могут исправляться - процесс устранения ошибок называется репарацией . Первой из реакций в процессе передачи информации является репликация молекулы ДНК и синтез новых цепей ДНК.

2. Транскрипция (от лат. transcriptio - переписывание) - процесс синтеза РНК с использованием ДНК в качестве матрицы, происходящий во всех живых клетках. Другими словами, это перенос генетической информации с ДНК на РНК.

Транскрипция катализируется ферментом ДНК-зависимой РНК-полимеразой. РНК-полимераза движется по молекуле ДНК в направлении 3" → 5". Транскрипция состоит из стадий инициации, элонгации и терминации . Единицей транскрипции является оперон, фрагмент молекулы ДНК, состоящий из промотора, транскрибируемой части и терминатора . и-РНК состоит из одной цепи и синтезируется на ДНК в соответствии с правилом комплементарности при участии фермента, который активирует начало и конец синтеза молекулы и-РНК.

Готовая молекула и-РНК выходит в цитоплазму на рибосомы, где происходит синтез полипептидных цепей.

3. Трансляция (от лат. translatio - перенос, перемещение) - процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК, мРНК), осуществляемый рибосомой. Иными словами, это процесс перевода информации, со-держащейся в последовательности нуклеотидов и-РНК, в последовательность амино-кислот в полипептиде.

4. Обратная транскрипция - это процесс образования двуцепочечной ДНК на основании информации из одноцепочечной РНК. Данный процесс называется обратной транскрипцией, так как передача генетической информации при этом происходит в «обратном», относительно транскрипции, направлении. Идея обратной транскрипции вначале была очень непопулярна, так как противоречила центральной догме молекулярной биологии, которая предполагала, что ДНК транскрибируется в РНК и далее транслируется в белки.

Однако в 1970 году Темин и Балтимор независимо друг от друга открыли фермент, названный обратной транскриптазой (ревертазой) , и возможность обратной транскрипции была окончательно подтверждена. В 1975 году Темину и Балтимору была присуждена Нобелевская премия в области физиологии и медицины. Некоторые вирусы (такие как вирус иммунодефицита человека, вызывающий ВИЧ-инфекцию), имеют возможность транскрибировать РНК в ДНК. ВИЧ имеет РНК-геном, который встраивается в ДНК. В результате, ДНК вируса может быть объединена с геномом клетки-хозяина. Главный фермент, ответственный за синтез ДНК из РНК, называется ревертазой . Одной из функций ревертазы является создание комплементарной ДНК (кДНК) из вирусного генома. Ассоциированный фермент рибонуклеаза расщепляет РНК, а ревертаза синтезирует кДНК из двойной спирали ДНК. кДНК интегрируется в геном клетки-хозяина с помощью интегразы. Результатом является синтез вирусных протеинов клеткой-хозяином , которые образуют новые вирусы. В случае с ВИЧ так же программируется апоптоз (смерть клетки) Т-лимфоцитов. В иных случаях клетка может остаться распространителем вирусов.

Последовательность матричных реакций при биосинтезе белков можно представить в виде схемы.

Таким образом, биосинтез белка – это один из видов пластического обмена, в ходе которого наследственная информация, закодированная в генах ДНК, реализуется в определенную последовательность аминокислот в белковых молекулах.

Молекулы белков по существу представляют собой полипептидные цепочки , составленные из отдельных аминокислот. Но аминокислоты недостаточно активны, чтобы соединиться между собой самостоятельно. Поэтому, прежде чем соединиться друг с другом и образовать молекулу белка, аминокислоты должны активироваться . Эта активация происходит под действием особых ферментов.

В результате активирования аминокислота становится более лабильной и под действием того же фермента связывается с т-РНК . Каждой аминокислоте соответствует строго специфическая т-РНК , которая находит «свою» аминокислоту и переносит ее в рибосому.

Следовательно, в рибосому поступают различные активированные аминокислоты, соединенные со своими т-РНК . Рибосома представляет собой как бы конвейер для сборки цепочки белка из поступающих в него различных аминокислот.

Одновременно с т-РНК, на которой «сидит» своя аминокислота, в рибосому поступает «сигнал » от ДНК, которая содержится в ядре. В соответствии с этим сигналом в рибосоме синтезируется тот или иной белок.

Направляющее влияние ДНК на синтез белка осуществляется не непосредственно, а с помощью особого посредника – матричной или информационной РНК (м-РНК или и-РНК ), которая синтезируется в ядр е под влиянием ДНК, поэтому ее состав отражает состав ДНК. Молекула РНК представляет собой как бы слепок с формы ДНК. Синтезированная и-РНК поступает в рибосому и как бы передает этой структуре план - в каком порядке должны соединяться друг с другом поступившие в рибосому активированные аминокислоты, чтобы синтезировался определенный белок. Иначе, генетическая информация, закодированная в ДНК, передается на и- РНК и далее на белок .

Молекула и-РНК поступает в рибосому и прошивает ее. Тот ее отрезок, который находится в данный момент в рибосоме, определенный кодоном (триплет) , взаимо-действует совершенно специфично с подходящим к нему по строению триплетом (антикодоном) в транспортной РНК, которая принесла в рибосому аминокислоту.

Транспортная РНК со своей аминокислотой подходит к определенному кодону и-РНК и соединяется с ним; к следующему, соседнему участку и- РНК присоединяется другая т-РНК с другой аминокислотой и так до тех пор, пока не будет считана вся цепочка и-РНК, пока не нанижутся все аминокислоты в соответствующем порядке, образуя молекулу белка. А т-РНК, которая доставила аминокислоту к определенному участку полипептидной цепи, освобождается от своей аминокислоты и выходит из рибосомы.

Затем снова в цитоплазме к ней может присоединиться нужная аминокислота, и она снова перенесет ее в рибосому. В процессе синтеза белка участвует одновременно не одна, а несколько рибосом - полирибосомы.

Основные этапы передачи генетической информации:

1. Синтез на ДНК как на матрице и-РНК (транскрипция)
2. Синтез в рибосомах полипептидной цепи по программе, содержащейся в и-РНК (трансляция) .

Этапы универсальны для всех живых существ, но временные и пространственные взаимоотношения этих процессов различаются у про- и эукариотов.

У прокариот транскрипция и трансляция могут осуществляться одновременно, поскольку ДНК находится в цитоплазме. У эукариот транскрипция и трансляция строго разделены в пространстве и времени: синтез различных РНК происходит в ядре, после чего молекулы РНК должны покинуть пределы ядра, пройдя через ядерную мембрану. Затем в цитоплазме РНК транспортируются к месту синтеза белка.

ГЕНЕТИЧЕСКИЙ КОД, система записи наследственной информации в виде последовательности оснований нуклеотидов в молекулах ДНК (у некоторых вирусов - РНК), определяющая первичную структуру (расположение аминокислотных остатков) в молекулах белков (полипептидов). Проблема генетического кода была сформулирована после доказательства генетической роли ДНК (американские микробиологи О. Эйвери, К. Мак-Леод, М. Маккарти, 1944) и расшифровки её структуры (Дж. Уотсон, Ф. Крик, 1953), после установления того, что гены определяют структуру и функции ферментов (принцип «один ген - один фермент» Дж. Бидла и Э. Тейтема, 1941) и что существует зависимость пространственной структуры и активности белка от его первичной структуры (Ф. Сенгер, 1955). Вопрос о том, как комбинации из 4 оснований нуклеиновых кислот определяют чередование 20 обычных аминокислотных остатков в полипептидах, впервые поставил Г. Гамов в 1954 году.

На основании эксперимента, в котором исследовали взаимодействия вставок и выпадений пары нуклеотидов, в одном из генов бактериофага Т4 Ф. Крик и другие учёные в 1961 году определили общие свойства генетического кода: триплетность, т. е. каждому аминокислотному остатку в полипептидной цепи соответствует набор из трёх оснований (триплет, или кодон) в ДНК гена; считывание кодонов в пределах гена идёт с фиксированной точки, в одном направлении и «без запятых», то есть кодоны не отделены какими-либо знаками друг от друга; вырожденность, или избыточность, - один и тот же аминокислотный остаток могут кодировать несколько кодонов (кодоны-синонимы). Авторы предположили, что кодоны не перекрываются (каждое основание принадлежит только одному кодону). Прямое изучение кодирующей способности триплетов было продолжено с использованием бесклеточной системы синтеза белка под контролем синтетической матричной РНК (мРНК). К 1965 году генетический код был полностью расшифрован в работах С. Очоа, М. Ниренберга и Х. Г. Кораны. Раскрытие тайны генетического кода явилось одним из выдающихся достижений биологии в 20 веке.

Реализация генетического кода в клетке происходит в ходе двух матричных процессов - транскрипции и трансляции. Посредником между геном и белком является мРНК, образующаяся в процессе транскрипции на одной из нитей ДНК. При этом последовательность оснований ДНК, несущая информацию о первичной структуре белка, «переписывается» в виде последовательности оснований мРНК. Затем в ходе трансляции на рибосомах последовательность нуклеотидов мРНК считывается транспортными РНК (тРНК). Последние имеют акцепторный конец, к которому присоединяется аминокислотный остаток, и адаптерный конец, или антикодон-триплет, который узнаёт соответствующий кодон мРНК. Взаимодействие кодона и анти-кодона происходит на основании комплементарного спаривания оснований: Аденин (А) - Урацил (U), Гуанин (G) - Цитозин (С); при этом последовательность оснований мРНК переводится в аминокислотную последовательность синтезирующегося белка. Различные организмы используют для одной и той же аминокислоты разные кодоны-синонимы с разной частотой. Считывание мРНК, кодирующей полипептидную цепь, начинается (инициируется) с кодона AUG, соответствующего аминокислоте метионину. Реже у прокариот инициирующими кодонами служат GUG (валин), UUG (лейцин), AUU (изолейцин), у эукариот - UUG (лейцин), AUA (изолейцин), ACG (треонин), CUG (лейцин). Это задаёт так называемую рамку, или фазу, считывания при трансляции, то есть далее всю нуклеотидную последовательность мРНК считывают триплет за триплетом тРНК до тех пор, пока на мРНК не встретится любой из трёх кодонов-терминаторов, часто называемых стоп-кодонами: UAA, UAG, UGA (таблица). Считывание этих триплетов приводит к завершению синтеза полипептидной цепи.

Кодоны AUG и стоп-кодоны стоят соответственно в начале и в конце участков мРНК, кодирующих полипептиды.

Генетический кода квазиуниверсален. Это значит, что существуют небольшие вариации в значении некоторых кодонов у разных объектов, и это касается, прежде всего, кодонов-терминаторов, которые могут быть значащими; например, в митохондриях некоторых эукариот и у микоплазм UGA кодирует триптофан. Кроме того, в некоторых мРНК бактерий и эукариот UGA кодирует необычную аминокислоту - селеноцистеин, а UAG у одной из архебактерий - пирролизин.

Существует точка зрения, согласно которой генетический кода возник случайно (гипотеза «замороженного случая»). Более вероятно, что он эволюционировал. В пользу такого предположения говорит существование более простого и, по-видимому, более древнего варианта кода, который считывается в митохондриях согласно правилу «два из трёх», когда аминокислоту определяют только два из трёх оснований в триплете.

Лит.: Crick F. Н. а. о. General nature of the genetic code for proteins // Nature. 1961. Vol. 192; The genetic code. N. Y., 1966; Ичас М. Биологический код. М., 1971; Инге-Вечтомов С. Г. Как читается генетический код: правила и исключения // Современное естествознание. М., 2000. Т. 8; Ратнер В. А. Генетический код как система // Соросовский образовательный журнал. 2000. Т. 6. № 3.

С. Г. Инге-Вечтомов.

ГЕНЕТИЧЕСКИЙ КОД (греч, genetikos относящийся к происхождению; син.: код, биологический код, аминокислотный код, белковый код, код нуклеиновых к-т ) - система записи наследственной информации в молекулах нуклеиновых кислот животных, растений, бактерий и вирусов чередованием последовательности нуклеотидов.

Генетическая информация (рис.) из клетки в клетку, из поколения в поколение, за исключением РНК-содержащих вирусов, передается путем редупликации молекул ДНК (см. Репликация). Реализация наследственной информации ДНК в процессе жизнедеятельности клетки осуществляется через 3 типа РНК: информационную (иРНК или мРНК), рибосомную (рРНК) и транспортную (тРНК), которые с помощью фермента РНК-полимеразы синтезируются на ДНК как на матрице. При этом последовательность нуклеотидов в молекуле ДНК однозначно определяет последовательность нуклеотидов во всех трех типах РНК (см. Транскрипция). Информацию гена (см.), кодирующего белковую молекулу, несет только иРНК. Конечным продуктом реализации наследственной информации является синтез белковых молекул, специфичность которых определяется последовательностью входящих в них аминокислот (см. Трансляция).

Поскольку в составе ДНК или РНК представлено только по 4 разных азотистых основания [в ДНК - аденин (А), тимин (Т), гуанин (Г), цитозин (Ц); в РНК - аденин (А), урацил (У), цитозин (Ц), гуанин (Г)], последовательность которых определяет последовательность 20 аминокислот в составе белка, возникает проблема Г. к., т. е. проблема перевода 4-буквенного алфавита нуклеиновых к-т в 20-буквенный алфавит полипептидов.

Впервые идея матричного синтеза белковых молекул с правильным предсказанием свойств гипотетической матрицы была сформулирована Н. К. Кольцовым в 1928 г. В 1944 г. Эйвери (О. Avery) с соавт, установил, что за передачу наследственных признаков при трансформации у пневмококков ответственны молекулы ДНК. В 1948 г. Чаргафф (E. Chargaff) показал, что во всех молекулах ДНК имеет место количественное равенство соответствующих нуклеотидов (А-T, Г-Ц). В 1953 г. Ф. Крик, Дж. Уотсон и Уилкинс (М. H. F. Wilkins), исходя из этого правила и данных рентгеноструктурного анализа (см.), пришли к выводу, что молекул а ДНК представляет собой двойную спираль, состоящую из двух полинуклеотидных нитей, соединенных между собой водородными связями. Причем против А одной цепи во второй может находиться только Т, против Г - только Ц. Эта комплементарность приводит к тому, что последовательность нуклеотидов одной цепи однозначно определяет последовательность другой. Второй существенный вывод, вытекающий из этой модели,- молекула ДНК способна к самовоспроизведению.

В 1954 г. Гамов (G. Gamow) сформулировал проблему Г. к. в ее современном виде. В 1957 г. Ф. Крик высказал Гипотезу адаптера, предположив, что аминокислоты взаимодействуют с нуклеиновой к-той не непосредственно, а через посредников (теперь известных под названием тРНК). В ближайшие после этого годы все принципиальные звенья общей схемы передачи генетической информации, вначале гипотетичные, были подтверждены экспериментально. В 1957 г. были открыты иРНК [А. С. Спирин, А. Н. Белозерский с соавт.; Фолькин и Астрахан (E. Volkin, L. Astrachan)] и тРНК [Хоугленд (М. В. Hoagland)]; в 1960 г. синтезирована ДНК вне клетки с использованием в качестве матрицы существующих макромолекул ДНК (А. Корнберг) и открыт ДНК-зависимый синтез РНК [Вейсс (S. В. Weiss) с соавт.]. В 1961 г. была создана бесклеточная система, в к-рой в присутствии естественной РНК или синтетических полирибонуклеотидов осуществлялся синтез белковоподобных веществ [М. Ниренберг и Маттеи (J. H. Matthaei)]. Проблема познания Г. к. состояла из исследования общих свойств кода и собственно его расшифровки, т. е. выяснения, какие комбинации нуклеотидов (кодоны) кодируют определенные аминокислоты.

Общие свойства кода были выяснены независимо от его расшифровки и в основном до нее путем анализа молекулярных закономерностей образования мутаций (Ф. Крик и соавт., 1961; Н. В. Лучник, 1963). Они сводятся к следующему:

1. Код универсален, т. е. идентичен, по крайней мере в основном, для всех живых существ.

2. Код триплетен, т. е. каждая аминокислота кодируется тройкой нуклеотидов.

3. Код неперекрывающийся, т. е. данный нуклеотид не может входить в состав более чем одного кодона.

4. Код вырожден, т. е. одна аминокислота может кодироваться несколькими триплетами.

5. Информация о первичной структуре белка считывается с иРНК последовательно, начиная с фиксированной точки.

6. Большинство возможных триплетов имеет «смысл», т. е. кодирует аминокислоты.

7. Из трех «букв» кодона преимущественное значение имеют лишь две (облигатные), третья же (факультативная) несет значительно меньшую информацию.

Прямая расшифровка кода состояла бы в сравнении последовательности нуклеотидов в структурном гене (или синтезированной на нем иРНК) с последовательностью аминокислот в соответствующем белке. Однако такой путь пока технически невозможен. Были применены два других пути: синтез белка в бесклеточной системе с использованием в качестве матрицы искусственных полирибонуклеотидов известного состава и анализ молекулярных закономерностей образования мутаций (см.). Первый принес положительные результаты раньше и исторически сыграл в расшифровке Г. к. большую роль.

В 1961 г. М. Ниренберг и Маттеи применили в качестве матрицы гомо-полимер - синтетическую полиуридиловую к-ту (т. е. искусственную РНК состава УУУУ...) и получили полифенилаланин. Из этого следовало, что кодон фенилаланина состоит из нескольких У, т. е. в случае триплетного кода расшифровывается как УУУ. Позже наряду с гомополимерами были использованы полирибонуклеотиды, состоявшие из разных нуклеотидов. При этом был известен только состав полимеров, расположение же нуклеотидов в них было статистическим, поэтому и анализ результатов был статистическим и давал косвенные выводы. Довольно быстро удалось найти хотя бы по одному триплету для всех 20 аминокислот. Выяснилось, что присутствие органических растворителей, изменение pH или температуры, некоторые катионы и особенно антибиотики делают код неоднозначным: те же кодоны начинают стимулировать включение других аминокислот, в некоторых случаях один кодон начинал кодировать до четырех разных аминокислот. Стрептомицин влиял на считывание информации как в бесклеточных системах, так и in vivo, причем был эффективен только на стрептомицинчувствительных штаммах бактерий. У стрептомицинзависимых штаммов он «исправлял» считывание с кодонов, изменившихся в результате мутации. Подобные результаты давали основание сомневаться в правильности расшифровки Г. к. с помощью бесклеточной системы; требовалось подтверждение, и в первую очередь данными in vivo.

Основные данные о Г. к. in vivo получены при анализе аминокислотного состава белков у организмов, обработанных мутагенами (см.) с известным механизмом действия, напр, азотистой к-той, к-рая вызывает в молекуле ДНК замену Ц на У и А на Г. Полезную информацию дают также анализ мутаций, вызванных неспецифическими мутагенами, сравнение различий в первичной структуре родственных белков у разных видов, корреляция между составом ДНК и белков и т. п.

Расшифровка Г. к. на основании данных in vivo и in vitro дала совпадающие результаты. Позже были разработаны три других метода расшифровки кода в бесклеточных системах: связывание аминоацил-тРНК (т. е. тРНК с присоединенной активированной аминокислотой) тринуклеотидами известного состава (М. Ниренберг и соавт., 1965), связывание аминоацил-тРНК полинуклеотидами, начинающимися с определенного триплета (Маттеи с соавт., 1966), и использование в качестве иРНК полимеров, в которых известен не только состав, но и порядок нуклеотидов (X. Корана и соавт., 1965). Все три метода дополняют друг друга, а результаты находятся в соответствии с данными, полученными в опытах in vivo.

В 70-х гг. 20 в. появились методы особенно надежной проверки результатов расшифровки Г. к. Известно, что мутации, возникающие под действием профлавина, состоят в выпадении или вставке отдельных нуклеотидов, что приводит к сдвигу рамки считывания. У фага Т4 был вызван профлавином ряд мутаций, при которых изменился состав лизоцима. Этот состав был проанализирован и сопоставлен с теми кодонами, которые должны были получиться при сдвиге рамки считывания. Получилось полное соответствие. Дополнительно этот метод позволил установить, какие именно триплеты вырожденного кода кодируют каждую из аминокислот. В 1970 г. Адамсу (J. М. Adams) с сотрудниками удалось провести частичную расшифровку Г. к. прямым методом: у фага R17 определили последовательность оснований во фрагменте длиной в 57 нуклеотидов и сравнили с аминокислотной последовательностью белка его оболочки. Результаты полностью совпали с полученными менее прямыми методами. Т. о., код расшифрован полностью и верно.

Результаты расшифровки сведены в таблицу. В ней указан состав кодонов и РНК. Состав антикодонов тРНК комплементарен кодонам иРНК, т. е. вместо У в них находится А, вместо А - У, вместо Ц - Г и вместо Г - Ц, и соответствует кодонам структурного гена (той нити ДНК, с к-рой считывается информация) с той лишь разницей, что место тимина занимает урацил. Из 64 триплетов, которые могут быть образованы сочетанием 4 нуклеотидов, 61 имеет «смысл», т. е. кодирует аминокислоты, а 3 являются «нонсенсами» (лишенными смысла). Между составом триплетов и их смыслом имеется довольно четкая зависимость, к-рая была обнаружена еще при анализе общих свойств кода. В ряде случаев триплеты, кодирующие определенную аминокислоту (напр., пролин, аланин), характеризуются тем, что два первых нуклеотида (облигатные) у них одинаковы, а третий (факультативный) может быть любым. В других случаях (при кодировании, напр., аспарагина, глутамина) один и тот же смысл имеют два сходных триплета, у которых совпадают два первых нуклеотида, а на месте третьего стоит любой пурин или любой пиримидин.

Нонсенс-кодоны, 2 из которых имеют специальные названия, соответствующие обозначению фаговых мутантов (УАА-охра, УАГ-амбер, УГА-опал), хотя и не кодируют каких-либо аминокислот, но имеют большое значение при считывании информации, кодируя конец полипептидной цепи.

Считывание информации происходит в направлении от 5 1 -> 3 1 - к концу нуклеотидной цепи (см. Дезоксирибонуклеиновые кислоты). При этом синтез белка идет от аминокислоты со свободной аминогруппой к аминокислоте со свободной карбоксильной группой. Начало синтеза кодируется триплетами АУГ и ГУГ, которые в этом случае включают специфичную стартовую аминоацил-тРНК, а именно N-формилметио-нил-тРНК. Эти же триплеты при локализации внутри цепи кодируют соответственно метионин и валин. Неоднозначность снимается тем, что началу считывания предшествует нонсенс. Есть данные, говорящие в пользу того, что граница между участками иРНК, кодирующими разные белки, состоит более чем из двух триплетов и что в этих местах меняется вторичная структура РНК; этот вопрос находится в стадии исследования. Если нонсенс-кодон возникает внутри структурного гена, то соответствующий белок строится только до места расположения этого кодона.

Открытие и расшифровка генетического кода - выдающееся достижение молекулярной биологии - оказало влияние на все биол, науки, положив в ряде случаев начало развитию специальных крупных разделов (см. Молекулярная генетика). Эффект открытия Г. к. и связанных с ним исследований сравнивают с тем эффектом, который оказала на биол, науки теория Дарвина.

Универсальность Г. к. является прямым доказательством универсальности основных молекулярных механизмов жизни у всех представителей органического мира. Между тем большие различия в функциях генетического аппарата и его строении при переходе от прокариотов к эукариотам и от одноклеточных к многоклеточным, вероятно, связаны и с молекулярными различиями, исследование которых - одна из задач будущего. Поскольку исследования Г. к.- дело лишь последних лет, значение полученных результатов для практической медицины носит лишь Косвенный характер, позволяя пока понять природу заболеваний, механизм действия возбудителей болезней и лекарственных веществ. Однако открытие таких явлений, как трансформация (см.), трансдукция (см.), супрессия (см.), указывает на принципиальную возможность исправления патологически измененной наследственной информации или ее коррекции - так наз. генная инженерия (см.).

Таблица. ГЕНЕТИЧЕСКИЙ КОД

Первый нуклеотид кодона

Второй нуклеотид кодона

Третий, нуклеотид кодона

Фенилаланин

J Нонсенс

Триптофан

Гистидин

Глутаминовая кислота

Изолейцин

Аспарагиновая

Метионин

Аспарагин

Глутамин

* Кодирует конец цепи.

** Кодирует также начало цепи.

Библиография: Ичас М. Биологический код, пер. с англ., М., 1971; Лучник Н.Б. Биофизика цитогенетических поражений и генетический код, Л., 1968; Молекулярная генетика, пер. с англ., под ред. А. Н. Белозерского, ч. 1, М., 1964; Нуклеиновые кислоты, пер. с англ., под ред. А. Н. Белозерского, М., 1965; Уотсон Дж. Д. Молекулярная биология гена, пер. с англ., М., 1967; Физиологическая генетика, под ред. М. Е. Лобашева С. Г., Инге-Вечтомо-ва, Л., 1976, библиогр.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„ E. Geissler, B., 1972; The genetic code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. The genetic code, N. Y. a. o., 1967.