Comment appelle-t-on la propriété du code génétique ? Qu'est-ce que le code génétique: informations générales

Grâce au processus de transcription dans une cellule, l'information est transférée de l'ADN à la protéine : ADN - i-ARN - protéine. L'information génétique contenue dans l'ADN et l'ARNm est contenue dans la séquence de nucléotides dans les molécules. Comment s'effectue la traduction de l'information du « langage » des nucléotides vers le « langage » des acides aminés ? Cette traduction est réalisée à l'aide du code génétique. Un code, ou chiffre, est un système de symboles permettant de traduire une forme d'information en une autre. Le code génétique est un système d'enregistrement d'informations sur la séquence d'acides aminés dans les protéines en utilisant la séquence de nucléotides dans l'ARN messager. L'importance de la séquence des mêmes éléments (quatre nucléotides dans l'ARN) pour comprendre et préserver le sens de l'information peut être vue avec un exemple simple : en réarrangeant les lettres dans le mot code, on obtient un mot avec une signification différente - doc. Quelles sont les propriétés du code génétique ?

1. Le code est triplet. L'ARN se compose de 4 nucléotides : A, G, C, U. Si nous essayions de désigner un acide aminé avec un nucléotide, alors 16 acides aminés sur 20 resteraient non cryptés. Un code à deux lettres coderait pour 16 acides aminés (à partir de quatre nucléotides, 16 combinaisons différentes peuvent être faites, chacune ayant deux nucléotides). La nature a créé un code à trois lettres, ou triplet. Cela signifie que chacun des 20 acides aminés est codé par une séquence de trois nucléotides appelée triplet ou codon. A partir de 4 nucléotides, vous pouvez créer 64 combinaisons différentes de 3 nucléotides chacune (4*4*4=64). C'est plus que suffisant pour coder 20 acides aminés et, semble-t-il, 44 codons sont superflus. Cependant, ce n'est pas le cas.

2. Le code est dégénéré. Cela signifie que chaque acide aminé est codé par plus d'un codon (deux à six). Les exceptions sont les acides aminés méthionine et tryptophane, dont chacun est codé par un seul triplet. (Cela peut être vu à partir du tableau du code génétique.) Le fait que la méthionine soit codée par un triplet OUT a une signification particulière, qui vous deviendra claire plus tard (16).

3. Le code est sans ambiguïté. Chaque codon code pour un seul acide aminé. Chez toutes les personnes en bonne santé, dans le gène qui porte l'information sur la chaîne bêta de l'hémoglobine, le triplet GAA ou GAG, I, qui occupe la sixième place, code pour l'acide glutamique. Chez les patients atteints d'anémie falciforme, le deuxième nucléotide de ce triplet est remplacé par U. Comme le montre le tableau, les triplets GUA ou GUG, qui sont formés dans ce cas, codent pour l'acide aminé valine. À quoi mène un tel remplacement, vous le savez déjà dans la section sur l'ADN.

4. Il y a des « signes de ponctuation » entre les gènes. Dans le texte imprimé, il y a un point à la fin de chaque phrase. Plusieurs phrases apparentées forment un paragraphe. Dans le langage de l'information génétique, un tel paragraphe est un opéron et son ARNm complémentaire. Chaque gène de l'opéron code pour une chaîne polypeptidique - une phrase. Étant donné que dans un certain nombre de cas, plusieurs chaînes polypeptidiques différentes sont séquentiellement créées le long de la matrice d'ARNm, elles doivent être séparées les unes des autres. Pour cela, il existe trois triplets spéciaux dans le code génétique - UAA, UAG, UGA, dont chacun indique l'arrêt de la synthèse d'une chaîne polypeptidique. Ainsi, ces triplets remplissent la fonction de signes de ponctuation. Ils sont à la fin de chaque gène. Il n'y a pas de « signes de ponctuation » à l'intérieur du gène. Puisque le code génétique est comme un langage, analysons cette propriété à l'aide de l'exemple d'une telle phrase composée de triplets : le chat vivait tranquillement, ce chat était fâché contre moi. Le sens de ce qui est écrit est clair, malgré l'absence de "signes de ponctuation. Si on enlève une lettre dans le premier mot (un nucléotide dans le gène), mais qu'on lit aussi en triplets de lettres, alors on obtient un non-sens : ilb ylk ott ihb yls yls erm ilm no otk se produit lorsqu'un ou deux nucléotides manquent dans le gène. La protéine qui sera lue à partir d'un gène aussi endommagé n'aura rien à voir avec la protéine codée par le gène normal.

6. Le code est universel. Le code génétique est le même pour toutes les créatures vivant sur Terre. Chez les bactéries et les champignons, le blé et le coton, les poissons et les vers, les grenouilles et les humains, les mêmes triplets codent les mêmes acides aminés.

CODE GÉNÉTIQUE, un procédé d'enregistrement d'informations héréditaires dans des molécules d'acides nucléiques sous la forme d'une séquence de nucléotides formant ces acides. Une certaine séquence de nucléotides dans l'ADN et l'ARN correspond à une certaine séquence d'acides aminés dans les chaînes polypeptidiques des protéines. Il est d'usage d'écrire le code en utilisant des lettres majuscules de l'alphabet russe ou latin. Chaque nucléotide est désigné par la lettre qui commence le nom de la base azotée qui fait partie de sa molécule : A (A) - adénine, G (G) - guanine, C (C) - cytosine, T (T) - thymine ; dans l'ARN, au lieu de la thymine, l'uracile est U (U). Chacun est codé par une combinaison de trois nucléotides - un triplet ou codon. En bref, la manière de transférer l'information génétique est résumée dans le soi-disant. le dogme central de la biologie moléculaire : ADN ` ARN f protéine.

Dans des cas particuliers, l'information peut être transférée de l'ARN à l'ADN, mais jamais de la protéine aux gènes.

La réalisation de l'information génétique s'effectue en deux étapes. Dans le noyau cellulaire, l'information ou la matrice, l'ARN (transcription) est synthétisé sur l'ADN. Dans ce cas, la séquence nucléotidique de l'ADN est "réécrite" (recodée) dans la séquence nucléotidique de l'ARNm. Ensuite, l'ARNm passe dans le cytoplasme, se fixe au ribosome et sur celui-ci, comme sur une matrice, une chaîne protéique polypeptidique est synthétisée (traduction). Les acides aminés à l'aide d'ARN de transfert sont attachés à la chaîne en construction dans une séquence déterminée par l'ordre des nucléotides dans l'ARNm.

À partir des quatre "lettres", vous pouvez créer 64 "mots" différents de trois lettres (codons). Sur les 64 codons, 61 codent pour certains acides aminés et trois sont responsables de l'achèvement de la synthèse de la chaîne polypeptidique. Puisqu'il y a 61 codons pour 20 acides aminés qui composent les protéines, certains acides aminés sont codés par plus d'un codon (ce qu'on appelle la dégénérescence du code). Une telle redondance augmente la fiabilité du code et de l'ensemble du mécanisme de biosynthèse des protéines. Une autre propriété du code est sa spécificité (non ambiguïté) : un codon code pour un seul acide aminé.

De plus, le code ne se chevauche pas - les informations sont lues séquentiellement dans une direction, triplet par triplet. La propriété la plus étonnante du code est son universalité : il est le même pour tous les êtres vivants - des bactéries à l'homme (à l'exception du code génétique des mitochondries). Les scientifiques y voient une confirmation du concept de l'origine de tous les organismes à partir d'un ancêtre commun.

Le décodage du code génétique, c'est-à-dire la détermination de la "signification" de chaque codon et des règles de lecture des informations, a été réalisé en 1961-1965. et est considérée comme l'une des réalisations les plus remarquables de la biologie moléculaire.

Chaque organisme vivant possède un ensemble particulier de protéines. Certains composés de nucléotides et leur séquence dans la molécule d'ADN forment le code génétique. Il véhicule des informations sur la structure de la protéine. En génétique, un certain concept a été adopté. Selon elle, un gène correspondait à une enzyme (polypeptide). Il faut dire que les recherches sur les acides nucléiques et les protéines sont menées depuis assez longtemps. Plus loin dans l'article, nous examinerons de plus près le code génétique et ses propriétés. Une brève chronologie des recherches sera également donnée.

Terminologie

Le code génétique est un moyen de coder la séquence protéique d'acides aminés à l'aide de la séquence nucléotidique. Cette méthode de formation de l'information est caractéristique de tous les organismes vivants. Les protéines sont des substances organiques naturelles à haut poids moléculaire. Ces composés sont également présents dans les organismes vivants. Ils se composent de 20 types d'acides aminés, appelés canoniques. Les acides aminés sont disposés en chaîne et reliés selon une séquence strictement établie. Il détermine la structure de la protéine et ses propriétés biologiques. Il existe également plusieurs chaînes d'acides aminés dans la protéine.

ADN et ARN

L'acide désoxyribonucléique est une macromolécule. Elle est responsable de la transmission, du stockage et de la mise en œuvre des informations héréditaires. L'ADN utilise quatre bases azotées. Ceux-ci comprennent l'adénine, la guanine, la cytosine, la thymine. L'ARN est constitué des mêmes nucléotides, à l'exception de celui qui contient de la thymine. Au lieu de cela, un nucléotide contenant de l'uracile (U) est présent. Les molécules d'ARN et d'ADN sont des chaînes de nucléotides. Grâce à cette structure, des séquences sont formées - "l'alphabet génétique".

Mise en œuvre des informations

La synthèse d'une protéine codée par un gène est réalisée en combinant l'ARNm sur une matrice d'ADN (transcription). Il y a aussi un transfert du code génétique dans une séquence d'acides aminés. C'est-à-dire que la synthèse de la chaîne polypeptidique sur l'ARNm a lieu. Pour coder tous les acides aminés et signaler la fin de la séquence protéique, 3 nucléotides suffisent. Cette chaîne s'appelle un triplet.

Historique de la recherche

L'étude des protéines et des acides nucléiques est pratiquée depuis longtemps. Au milieu du XXe siècle, les premières idées sur la nature du code génétique sont enfin apparues. En 1953, on a découvert que certaines protéines sont constituées de séquences d'acides aminés. Certes, à cette époque, ils ne pouvaient pas encore déterminer leur nombre exact et il y avait de nombreuses disputes à ce sujet. En 1953, Watson et Crick ont ​​publié deux articles. Le premier déclarait la structure secondaire de l'ADN, le deuxième parlait de sa copie admissible au moyen de la synthèse matricielle. De plus, l'accent a été mis sur le fait qu'une séquence particulière de bases est un code porteur d'informations héréditaires. Le physicien américain et soviétique Georgy Gamov a admis l'hypothèse de codage et a trouvé une méthode pour la tester. En 1954, ses travaux ont été publiés, au cours desquels il a avancé une proposition pour établir des correspondances entre les chaînes latérales d'acides aminés et les "trous" en forme de losange et les utiliser comme mécanisme de codage. Ensuite, il a été appelé rhombique. Expliquant son travail, Gamow a admis que le code génétique pourrait être un triplet. Le travail d'un physicien était l'un des premiers parmi ceux qui étaient considérés comme proches de la vérité.

Classification

Après plusieurs années, différents modèles de codes génétiques ont été proposés, représentant deux types : chevauchants et non chevauchants. La première était basée sur la présence d'un nucléotide dans la composition de plusieurs codons. Le code génétique triangulaire, séquentiel et majeur-mineur lui appartient. Le deuxième modèle suppose deux types. Les non-chevauchements incluent le code combinatoire et le "code sans virgule". La première variante est basée sur le codage d'un acide aminé par des triplets de nucléotides, et sa composition est la principale. Selon le "code sans virgule", certains triplets correspondent à des acides aminés, d'autres non. Dans ce cas, on pensait que si des triplets significatifs étaient disposés en série, d'autres dans un cadre de lecture différent s'avéreraient inutiles. Les scientifiques pensaient qu'il était possible de sélectionner une séquence de nucléotides qui répondrait à ces exigences et qu'il y avait exactement 20 triplets.

Bien que Gamow et al aient remis en question ce modèle, il a été considéré comme le plus correct au cours des cinq prochaines années. Au début de la seconde moitié du XXe siècle, de nouvelles données sont apparues qui ont permis de détecter certaines lacunes du "code sans virgule". Les codons se sont avérés capables d'induire la synthèse de protéines in vitro. Plus près de 1965, ils ont compris le principe des 64 triplés. En conséquence, la redondance de certains codons a été trouvée. En d'autres termes, la séquence d'acides aminés est codée par plusieurs triplets.

Caractéristiques distinctives

Les propriétés du code génétique comprennent :

Variantes

Pour la première fois, la déviation du code génétique par rapport à la norme a été découverte en 1979 lors de l'étude des gènes mitochondriaux dans le corps humain. D'autres variantes similaires ont été identifiées, y compris de nombreux codes mitochondriaux alternatifs. Il s'agit notamment du déchiffrement du codon stop UGA utilisé comme définition du tryptophane dans les mycoplasmes. GUG et UUG ​​chez les archées et les bactéries sont souvent utilisés comme variantes de départ. Parfois, les gènes codent pour une protéine à partir d'un codon de départ qui diffère de celui normalement utilisé par cette espèce. De plus, dans certaines protéines, la sélénocystéine et la pyrrolysine, qui sont des acides aminés non standard, sont insérées par le ribosome. Elle lit le codon stop. Cela dépend des séquences trouvées dans l'ARNm. Actuellement, la sélénocystéine est considérée comme le 21e, le pyrrolizan - le 22e acide aminé présent dans les protéines.

Caractéristiques générales du code génétique

Cependant, toutes les exceptions sont rares. Dans les organismes vivants, en général, le code génétique a un certain nombre de caractéristiques communes. Celles-ci incluent la composition du codon, qui comprend trois nucléotides (les deux premiers appartiennent aux déterminants), le transfert de codons par l'ARNt et les ribosomes dans une séquence d'acides aminés.

Classification des gènes

1) Par la nature de l'interaction dans le couple allélique :

Dominant (un gène capable de supprimer la manifestation d'un gène allélique récessif); - récessif (un gène dont la manifestation est supprimée par un gène dominant allélique).

2) Classement fonctionnel :

2) Code génétique- ce sont certaines combinaisons de nucléotides et la séquence de leur emplacement dans la molécule d'ADN. C'est une façon de coder la séquence d'acides aminés des protéines à l'aide d'une séquence de nucléotides, caractéristique de tous les organismes vivants.

Quatre nucléotides sont utilisés dans l'ADN - l'adénine (A), la guanine (G), la cytosine (C), la thymine (T), qui dans la littérature en langue russe sont désignées par les lettres A, G, T et C. Ces lettres constituent l'alphabet du code génétique. Dans l'ARN, les mêmes nucléotides sont utilisés, à l'exception de la thymine, qui est remplacée par un nucléotide similaire - l'uracile, qui est désigné par la lettre U (U dans la littérature en langue russe). Dans les molécules d'ADN et d'ARN, les nucléotides s'alignent en chaînes et, ainsi, des séquences de lettres génétiques sont obtenues.

Code génétique

Il existe 20 acides aminés différents utilisés dans la nature pour fabriquer des protéines. Chaque protéine est une chaîne ou plusieurs chaînes d'acides aminés dans une séquence strictement définie. Cette séquence détermine la structure de la protéine, et donc toutes ses propriétés biologiques. L'ensemble des acides aminés est également universel pour presque tous les organismes vivants.

La mise en œuvre de l'information génétique dans les cellules vivantes (c'est-à-dire la synthèse d'une protéine codée par un gène) s'effectue à l'aide de deux processus matriciels : la transcription (c'est-à-dire la synthèse d'ARNm sur une matrice d'ADN) et la traduction du code génétique en un séquence d'acides aminés (synthèse d'une chaîne polypeptidique sur une matrice d'ARNm). Trois nucléotides consécutifs suffisent pour coder 20 acides aminés, ainsi que le signal d'arrêt, c'est-à-dire la fin de la séquence protéique. Un ensemble de trois nucléotides s'appelle un triplet. Les abréviations acceptées correspondant aux acides aminés et aux codons sont indiquées sur la figure.

Propriétés du code génétique

1. Tripletité- une unité significative du code est une combinaison de trois nucléotides (triplet, ou codon).

2. Continuité- il n'y a pas de signes de ponctuation entre les triplets, c'est-à-dire que l'information est lue en continu.

3. discrétion- le même nucléotide ne peut pas faire partie simultanément de deux ou plusieurs triplets.

4. Spécificité- un certain codon correspond à un seul acide aminé.

5. Dégénérescence (redondance) Plusieurs codons peuvent correspondre à un même acide aminé.

6. Polyvalence - code génétique fonctionne de la même manière dans des organismes de différents niveaux de complexité - des virus aux humains. (les méthodes de génie génétique sont basées là-dessus)

3) transcription - le processus de synthèse d'ARN utilisant l'ADN comme matrice qui se produit dans toutes les cellules vivantes. En d'autres termes, c'est le transfert d'informations génétiques de l'ADN vers l'ARN.

La transcription est catalysée par l'enzyme ARN polymérase dépendante de l'ADN. Le processus de synthèse d'ARN se déroule dans le sens de 5 "- à 3" - extrémité, c'est-à-dire que l'ARN polymérase se déplace le long de la chaîne d'ADN matrice dans le sens 3 "-> 5"

La transcription comprend les étapes d'initiation, d'élongation et de terminaison.

Initiation à la transcription- un processus complexe qui dépend de la séquence d'ADN proche de la séquence transcrite (et chez les eucaryotes également sur des parties plus éloignées du génome - activateurs et silencieux) et de la présence ou de l'absence de divers facteurs protéiques.

Élongation- Le déroulement supplémentaire de la synthèse d'ADN et d'ARN le long de la chaîne codante se poursuit. elle, comme la synthèse de l'ADN, s'effectue dans le sens 5-3

Résiliation- dès que la polymérase atteint le terminateur, elle est immédiatement clivée de l'ADN, l'hybride ADN-ARN local est détruit et l'ARN nouvellement synthétisé est transporté du noyau vers le cytoplasme, où la transcription est terminée.

Traitement- un ensemble de réactions conduisant à la transformation des produits primaires de transcription et de traduction en molécules fonctionnelles. Les articles sont sujets à la décomposition de molécules précurseurs fonctionnellement inactives. l'acide ribonucléique (ARNt, ARNr, ARNm) et bien d'autres. protéines.

Dans le processus de synthèse des enzymes cataboliques (substrats de clivage), les procaryotes subissent une synthèse induite d'enzymes. Cela donne à la cellule la possibilité de s'adapter aux conditions environnementales et d'économiser de l'énergie en arrêtant la synthèse de l'enzyme correspondante si le besoin en disparaît.
Pour induire la synthèse d'enzymes cataboliques, les conditions suivantes sont requises :

1. L'enzyme n'est synthétisée que lorsque le clivage du substrat correspondant est nécessaire à la cellule.
2. La concentration du substrat dans le milieu doit dépasser un certain niveau avant que l'enzyme correspondante puisse se former.
Le mécanisme de régulation de l'expression des gènes chez Escherichia coli est mieux étudié en utilisant l'exemple de l'opéron lac, qui contrôle la synthèse de trois enzymes cataboliques qui décomposent le lactose. S'il y a beaucoup de glucose et peu de lactose dans la cellule, le promoteur reste inactif et la protéine répresseur est située sur l'opérateur - la transcription de l'opéron lac est bloquée. Lorsque la quantité de glucose dans l'environnement, et donc dans la cellule, diminue et que le lactose augmente, les événements suivants se produisent : la quantité d'adénosine monophosphate cyclique augmente, elle se lie à la protéine CAP - ce complexe active le promoteur auquel l'ARN polymérase lie; en même temps, l'excès de lactose se lie à la protéine répresseur et en libère l'opérateur - la voie de l'ARN polymérase est ouverte, la transcription des gènes de structure de l'opéron lac commence. Le lactose agit comme un inducteur pour la synthèse des enzymes qui le décomposent.

5) Régulation de l'expression des gènes chez les eucaryotes est beaucoup plus difficile. Différents types de cellules d'un organisme eucaryote multicellulaire synthétisent un certain nombre de protéines identiques et se distinguent en même temps par un ensemble de protéines spécifiques aux cellules de ce type. Le niveau de production dépend du type de cellules, ainsi que du stade de développement de l'organisme. L'expression des gènes est régulée au niveau cellulaire et au niveau de l'organisme. Les gènes des cellules eucaryotes sont divisés en deux principaux types: le premier détermine l'universalité des fonctions cellulaires, le second détermine (détermine) les fonctions cellulaires spécialisées. Fonctions génétiques premier groupe apparaître dans toutes les cellules. Pour remplir des fonctions différenciées, les cellules spécialisées doivent exprimer un ensemble spécifique de gènes.
Les chromosomes, les gènes et les opérons des cellules eucaryotes ont un certain nombre de caractéristiques structurelles et fonctionnelles, ce qui explique la complexité de l'expression des gènes.
1. Les opérons des cellules eucaryotes ont plusieurs gènes - régulateurs, qui peuvent être situés sur différents chromosomes.
2. Les gènes structuraux qui contrôlent la synthèse des enzymes d'un processus biochimique peuvent être concentrés dans plusieurs opérons situés non seulement dans une molécule d'ADN, mais également dans plusieurs.
3. Séquence complexe de la molécule d'ADN. Il existe des sections informatives et non informatives, des séquences nucléotidiques informatives uniques et répétées à plusieurs reprises.
4. Les gènes eucaryotes sont constitués d'exons et d'introns, et la maturation de l'ARNm s'accompagne de l'excision des introns des transcrits d'ARN primaires correspondants (pro-i-ARN), c'est-à-dire épissage.
5. Le processus de transcription des gènes dépend de l'état de la chromatine. Le compactage local de l'ADN bloque complètement la synthèse de l'ARN.
6. La transcription dans les cellules eucaryotes n'est pas toujours associée à la traduction. L'ARNm synthétisé peut être stocké sous forme d'informosomes pendant une longue période. La transcription et la traduction se produisent dans des compartiments différents.
7. Certains gènes eucaryotes ont une localisation non permanente (gènes labiles ou transposons).
8. Les méthodes de biologie moléculaire ont révélé l'effet inhibiteur des protéines histones sur la synthèse de l'ARNm.
9. Dans le processus de développement et de différenciation des organes, l'activité des gènes dépend d'hormones circulant dans l'organisme et provoquant des réactions spécifiques dans certaines cellules. Chez les mammifères, l'action des hormones sexuelles est importante.
10. Chez les eucaryotes, 5 à 10 % des gènes sont exprimés à chaque étape de l'ontogenèse, le reste doit être bloqué.

6) réparation du matériel génétique

Réparation génétique- le processus d'élimination des dommages génétiques et de restauration de l'appareil héréditaire, qui se produit dans les cellules d'organismes vivants sous l'action d'enzymes spéciales. La capacité des cellules à réparer les dommages génétiques a été découverte pour la première fois en 1949 par le généticien américain A. Kelner. réparation- une fonction particulière des cellules, qui consiste en la capacité de corriger les dommages chimiques et les cassures des molécules d'ADN endommagées lors de la biosynthèse normale de l'ADN dans la cellule ou à la suite d'une exposition à des agents physiques ou chimiques. Elle est réalisée par des systèmes enzymatiques spéciaux de la cellule. Un certain nombre de maladies héréditaires (par exemple, xeroderma pigmentosum) sont associées à des systèmes de réparation altérés.

types de réparations :

La réparation directe est le moyen le plus simple d'éliminer les dommages de l'ADN, ce qui implique généralement des enzymes spécifiques capables de réparer rapidement (généralement en une seule étape) les dommages correspondants, en restaurant la structure d'origine des nucléotides. C'est ainsi, par exemple, qu'agit la O6-méthylguanine-ADN méthyltransférase, qui élimine un groupe méthyle d'une base azotée vers l'un de ses propres résidus de cystéine.

Nucléotides d'ADN et d'ARN
  1. Purines : adénine, guanine
  2. Pyrimidines : cytosine, thymine (uracile)

codon- un triplet de nucléotides codant pour un acide aminé spécifique.

languette. 1. Acides aminés couramment présents dans les protéines
Nom Abréviation
1. AlanineAla
2. ArginineArg
3. AsparagineAsn
4. Acide aspartiqueaspic
5. CystéineCys
6. Acide glutamiqueGlu
7. GlutamineGn
8. Glycinegly
9. HistidineLe sien
10. Isoleucineile
11. LeucineLeu
12. LysineLys
13. MéthionineRencontré
14. PhénylalaninePhé
15. ProlinePro
16. SérieSer
17. ThréonineThr
18. Tryptophanetrp
19. TyrosineTyr
20. ValineVal

Le code génétique, également appelé code des acides aminés, est un système d'enregistrement d'informations sur la séquence d'acides aminés d'une protéine à partir de la séquence de résidus nucléotidiques de l'ADN contenant l'une des 4 bases azotées : l'adénine (A), guanine (G), cytosine (C) et thymine (T). Cependant, étant donné que l'hélice d'ADN double brin n'est pas directement impliquée dans la synthèse de la protéine qui est codée par l'un de ces brins (c'est-à-dire l'ARN), le code est écrit dans le langage de l'ARN, dans lequel l'uracile (U) est inclus à la place de la thymine. Pour la même raison, il est d'usage de dire qu'un code est une séquence de nucléotides, et non des paires de bases.

Le code génétique est représenté par certains mots de code - les codons.

Le premier mot de code a été déchiffré par Nirenberg et Mattei en 1961. Ils ont obtenu un extrait d'E. coli contenant des ribosomes et d'autres facteurs nécessaires à la synthèse des protéines. Le résultat était un système acellulaire pour la synthèse des protéines, qui pouvait assembler une protéine à partir d'acides aminés si l'ARNm nécessaire était ajouté au milieu. En ajoutant de l'ARN synthétique, constitué uniquement d'uraciles, au milieu, ils ont découvert qu'une protéine se formait, constituée uniquement de phénylalanine (polyphénylalanine). Ainsi, il a été trouvé que le triplet de nucléotides UUU (codon) correspond à la phénylalanine. Au cours des 5 à 6 années suivantes, tous les codons du code génétique ont été déterminés.

Le code génétique est une sorte de dictionnaire qui traduit un texte écrit avec quatre nucléotides en un texte protéique écrit avec 20 acides aminés. Le reste des acides aminés présents dans la protéine sont des modifications de l'un des 20 acides aminés.

Propriétés du code génétique

Le code génétique a les propriétés suivantes.

  1. Tripletité Chaque acide aminé correspond à un triplet de nucléotides. Il est facile de calculer qu'il y a 4 3 = 64 codons. Parmi ceux-ci, 61 sont sémantiques et 3 sont sans signification (terminaison, codons d'arrêt).
  2. Continuité(il n'y a pas de caractères de séparation entre les nucléotides) - l'absence de signes de ponctuation intragéniques ;

    Au sein d'un gène, chaque nucléotide fait partie d'un codon significatif. En 1961 Seymour Benzer et Francis Crick ont ​​prouvé expérimentalement le code triplet et sa continuité (compacité) [Afficher]

    L'essence de l'expérience: mutation "+" - l'insertion d'un nucléotide. "-" mutation - perte d'un nucléotide.

    Une simple mutation ("+" ou "-") au début d'un gène ou une double mutation ("+" ou "-") gâte tout le gène.

    Une triple mutation ("+" ou "-") au début d'un gène ne gâte qu'une partie du gène.

    Une quadruple mutation "+" ou "-" gâche à nouveau le gène entier.

    L'expérience a été réalisée sur deux gènes de phage adjacents et a montré que

    1. le code est un triplet et il n'y a pas de signes de ponctuation à l'intérieur du gène
    2. il y a des signes de ponctuation entre les gènes
  3. Présence de signes de ponctuation intergéniques- la présence parmi les triplets de codons initiateurs (ils commencent la biosynthèse des protéines), de codons - terminateurs (indiquent la fin de la biosynthèse des protéines) ;

    Classiquement, le codon AUG appartient également aux signes de ponctuation - le premier après la séquence de tête. Il remplit la fonction d'une lettre majuscule. Dans cette position, il code pour la formylméthionine (chez les procaryotes).

    A l'extrémité de chaque gène codant pour un polypeptide, se trouve au moins un des 3 codons de terminaison, ou signaux d'arrêt : UAA, UAG, UGA. Ils mettent fin à l'émission.

  4. Colinéarité- correspondance de la séquence linéaire des codons de l'ARNm et des acides aminés dans la protéine.
  5. Spécificité- chaque acide aminé correspond uniquement à certains codons non utilisables pour un autre acide aminé.
  6. Unidirectionnel- les codons sont lus dans un sens - du premier nucléotide au suivant
  7. Dégénérescence ou redondance, - plusieurs triplets peuvent coder un acide aminé (acides aminés - 20, triplets possibles - 64, 61 d'entre eux sont sémantiques, c'est-à-dire qu'en moyenne, chaque acide aminé correspond à environ 3 codons); l'exception est la méthionine (Met) et le tryptophane (Trp).

    La raison de la dégénérescence du code est que la charge sémantique principale est portée par les deux premiers nucléotides du triplet, et le troisième n'est pas si important. D'ici règle de dégénérescence du code : si deux codons ont deux premiers nucléotides identiques, et que leurs troisièmes nucléotides appartiennent à la même classe (purine ou pyrimidine), alors ils codent pour le même acide aminé.

    Cependant, il existe deux exceptions à cette règle idéale. Il s'agit du codon AUA, qui doit correspondre non à l'isoleucine, mais à la méthionine, et du codon UGA, qui est le terminateur, alors qu'il doit correspondre au tryptophane. La dégénérescence du code a évidemment une valeur adaptative.

  8. Polyvalence- toutes les propriétés du code génétique énumérées ci-dessus sont caractéristiques de tous les organismes vivants.
    codon Code universel Codes mitochondriaux
    Vertébrés Invertébrés Levure Les plantes
    UGAARRÊTERtrptrptrpARRÊTER
    AUAileRencontréRencontréRencontréile
    AUCLeuLeuLeuThrLeu
    AGAArgARRÊTERSerArgArg
    AGGArgARRÊTERSerArgArg

    Récemment, le principe de l'universalité du code a été ébranlé à propos de la découverte par Berell en 1979 du code idéal des mitochondries humaines, dans lequel la règle de dégénérescence du code est remplie. Dans le code mitochondrial, le codon UGA correspond au tryptophane et AUA à la méthionine, comme l'exige la règle de dégénérescence du code.

    Peut-être qu'au début de l'évolution, tous les organismes les plus simples avaient le même code que les mitochondries, puis il a subi de légères déviations.

  9. sans chevauchement- chacun des triplets du texte génétique est indépendant l'un de l'autre, un nucléotide fait partie d'un seul triplet ; Sur la fig. montre la différence entre le code qui se chevauche et le code qui ne se chevauche pas.

    En 1976 L'ADN du phage φX174 a été séquencé. Il possède un ADN circulaire simple brin de 5375 nucléotides. Le phage était connu pour coder 9 protéines. Pour 6 d'entre eux, des gènes localisés les uns après les autres ont été identifiés.

    Il s'est avéré qu'il y a un chevauchement. Le gène E est complètement à l'intérieur du gène D. Son codon d'initiation apparaît à la suite d'un décalage d'un nucléotide dans la lecture. Le gène J commence là où se termine le gène D. Le codon de départ du gène J chevauche le codon d'arrêt du gène D par un décalage de deux nucléotides. La conception est appelée "décalage du cadre de lecture" par un nombre de nucléotides qui n'est pas un multiple de trois. À ce jour, le chevauchement n'a été démontré que pour quelques phages.

  10. Immunité au bruit- le rapport du nombre de substitutions conservatrices au nombre de substitutions radicalaires.

    Les mutations de substitutions de nucléotides qui n'entraînent pas de changement dans la classe de l'acide aminé codé sont dites conservatrices. Les mutations de substitutions de nucléotides qui conduisent à un changement dans la classe de l'acide aminé codé sont appelées radicaux.

    Comme le même acide aminé peut être codé par différents triplets, certaines substitutions dans les triplets n'entraînent pas de modification de l'acide aminé codé (par exemple, UUU -> UUC quitte la phénylalanine). Certaines substitutions changent un acide aminé en un autre de la même classe (non polaire, polaire, basique, acide), d'autres substitutions changent également la classe de l'acide aminé.

    Dans chaque triplet, 9 substitutions simples peuvent être effectuées, c'est-à-dire vous pouvez choisir laquelle des positions changer - de trois manières (1ère ou 2ème ou 3ème), et la lettre sélectionnée (nucléotide) peut être changée en 4-1 = 3 autres lettres (nucléotides). Le nombre total de substitutions de nucléotides possibles est de 61 par 9 = 549.

    Par comptage direct sur le tableau du code génétique, on peut vérifier que parmi ceux-ci : 23 substitutions de nucléotides conduisent à l'apparition de codons - terminateurs de traduction. 134 substitutions ne changent pas l'acide aminé codé. 230 substitutions ne changent pas la classe de l'acide aminé codé. 162 substitutions conduisent à un changement dans la classe des acides aminés, c'est-à-dire sont radicaux. Sur les 183 substitutions du 3ème nucléotide, 7 conduisent à l'apparition de terminateurs de traduction, et 176 sont conservatrices. Sur les 183 substitutions du 1er nucléotide, 9 conduisent à l'apparition de terminateurs, 114 sont conservatrices et 60 sont radicales. Sur les 183 substitutions du 2ème nucléotide, 7 conduisent à l'apparition de terminateurs, 74 sont conservatrices et 102 sont radicales.