Plasmides 101: Biais d’utilisation des codon

Un code génétique similaire est utilisé par la plupart des organismes sur Terre, mais différents organismes ont des préférences différentes pour les codons qu’ils utilisent pour coder des acides aminés spécifiques. Ceci est possible car il y a 4 bases (A, T, C et G) et 3 positions dans chaque codon. Il y a donc 64 codons possibles mais seulement 20 acides aminés et 3 codons stop à coder laissant 41 codons non comptabilisés. Le résultat est la redondance; plusieurs codons codent des acides aminés simples. Les contraintes évolutives ont moulé quels codons sont utilisés préférentiellement dans lesquels les organismes-organismes ont un biais d’utilisation de codon.

 Diagramme de codon Vous pouvez trouver de nombreuses tables de codon montrant quels codons codent pour quels acides aminés (voir exemple à droite). Avec des règles aussi simples, vous pourriez penser qu’il est facile de trouver une séquence d’ADN réalisable pour coder votre peptide d’intérêt et produire ce peptide dans votre organisme de choix. Malheureusement, les préférences de codon font en sorte que vous ne pouvez pas choisir parmi les codons possibles au hasard et vous attendre à ce que votre séquence s’exprime bien dans n’importe quel organisme.

Alors quelles sont les contraintes évolutives qui conduisent à ces préférences et que pouvons-nous y faire ? Lisez la suite pour le savoir!

Pourquoi les organismes ont-ils des biais d’utilisation de codon différents?

Les raisons des préférences de codon variées entre les organismes ne sont pas complètement comprises, mais certaines raisons possibles incluent:

    1. Pressions métaboliques – il faut des ressources cellulaires pour produire des ARNT qui reconnaissent différents codons, modifient les ARNT correctement et chargent les ARNT avec les acides aminés appropriés. Si un organisme n’utilise qu’un sous-ensemble de codons, il n’a besoin que de produire un sous-ensemble d’ARNT chargés et peut donc avoir besoin de moins de ressources pour l’ensemble du processus de traduction. Par exemple, dans des conditions de taux de croissance élevé, E. coli régule préférentiellement à la hausse la production d’ARNT qui reconnaissent les codons trouvés dans des gènes fortement exprimés (Emilsson et Kurland, 1990).
    2. Contrôler l’expression des gènes par la séquence des gènes – Les protéines codées par des codons à faible abondance ou des ARNT mal chargés peuvent être produites à un taux inférieur à celui des protéines codées par des ARNT très abondants et chargés. Par exemple Tuller et al. a constaté que l’efficacité de la traduction est bien corrélée avec le biais de codon chez E. coli et S. cerevisiae.
    3. Repliement des protéines – Si une protéine est codée par un mélange de codons avec des ARNT fortement et mal chargés, différentes régions de la protéine peuvent être traduites à des taux différents. Le ribosome se déplacera rapidement le long des régions nécessitant des ARNT abondants et chargés, mais se calera dans les régions nécessitant une faible abondance et des ARNT mal chargés. Lorsque le ribosome stalle, cela peut donner aux régions rapidement traduites une chance de se replier correctement. Par exemple, Pechmann et Frydman ont découvert que des parcelles de codons non optimaux sont associées à des structures secondaires spécifiques chez 10 souches de levure étroitement apparentées.
    4. Adaptation aux conditions changeantes – Les organismes ont souvent besoin d’exprimer des gènes à différents niveaux dans différentes conditions. Avec une utilisation variée de codon, un organisme peut modifier les protéines qui sont fortement exprimées et celles qui sont mal exprimées en produisant et en chargeant des pools d’ARNt spécifiques. Par exemple, les ARNT utilisés dans les gènes codant pour les enzymes biosynthétiques d’acides aminés peuvent être chargés préférentiellement pendant la privation d’acides aminés, ce qui entraîne une production plus élevée d’enzymes biosynthétiques d’acides aminés (Dittmar et al., 2005).

Comment le biais d’utilisation de codon affecte-t-il mes expériences?

Bien que les préférences de codon puissent être très utiles pour les organismes, elles peuvent être problématiques pour les chercheurs qui tentent d’exprimer des protéines chez des hôtes hétérologues. Si vous amplifiez simplement un gène d’intérêt du génome humain, par exemple, il peut ne pas s’exprimer du tout dans E. coli (vous pouvez trouver une variété de bases de données montrant les préférences de codon de divers organismes en ligne). Même si le gène est traduit, il peut ne pas fonctionner correctement. Ceci est le résultat d’une inadéquation entre la préférence de codon humaine et celle d’E. coli. Certains codons couramment utilisés chez l’homme ne sont pas du tout communs chez E. coli et vice versa. Lors de la traduction de ces codons, le ribosome peut donc se caler à des endroits inappropriés ou ne pas traverser la transcription entière, ce qui entraîne la production de protéines non fonctionnelles et de fragments de protéines respectivement.

Résolution du problème du biais d’utilisation du codon – optimisation du codon et de l’expression d’ARNT alternatifs

Optimisation du codon

Avec une synthèse d’ADN à faible coût, l’un des principaux moyens pour les chercheurs de résoudre le problème du choix du codon est de resynthétiser les gènes de manière à ce que leurs codons soient plus appropriés pour l’hôte d’expression souhaité. C’est ce qu’on appelle  » l’optimisation des codon. »Bien que simple en théorie, ce n’est pas aussi facile qu’il y paraît. Même pour des peptides relativement courts, il peut y avoir de nombreuses façons possibles de les coder et ce qui constitue le codon « approprié » n’est pas nécessairement évident.

Vous pourriez penser: « Non-sens! Je devrais simplement choisir le codon avec le pool le plus abondant d’ARNT chargés dans mon organisme hôte pour chaque acide aminé que j’aimerais coder « , mais, comme décrit ci-dessus, toutes les régions d’une protéine ne doivent pas nécessairement être traduites rapidement pour produire une protéine qui fonctionne correctement.

Vous pourriez alors penser: « D’accord, je vais juste m’assurer que les abondances des codons que je choisis pour l’hôte correspondent aux abondances des codons utilisés dans l’organisme natif. »C’est peut-être une meilleure idée et a été utilisée avec succès dans le passé (Angov et al., 2008), mais il reste encore beaucoup d’autres fonctionnalités à prendre en compte lors de la conception d’un gène complet. Une liste non exhaustive comprend:

  • Abondance de codon par rapport à l’abondance d’ARNt apparentée
  • Séquences répétitives
  • Sites de restriction
  • Séquences susceptibles de créer des structures secondaires dans les transcriptions d’ARN
  • Effets sur la transcription (rappelez-vous, ce n’est pas tout une question de traduction – par exemple, le choix du codon peut interrompre les sites de liaison des facteurs de transcription)

Comme vous pouvez l’imaginer, il n’est pas facile pour les humains d’équilibrer tous ces facteurs par eux-mêmes. Heureusement, de nombreux chercheurs ont créé des algorithmes d’optimisation de codon et des sociétés de synthèse d’ADN telles que IDT et GenScript hébergent des outils d’optimisation de codon en ligne. Gardez à l’esprit que, simplement parce que vous optimisez un gène avec l’un de ces outils, cela ne signifie pas nécessairement que le gène va bien s’exprimer. Si vous obtenez une bonne expression, vous devez également analyser fonctionnellement la protéine produite pour vous assurer qu’elle s’est pliée correctement.

Vous pourrez peut-être éviter d’optimiser le codon de vos gènes d’intérêt en ordonnant des plasmides les contenant à partir d’Addgene. Si un plasmide à Addgene contient un gène qui a été optimisé pour un organisme particulier, cela sera parfois (mais pas toujours) noté dans le champ « mutation » sur la page plasmide (voir plasmide 87904 par exemple). Comme de nombreux plasmides disponibles chez Addgene ont maintenant des données de séquence complètes, nous vous recommandons d’analyser directement les séquences de gènes pour l’optimisation des codon et l’adéquation à votre hôte d’expression avant de les utiliser dans vos expériences.

Expression d’ARNT alternatifs

Si vous n’avez pas le temps ou les fonds nécessaires pour synthétiser une version optimisée en codon de votre gène d’intérêt, il est possible de surexprimer les ARNT à faible abondance dans votre hôte d’expression et d’augmenter ainsi leur abondance. Par exemple, les souches commerciales d’E. coli de Rosetta expriment une variété d’ARNT que l’on trouve normalement à faible abondance chez E. coli.

L’avantage de produire des ARNT supplémentaires est que vous pouvez utiliser le même système d’expression pour de nombreux gènes différents sans avoir à créer de nouvelles constructions. Cependant, en raison de problèmes tels que des taux de traduction inadéquats et des effets potentiels sur la croissance cellulaire, même les hôtes produisant des ARNT alternatifs peuvent ne pas exprimer des quantités suffisantes de votre protéine d’intérêt.

Quelle que soit la méthode que vous choisissez pour surmonter les problèmes entourant le choix des codon, vous devriez avoir une méthode pour vous assurer que les protéines que vous produisez fonctionnent correctement. La surexpression peut entraîner la production de globes insolubles et non fonctionnels de protéines connues sous le nom de corps d’inclusion qui se sépareront généralement de la pastille cellulaire pendant les procédures de purification. Même si vous produisez une grande quantité de protéines dans votre hôte d’expression de choix, vous devez effectuer un test fonctionnel pour vous assurer que votre protéine ne forme pas de corps d’inclusion et se plie correctement.

 Cliquez pour télécharger l'eBook Plasmids 101 d'Addgene

1. Angov, Evelina, et coll. « L’expression des protéines hétérologues est améliorée en harmonisant les fréquences d’utilisation des codon du gène cible avec celles de l’hôte d’expression. » PloS one 3.5 (2008): e2189. Numéro de téléphone : 18478103. PMCID central de PubMed : PMC2364656.

2. Dittmar, Kimberly A., et coll. « Selective charging of tRNA isoacceptors induced by amino-acid starvation. » EMBO reports 6.2 (2005): 151-157. Numéro de téléphone : 15678157. PMCID central de PubMed: PMC1299251.

3. Emilsson, Valur et Charles G. Kurland. « Growth rate dependence of transfer RNA abundance in Escherichia coli. » Le journal EMBO 9.13 (1990): 4359-4366. Numéro de téléphone : 2265611. PMCID central de PubMed: PMC552224.

4. Il s’agit d’une série de films et de séries télévisées. « Codon bias and heterologous protein expression. »Trends in biotechnology 22.7 (2004): 346-353. Numéro de téléphone : 15245907.

5. Maertens, Barbara, et coll. « Mécanismes d’optimisation des gènes: Une étude multi-gènes révèle un taux de réussite élevé des protéines humaines de pleine longueur exprimées dans Escherichia coli. »Science des protéines 19.7 (2010): 1312-1326. Numéro de téléphone : 20506237. PMCID central PubMed: PMC2970903.

6. Pechmann, Sebastian et Judith Frydman. « La conservation évolutive de l’optimalité des codon révèle des signatures cachées du pliage cotranslationnel. »Nature structural & biologie moléculaire 20.2 (2013): 237. Numéro de téléphone : 23262490. PMCID central de PubMed : PMC3565066.

7. Quax, Tessa EF, et coll. « Le biais de codon comme moyen d’affiner l’expression des gènes. »Cellule moléculaire 59.2 (2015): 149-161. Numéro de téléphone : 26186290. PMCID central de PubMed : PMC4794256.

  • Cette revue fournit un excellent aperçu du biais d’utilisation des codon

8. Tuller, Tamir et coll. « L’efficacité de la traduction est déterminée à la fois par le biais du codon et par l’énergie de pliage. »Actes de l’Académie nationale des Sciences 107.8 (2010): 3645-3650. Numéro d’identification : 20133581. PMCID central PubMed: PMC2840511.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.