Plásmidos 101: Sesgo de uso de codones

Un código genético similar es utilizado por la mayoría de los organismos en la Tierra, pero diferentes organismos tienen diferentes preferencias por los codones que usan para codificar aminoácidos específicos. Esto es posible porque hay 4 bases (A, T, C y G) y 3 posiciones en cada codón. Por lo tanto, hay 64 codones posibles, pero solo 20 aminoácidos y 3 codones de parada para codificar, dejando 41 codones desaparecidos. El resultado es redundancia; múltiples codones codifican aminoácidos individuales. Las restricciones evolutivas han moldeado qué codones se usan preferentemente en qué organismos-los organismos tienen sesgo de uso de codones.

 Gráfico de codones Puede encontrar muchas tablas de codones que muestran qué codones codifican qué aminoácidos (vea el ejemplo a la derecha). Con reglas tan simples, podrías pensar que es fácil idear una secuencia de ADN viable para codificar tu péptido de interés y producir ese péptido en tu organismo de elección. Desafortunadamente, las preferencias de codones hacen que no pueda elegir entre los posibles codones al azar y esperar que su secuencia se exprese bien en cualquier organismo.

Entonces, ¿cuáles son las restricciones evolutivas que conducen a estas preferencias y qué podemos hacer al respecto? ¡Sigue leyendo para averiguarlo!

¿Por qué los organismos tienen diferentes sesgos de uso de codones?

Las razones de las variadas preferencias de codones entre organismos no se entienden completamente, pero algunas posibles razones incluyen:

    1. Presiones metabólicas: se necesitan recursos celulares para producir ARN que reconozcan diferentes codones, modifiquen los ARN correctamente y carguen los ARN con los aminoácidos apropiados. Si un organismo utiliza solo un subconjunto de codones, solo necesita producir un subconjunto de ARNt cargados y, por lo tanto, puede necesitar menos recursos para todo el proceso de traducción. Por ejemplo, durante condiciones de alta tasa de crecimiento, E. coli regula preferentemente la producción de ARNt que reconocen codones encontrados en genes altamente expresados (Emilsson y Kurland, 1990).
    2. Control de la expresión génica a través de la secuencia génica: Las proteínas codificadas por codones con baja abundancia o ARN mal cargados pueden producirse a una velocidad menor que las proteínas codificadas por ARN altamente abundantes y cargados. Por ejemplo, Tuller et al. se encontró que la eficiencia de la traducción está bien correlacionada con el sesgo de codones tanto en E. coli como en S. cerevisiae.
    3. Plegado de proteínas: Si una proteína está codificada por una mezcla de codones con ARN de alta y baja carga, diferentes regiones de la proteína pueden traducirse a diferentes velocidades. El ribosoma se moverá rápidamente a lo largo de regiones que requieren ARN abundantes y cargados, pero se detendrá en regiones que requieren ARN de baja abundancia y mal cargados. Cuando el ribosoma se detiene, esto puede dar a las regiones rápidamente traducidas la oportunidad de plegarse correctamente. Por ejemplo, Pechmann y Frydman encontraron que las extensiones de codones no óptimos están asociadas con estructuras secundarias específicas en 10 cepas de levadura estrechamente relacionadas.
    4. Adaptación a condiciones cambiantes: Los organismos a menudo necesitan expresar genes a diferentes niveles bajo diferentes condiciones. Con el uso variado de codones, un organismo puede cambiar qué proteínas están altamente expresadas y cuáles están mal expresadas al producir y cargar depósitos específicos de ARNt. Por ejemplo, los ARNT utilizados en genes que codifican enzimas biosintéticas de aminoácidos pueden cargarse preferentemente durante la inanición de aminoácidos, lo que resulta en una mayor producción de enzimas biosintéticas de aminoácidos (Dittmar et al., 2005).

¿Cómo afecta el sesgo de uso de codones a mis experimentos?

Si bien las preferencias de codones pueden ser muy útiles para los organismos, pueden ser problemáticas para los investigadores que intentan expresar proteínas en huéspedes heterólogos. Si simplemente amplifica un gen de interés del genoma humano, por ejemplo, puede que no se exprese en absoluto en E. coli (puede encontrar una variedad de bases de datos que muestran las preferencias de codones de varios organismos en línea). Incluso si el gen se traduce, es posible que no funcione correctamente. Esto es el resultado de un desajuste entre la preferencia de codones humanos y de E. coli. Algunos codones comúnmente utilizados en humanos no son comunes en E. coli y viceversa. Al traducir estos codones, el ribosoma puede, por lo tanto, estancarse en lugares inapropiados o no llegar a través de toda la transcripción, lo que resulta en la producción de proteínas no funcionales y fragmentos de proteínas, respectivamente.

Resolver el problema del sesgo de uso de codones: optimización de codones y expresión de ARN alternativos

Optimización de codones

Con la síntesis de ADN de bajo costo, una de las principales formas en que los investigadores resuelven el problema de la elección de codones es resintetizar los genes de tal manera que sus codones sean más apropiados para el huésped de expresión deseado. Esto se conoce como «optimización de codones».»Aunque simple en teoría, esto no es tan fácil como parece. Incluso para péptidos relativamente cortos, puede haber muchas formas posibles de codificarlos y lo que constituye el codón «apropiado» no es necesariamente obvio.

Podrías pensar, » ¡Tonterías! Simplemente debería elegir el codón con la reserva más abundante de ARN cargados en mi organismo huésped para cada aminoácido que me gustaría codificar», pero, como se describió anteriormente, no todas las regiones de una proteína deben traducirse necesariamente rápidamente para producir una proteína que funcione correctamente.

Entonces podrían pensar, » Bueno, me aseguraré de que las abundancias de los codones que elijo para el huésped coincidan con las abundancias de codones utilizados en el organismo nativo.»Esta es posiblemente una idea mejor y se ha utilizado con éxito en el pasado (Angov et al., 2008), pero todavía hay muchas más características a considerar al diseñar un gen completo. Una lista no exhaustiva incluye:

  • Abundancia de codones relativa a abundancia de ARNt cognados
  • Secuencias repetitivas
  • Sitios de restricción
  • Secuencias propensas a crear estructuras secundarias en transcripciones de ARN
  • Efectos en la transcripción (recuerde, no todo se trata de traducción, por ejemplo, la elección de codones puede interrumpir los sitios de unión de factores de transcripción)

Como se puede imaginar, no es fácil para los humanos equilibrar todos estos factores por sí solos. Afortunadamente, muchos investigadores han creado algoritmos de optimización de codones y empresas de síntesis de ADN, como IDT y GenScript, herramientas de optimización de codones en línea para host. Tenga en cuenta que, solo porque optimice un gen con una de estas herramientas, no significa necesariamente que el gen se exprese bien. Si obtiene una buena expresión, también debe analizar funcionalmente la proteína producida para asegurarse de que se ha plegado correctamente.

Es posible que pueda evitar optimizar los codones de sus genes de interés ordenando plásmidos que los contienen de Addgene. Si un plásmido en el Addgeno contiene un gen que ha sido optimizado para un codón para un organismo en particular, esto a veces (pero no siempre) se notará en el campo de «mutación» en la página del plásmido (consulte el plásmido 87904, por ejemplo). Como muchos plásmidos disponibles en Addgene ahora tienen datos de secuencia completos, recomendamos analizar directamente las secuencias de genes para la optimización de los codones y la idoneidad para su huésped de expresión antes de usarlos en sus experimentos.

Expresión de ARNt alternativos

Si no tiene el tiempo o los fondos para sintetizar una versión optimizada para codones de su gen de interés, es posible sobreexpresar ARNt de baja abundancia en su huésped de expresión y, por lo tanto, aumentar su abundancia. Por ejemplo, las cepas comerciales de E. coli de Rosetta expresan una variedad de ARN que normalmente se encuentran en baja abundancia en E. coli.

La ventaja de producir ARNt adicionales es que puede usar el mismo sistema de expresión para muchos genes diferentes sin tener que crear nuevas construcciones. Sin embargo, debido a problemas como tasas de traducción no coincidentes y efectos potenciales en el crecimiento celular, incluso los huéspedes que producen ARNt alternativos pueden no expresar cantidades suficientes de su proteína de interés.

Independientemente del método que elija para superar los problemas que rodean la elección del codón, debe tener algún método para asegurarse de que las proteínas que produce funcionen correctamente. La sobreexpresión puede resultar en la producción de glóbulos insolubles y no funcionales de proteína conocidos como cuerpos de inclusión que generalmente se segregan con el pellet celular durante los procedimientos de purificación. Incluso si produce una gran cantidad de proteína en su anfitrión de expresión de elección, debe realizar un ensayo funcional para asegurarse de que su proteína no esté formando cuerpos de inclusión y se pliegue correctamente.

 Haga clic para descargar el libro electrónico Plásmidos 101 de Addgene

1. Angov, Evelina, et al. «La expresión de proteínas heterólogas se mejora armonizando las frecuencias de uso de codones del gen diana con las del huésped de expresión.»PLoS one 3.5 (2008): e2189. PubMed PMID: 18478103. PubMed Central PMCID: PMC2364656.

2. Dittmar, Kimberly A., et al. «Carga selectiva de isoacceptores de ARNt inducida por inanición de aminoácidos.»EMBO reports 6.2( 2005): 151-157. PubMed PMID: 15678157. PubMed Central PMCID: PMC1299251.

3. Emilsson, Valur y Charles G. Kurland. «Growth rate dependence of transfer RNA abundance in Escherichia coli.»The EMBO journal 9.13( 1990): 4359-4366. PubMed PMID: 2265611. PubMed Central PMCID: PMC552224.

4. Gustafsson, Claes, Sridhar Govindarajan y Jeremy Minshull. «Codon bias and heterologous protein expression.»Trends in biotechnology 22.7( 2004): 346-353. PubMed PMID: 15245907.

5. Maertens, Barbara, et al. «Gene optimization mechanisms: A multi-gene study reveals a high success rate of full‐length human proteins expressed in Escherichia coli.»Protein Science 19.7( 2010): 1312-1326. PubMed PMID: 20506237. PubMed Central PMCID: PMC2970903.

6. Pechmann, Sebastian y Judith Frydman. «La conservación evolutiva de la optimalidad del codón revela las firmas ocultas del plegado cotraduccional.»Nature structural & molecular biology20.2 (2013): 237. PubMed PMID: 23262490. PubMed Central PMCID: PMC3565066.

7. Quax, Tessa EF, et al. «Sesgo de codones como medio para afinar la expresión génica.»Molecular cell 59.2( 2015): 149-161. PubMed PMID: 26186290. PubMed Central PMCID: PMC4794256.

  • Esta revisión proporciona una excelente visión general del sesgo de uso de codones

8. Tuller, Tamir, et al. «La eficiencia de la traducción está determinada tanto por el sesgo del codón como por la energía de plegado.»Proceedings of the National Academy of Sciences 107.8( 2010): 3645-3650. PubMed PMID: 20133581. PubMed Central PMCID: PMC2840511.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.