Plasmider 101: codon usage bias

en lignende genetisk kode bruges af de fleste organismer på jorden, men forskellige organismer har forskellige præferencer for de kodoner, de bruger til at kode specifikke aminosyrer. Dette er muligt, fordi der er 4 baser (A, T, C og G) og 3 positioner i hvert kodon. Der er derfor 64 mulige kodoner, men kun 20 aminosyrer og 3 stopkodoner for at kode, hvilket efterlader 41 kodoner, der ikke er redegjort for. Resultatet er redundans; flere kodoner koder for enkelt aminosyrer. Evolutionære begrænsninger har støbt, hvilke kodoner der fortrinsvis anvendes, hvor organismer-organismer har bias ved kodonbrug.

Codon Chart du kan finde mange codon tabeller, der viser, hvilke kodoner koder for hvilke aminosyrer (se eksempel til højre). Med sådanne enkle regler tror du måske, at det er nemt at komme med en brugbar DNA-sekvens for at kode dit peptid af interesse og producere det peptid i din valgte organisme. Desværre gør kodonpræferencer det, så du ikke kan vælge blandt de mulige kodoner tilfældigt og forvente, at din sekvens udtrykker sig godt i enhver organisme.

så hvad er de evolutionære begrænsninger, der fører til disse præferencer, og hvad kan vi gøre ved dem? Læs videre for at finde ud af det!

Hvorfor har organismer forskellige kodonbrugsforstyrrelser?

årsagerne til forskellige kodonpræferencer blandt organismer forstås ikke fuldstændigt, men nogle mulige årsager inkluderer:

    1. metabolsk tryk – det tager cellulære ressourcer at producere tRNA ‘er, der genkender forskellige kodoner, modificerer tRNA’ erne korrekt og oplader tRNA ‘ erne med de passende aminosyrer. Hvis en organisme kun bruger en delmængde af kodoner, behøver den kun at producere en delmængde af ladede tRNA ‘ er og kan derfor have brug for færre ressourcer til hele oversættelsesprocessen. For eksempel opregulerer E. coli fortrinsvis produktion af tRNA ‘ er, der genkender kodoner, der findes i stærkt udtrykte gener (Emilsson og Kurland, 1990).
    2. styring af genekspression gennem gensekvens – proteiner, der er kodet af kodoner med lav overflod eller dårligt ladede tRNA ‘er, kan produceres med en lavere hastighed end proteiner kodet af meget rigelige, ladede tRNA’ er. For eksempel Tuller et al. fandt, at oversættelseseffektivitet er godt korreleret med codon bias i både E. coli og S. cerevisiae.
    3. proteinfoldning – hvis et protein kodes af en blanding af kodoner med stærkt og dårligt ladede tRNA ‘ er, kan forskellige regioner af proteinet oversættes med forskellige hastigheder. Ribosomet vil bevæge sig hurtigt langs regioner, der kræver rigelige, ladede tRNA ‘er, men vil stoppe i regioner, der kræver lav overflod, Dårligt ladede tRNA’ er. Når ribosomet går i stå, kan dette give de hurtigt oversatte regioner en chance for at folde ordentligt. For eksempel fandt Pechmann og Frydman, at kanaler med ikke-optimale kodoner er forbundet med specifikke sekundære strukturer i 10 nært beslægtede gærstammer.
    4. tilpasning til skiftende forhold – organismer har ofte brug for at udtrykke gener på forskellige niveauer under forskellige forhold. Med varieret kodonbrug kan en organisme ændre, hvilke proteiner der udtrykkes stærkt, og hvilke der udtrykkes dårligt ved at producere og oplade specifikke tRNA-puljer. For eksempel kan tRNA ‘ er, der anvendes i gener, der koder for aminosyrebiosyntetiske stoffer, fortrinsvis oplades under aminosyresult, hvilket resulterer i højere produktion af aminosyrebiosyntetiske stoffer (Dittmar et al., 2005).

Hvordan påvirker codon usage bias mine eksperimenter?

mens kodonpræferencer kan være meget nyttige for organismer, kan de være problematiske for forskere, der forsøger at udtrykke proteiner i heterologe værter. Hvis du blot forstærker et gen af interesse fra det menneskelige genom, kan det måske slet ikke udtrykke sig i E. coli (du kan finde en række databaser, der viser forskellige organismers kodonpræferencer online). Selvom genet oversættes, fungerer det muligvis ikke korrekt. Dette er resultatet af en uoverensstemmelse mellem human og E. coli codon præference. Nogle kodoner, der almindeligvis anvendes hos mennesker, er slet ikke almindelige i E. coli og omvendt. Ved oversættelse af disse kodoner kan ribosomet derfor stoppe på upassende steder eller undlade at klare det gennem hele transkriptionen, hvilket resulterer i produktion af henholdsvis ikke-funktionelle proteiner og proteinfragmenter.

løsning af problemet med kodonbrugsforstyrrelse – kodonoptimering og ekspression af alternative tRNA ‘ er

Kodonoptimering

med billig DNA-syntese er en af de primære måder, forskere løser problemet med kodonvalg, at resyntetisere gener på en sådan måde, at deres kodoner er mere passende til den ønskede ekspressionshost. Dette er kendt som ” codon optimering.”Selvom det er simpelt i teorien, er det ikke så nemt som det lyder. Selv for relativt korte peptider kan der være mange mulige måder at kode dem på, og hvad der udgør det “passende” kodon er ikke nødvendigvis indlysende.

du tænker måske, ” nonsens! Jeg skulle bare vælge kodonet med den mest rigelige pulje af ladede tRNA ‘ er i min værtsorganisme for hver aminosyre, jeg gerne vil kode,” men som beskrevet ovenfor skal ikke alle regioner i et protein nødvendigvis oversættes hurtigt for at producere et protein, der fungerer korrekt.

du tænker måske, “Okay, jeg vil bare sørge for, at overflodene af de kodoner, jeg vælger til værten, matcher overflodene af kodoner, der bruges i den indfødte organisme.”Dette er muligvis en bedre ide og er blevet brugt med succes i fortiden (Angov et al., 2008), men der er stadig mange flere funktioner at overveje, når man designer et fuldt gen. En ikke-udtømmende liste inkluderer:

  • Codon overflod i forhold til beslægtet tRNA overflod
  • gentagne sekvenser
  • restriktionssteder
  • sekvenser, der er tilbøjelige til at skabe sekundære strukturer i RNA-udskrifter
  • effekter på transkription (husk, det handler ikke kun om oversættelse – f. eks. kan codonvalg afbryde transkriptionsfaktorbindingssteder)

som du måske forestiller dig, er det ikke let for mennesker at afbalancere alle disse faktorer alene. Heldigvis har mange forskere skabt codon optimering algoritmer og DNA syntese virksomheder som IDT og GenScript vært online codon optimering værktøjer. Husk, at bare fordi du optimerer et gen med et af disse værktøjer, betyder det ikke nødvendigvis, at genet vil udtrykke sig godt. Hvis du får et godt udtryk, skal du også funktionelt analysere det producerede protein for at sikre, at det er foldet korrekt.

du kan muligvis undgå at få dine gener af interesse codon optimeret ved at bestille plasmider indeholdende dem fra Addgen. Hvis et plasmid ved Addgen indeholder et gen, der er blevet kodonoptimeret til en bestemt organisme, vil dette undertiden (men ikke altid) bemærkes i feltet “mutation” på plasmidsiden (se plasmid 87904 for eksempel). Da mange plasmider, der er tilgængelige fra Addgene, nu har fulde sekvensdata, anbefaler vi direkte at analysere gensekvenser til kodonoptimering og egnethed til din ekspressionsvært, før du bruger dem i dine eksperimenter.

ekspression af alternative tRNA ‘er

hvis du ikke har tid eller midler til at syntetisere en kodonoptimeret version af dit gen af interesse, er det muligt at overudtrykke tRNA’ er med lav overflod i din ekspressionshost og derved øge deres overflod. For eksempel udtrykker de kommercielle Rosetta E. coli-stammer en række tRNA ‘ er, der normalt findes ved lav overflod i E. coli.

fordelen ved at producere yderligere tRNA ‘ er er, at du kan bruge det samme ekspressionssystem til mange forskellige gener uden at skulle oprette nye konstruktioner. På grund af problemer som uoverensstemmende oversættelseshastigheder og potentielle effekter på cellevækst kan selv værter, der producerer alternative tRNA ‘ er, muligvis ikke udtrykke tilstrækkelige mængder af dit protein af interesse.

uanset hvilken metode du vælger at overvinde problemerne omkring kodonvalg, skal du have en metode til at sikre, at de proteiner, du producerer, fungerer korrekt. Overekspression kan resultere i produktion af uopløselige, ikke-funktionelle glober af protein kendt som inklusionslegemer, der generelt vil adskille sig med cellepelleten under rensningsprocedurer. Selv hvis du producerer en stor mængde protein i dit valg af ekspressionsvært, skal du udføre et funktionelt assay for at sikre, at dit protein ikke danner inklusionslegemer og foldes korrekt.

 Klik for at hente Addgene ' s plasmider 101 eBook

1. Angov, Evelina, et al. “Heterolog proteinekspression forbedres ved at harmonisere kodonbrugsfrekvenserne for målgenet med ekspressionsværtens.”PloS one 3.5 (2008): e2189. PubMed PMID: 18478103. PubMed Central PMCID: PMC2364656.

2. Dittmar, Kimberly A., et al. “Selektiv opladning af tRNA-isoacceptorer induceret af aminosyresult.”EMBO rapporterer 6.2 (2005): 151-157. PubMed PMID: 15678157. PubMed Central PMCID: PMC1299251.

3. Emilsson, Valur og Charles G. Kurland. “Vækstrate afhængighed af overførsel RNA overflod i Escherichia coli.”EMBO journal 9.13 (1990): 4359-4366. PubMed PMID: 2265611. PubMed Central PMCID: PMC552224.

4. Gustafsson, Claes, Sridhar Govindarajan og Jeremy Minshull. “Codon bias og heterolog proteinekspression.”Tendenser inden for bioteknologi 22.7 (2004): 346-353. PubMed PMID: 15245907.

5. Maertens, Barbara, et al. “Genoptimeringsmekanismer: en multi‐genundersøgelse afslører en høj succesrate for humane proteiner i fuld længde udtrykt i Escherichia coli.”Proteinvidenskab 19.7 (2010): 1312-1326. PubMed PMID: 20506237. PubMed Central PMCID: PMC2970903.

6. Pechmann, Sebastian og Judith Frydman. “Evolutionær bevarelse af codonoptimalitet afslører skjulte underskrifter af cotranslational foldning.”Naturstrukturel & molekylærbiologi20 .2 (2013): 237. PubMed PMID: 23262490. PubMed Central PMCID: PMC3565066.

7. Tessa EF, et al. “Codon bias som et middel til at finjustere genekspression.”Molekylær celle 59.2 (2015): 149-161. PubMed PMID: 26186290. PubMed Central PMCID: PMC4794256.

  • denne anmeldelse giver et godt overblik over codon usage bias

8. Tuller, Tamir, et al. “Oversættelseseffektivitet bestemmes af både codon bias og foldningsenergi.”Proceedings of the National Academy of Sciences 107.8 (2010): 3645-3650. PubMed PMID: 20133581. PubMed Central PMCID: PMC2840511.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.