Cómo fabricar muchos ARNm a partir de un único gen

ResearchBlogging.org Esta entrada es acorde con ResearchBlogging.

¡Qué tiempos aquellos en que todo era sencillo, fácil! El ADN era copiado en ARN (transcripción), el cual era leído para fabricar proteínas (traducción). ¡Fácil e incompleto! Muy muy muy incompleto.

Porque el ARN de eucariotas sufre diversas operaciones posteriores a su transcripción: encaperuzamiento, añadido de cola, corte y empalme (splicing), escisiones, transporte desde el núcleo al citoplasma… Incluso hemos descubierto que había un orgánulo nuevo, llamado espliceosoma. Bueno, en realidad siempre había estado ahí, dentro del núcleo, pero no nos habíamos fijado en él. Ni siquiera sabíamos que mereciera un nombre. Y mira que hace cosas gordas…

Bueno, pero hoy vamos a por otra cuestión. Y es que resulta que ninguno de esos procesos post-transcripcionales, ninguno, funcionaría bien si la región CTD de la ARN polimerasa II fuera defectuosa.

Uffff!!! Perdona. Te estoy hablando de la región CTD como si fuera algo cotidiano. Bueno, sí que lo es, pero sucede dentro de tus células, dentro de todas y cada una de ellas, sí, pero fuera de nuestra percepción. Pasa todos los días a todas horas pero a nivel submicroscópico y no nos damos cuenta. Nuestra vida, nuestras acciones, nuestros pensamientos, nuestra muerte, dependen de esa región, sí, pero no la notamos.

Pero no te creas que eso yo lo sabía. Me he enterado leyendo el trabajo del equipo de Anton Meinhart et. al., de la Universidad de Münich.

Tomada de: http://tinyurl.com/mjmaes

Pues resulta que la región CTD es, en realidad, una secuencia de siete aminoácidos (Tyr-Ser-Pro-Thr-Ser-Pro-Ser) repetida una y otra vez (52 veces en humanos). Su estructura es la de una cola flexible. Una cola que se ubica cerca del poro de salida de la ARN polimerasa II (el lugar por el que va saliendo el ARN conforme el ADN va siendo transcrito). Por si te interesan detalles irrelevantes, esa cola está enganchada por una región intermedia, más larga que ella misma, al núcleo del enzima ARN Pol II (en concreto, a la región Rpb7).

Algo así como en el gráfico.

Pero puede que todo eso que te cuento de su forma no te interese mucho. Así que me voy a centrar en lo más notable. Su atividad. Que es intervenir en que al ARN en formación se unan proteínas que vayan a modificarlo. Para que el ARN sea funcional, para que sea correcto. Y que las distintas proteínas que van a actuar dependen de la región CTD . Ella decidirá qué proteínas se van a unir. En concreto, su estado de fosforilación será el que decidirá. Constituye un verdadero lenguaje que comprenden esas enzimas modificadoras.

¿Y qué es eso del estado de fosforilación?. Pues que a determinados aminoácidos de esa secuencia de siete se les pueden unir iones H3PO4 (habitualmente abreviados como Pi). Admiten esos grupos fosfóricos hasta cinco lugares de la secuencia básica de siete aminoácidos (Tyr-Ser-Pro-Thr-Ser-Pro-Ser). En concreto, las posiciones 1, 2, 4, 5 y 7, aunque las más importantes son las serinas ubicadas en los lugares 2 y 5. Aunque sean dos serinas, las fosforilaciones que suceden en ellas no son equivalentes. Lo importante es en qué posición esté el Pi, no sobre qué aminoácido vaya. Ese es el verdadero lenguaje. Y un conjunto de enzimas quinasas (de la familia de las CDK, que ponen Pi) y fosfatasas (de la familia Fcp1, que los quitan; aunque probablemente haya otras como la Ssu72) como las máquinas de escribir. Máquinas que actúan, poniendo y quitando Pi conforme el ARN avanza en su transcripción. O sea, que el mensaje de grupos fosfóricos unidos a la región CTD cambia conforme se fabrica el ARN. Y cambian, por tanto, las proteínas que se le van uniendo. Al principio serán unas, luego serán otras….

Casi que cabe imaginar la región CTD como un tablón de anuncios de un aeropuerto, que dice qué vuelo despega (qué región del ARN se esta transcribiendo) y los pasajeros (proteínas modificadores del ARN) que leen ese mensaje saben que deben subir o no. Lo que pasa es que estamos aprendiendo a leer lo que pone el tablón.

Parece que hay 16 posibles estados y que las proteínas leen, no grupos sueltos de siete aminoácidos, sino por pares. Y para más complicación, los Pi de las posiciones 3 y 6, cuando suceden simltáneamente, pueden estar las dos en el mismo lado, o ir cruzadas una respecto a la otra.

Dominio WW

Tomada de: http://tinyurl.com/l4mdpu

Pfffffff!!!! Bueno, para todos esos detalles ya están los biólogos moleculares. Nosotros, con saber que hay un lenguaje formado por la existencia o no de grupos fosfóricos en determinadas posiciones de dos grupos de siete aminoácidos, suficiente. ¿¡Qué digo!? Más que suficiente… Las que entienden bien ese lenguaje son toda esa serie de proteínas que tienen que modifcar el ARN, y que cuentan con regiones específicas que se pueden unir a CTD en función de qué grupos Pi haya o no (como los dominios WW, los dominios FF o los dominios CID).

Bueeeeeenoooo… Pues con toda esta complicación (en realidad, con mucha más) se logra que, con sólo unos 20.000 genes, tengamos unas 100.000 proteínas. Porque un ARN transcrito puede sufrir diferentes acciones que lo conviertan en una cosa o en otra, en función de lo que diga el código de fosforilaciones de la CTD en cada momento.

Y también puedes ver otra versión de este post en “Más de un lenguaje genético“.

Meinhart, A. (2005). A structural perspective of CTD function Genes & Development, 19 (12), 1401-1415 DOI: 10.1101/gad.1318105

IRGM, el gen que murió y resucitó

Esta entrada es bilingüe.

IRGM es un gen que produce una proteína con un papel en resistencia a infecciones bacterianas en muchos mamíferos como perros, ratas, etc. Los homínidos también tenemos ese gen funcional, aunque no está clara que su función sea como la que tiene en todos los mamíferos. Pero el resto de los primates no lo tiene.

In mammals such as rats and dogs, IRGM (immunity-related GTPase family, M) helps protect from bacterial pathogens such as salmonella. Humans and apes also produce a functional version of the IRGM protein, but the precise role of IRGM in humans and apes remains unclear.

¿Cómo? ¿Que qué, que qué, que cómo?

La clave para entender el lío del primer párrafo y la importancia que tiene es saber qué es un primate y que es un homínido.

Un primate es un mono en sentido amplio. Un orden de los mamíferos. Todos los monos. Nosotros incluidos, nosotros somos primates. Pero también nosotros somos homínidos. Homínidos es una familia dentro de primates, que incluye a humanos, chimpancés, orangutanes y gorilas. Recuerda, orden es una categoría taxonómica mayor que familia.

¿Ves ahora lo raro del primer párrafo? No me refiero a lo poco claro que es, a lo mal que lo he escrito. Ya sé que es muy mejorable en ese sentido. Me refiero al enorme problema genético que plantea. Un gen que estaba en antepasados lejanos, los de todos los mamíferos, deja de estar en antepasados menos lejanos, los de todos los primates, y reaparece en antepasados menos lejanos todavía, los de todos los homínidos.

Un gen que aparece y desaparece. Un gen que muere y resucita.

Es raro. Muy raro. Y es lo que ha investigado, y parece que averiguado, el equipo de Ewan Eichler.

Resulta que en los primates en general está averiado el gen. Mejor dicho, la parte inicial del gen, llamada promotor, sin la cual el gen no funciona. El resto está intacto. Es como si un automóvil tuviera averiado el motor de arranque pero el motor normal estuviera bien. Y no sólo eso. Sino que, debido a una serie de mutaciones, en medio del gen aparecieron dos señales de parada (o codones stop). Todo eso inutilizó el gen en primates. Y los procesos como transcripción y traducción no funcionaron.

Pinche aquí para ver el vídeo

Pinche aquí para ver el vídeo

In monkeys, a piece of “junk DNA” wedged in at the start of the gene, mucking up the gene’s promoter, a critical region for protein production. To make matters worse, the monkey gene sports a number of “stop codons,” a type of genetic red light that prevents the production of any functional protein.

En todos los primates, salvo en los homínidos. En los que tres mutaciones, tres, parecen haber recuperado el gen. Para empezar, en nuestro ADN hay genes llamados trasposones. Para que te hagas una idea de qué saben hacer, su antiguo nombre era “genes saltarines”. Efectivamente, son genes capaces de soltarse del ADN donde están incluidos y aterrizar en algún otro lugar de ese mismo ADN. Y el trasposón lleva su propio promotor. Un trasposón aterrizó sobre el promotor averiado y lo sustituyó. el gen IRGM ya tenía motor de arranque.

Pero se calaba. Y es que todavía tenía las señales de parada, los codones stop. Pues dos mutaciones los quitaron de allí. Y el gen ha vuelto a funcionar.

First, the DNA remains of an ancient virus, called an endogenous retrovirus, jumped from somewhere else in the genome into the region directly upstream of the dormant IRGM gene, creating a brand-new promoter. Then, two more mutations removed the remaining stop signs. Together, these three unrelated events restored the gene’s function.

Lo que no sabemos es si el gen recuperado en nuestro linaje cumple la misma función que la versión normal del gen en el resto de los mamíferos.

Uffff!

¿Menuda suerte? ¿Es que es posible que unas mutaciones estén más favorecidas que otras? ¿Que exista una maquinaria específica que cree y destruya señales de parada y promotores, orientada hacia la evolución, hacia producir cambios drásticos en los genes? Orientada hacia lugares especiales, muy típicos, de los genes? La maquinaria molecular de la evolución es algo todavía por descubrir a fondo. Ya sabemos cosas, pero aún ignoramos si la célula puede acelerar su evolución de algún modo. Sabemos que las hay, pero no cómo lo hacen. Sabemos que estimulan hipotéticas maquinarias de este tipo en función de condiciones ambientales.

Y no, no es lammarckiano. Lammarckiano sería si la mutación producida estuviera dirigida hacia un gen concreto. Aquí, lo que comento, es maquinaria molecular dirigida hacia aumentar la cantidad de mutaciones, para que la selección elija. Por tanto, es evolución darwiniana.