Muchas más proteínas que genes (y un ejemplo tumoral)

ResearchBlogging.orgEn nuestro ADN tenemos algo más de 20.000 genes. Es nuestro genoma. Que se reparte en 24 cromosomas diferentes cuya longitud oscila entre 50 y 250 millones de pares de bases (50.000-250.000 Kpb). En realidad, 23 parejas; y en cada una de ellas, uno de papá y otro de mamá.

Dentro de los cromosomas hay genes (y muchas otras cosas, porque los genes son solo un 2% de esos millones de paras de bases). Los genes no son otra cosa que instrucciones para montar proteínas. Lo hacen gracias al código genético, que asigna un aminoácido a cada triplete en la secuencia de bases del gen. Y también gracias a las moléculas que intervienen para que el código genético sea una realidad (ARN polimerasa, espliceosoma, ARNm, ribosoma, ARNt, aminoacil-ARNt-sintetasa).

Pero… Pero tenemos algo más de 20.000 genes, como ya te dije. Sin embargo fabricamos más de 100.000 proteínas diferentes.

¿Cómo hacemos para lograrlo?  :-o

Pues no es difícil, la verdad. Con el splicing. O sea, con el corte y empalme alternativo del ARN. Caaaaalma. Ya verás que es más fácil la idea que esos nombres, que el vocabulario que dice quién hace qué.

Resulta que el ADN hace copias de los genes. Pero en ARN. El ADN no sale del núcleo. Jamás. Y esas copias, antes de llegar a ser leídas, sufren un proceso por el cual pierden unos trozos, llamados intrones. Y quedan otros, llamados exones. Los intrones están intercalados entre los exones. De ahí lo de corte y empalme. Pero si unas veces quitas unos intrones y otras veces quitas otros puedes sacar dos versiones diferentes del mismo ARN. De ese modo logramos variantes de una proteína. Isoformas las llaman.

Tú podrías pensar que para qué queremos esto. Y sería una pregunta muy lógica. Con varias respuestas. Y una de ellas es relativamente sencilla. Porque las condiciones fisicoquímicas en, digamos el corazón, no son las mismas que en, digamos los riñones. Por tanto no viene mal tener preparadas unas variantes (isoformas) de una proteína que funcionen bien el corazón y otras que hagan lo propio en los riñones.

Pero, además, las isoformas pueden tener características diferentes. Te cuento el caso de una que me ha llamado la atención: la piruvato quinasa. Es un enzima importante, que cataliza el último paso de la glucólisis. La glucólisis es una ruta metabólica muy antigua (existe desde antes de que el planeta tuviera oxígeno en su atmósfera) que produce energía (poca) a partir de la glucosa y sin necesidad de oxígeno. Cuando hay oxígeno se logra mucho más rendimiento pero cuando no (anaerobiosis se llama eso), la glucólisis es la única manera de producir energía (p.ej., al realizar un ejercicio intenso en un tiempo breve). Pero esa es solo una de las facetas de este enzima. Resulta que tiene dos isoformas: PKM1 y PKM2. La habitual es PKM1; PKM2 se expresa, sobre todo, en época fetal y poco a poco va siendo sustituida por la PKM1. La diferencia es que PKM2 quita un exón (el 9) que sí aparece en PKM1 e incluye otro (el 10) que no está en PKM1 (que codifica para una región a la que se le puede añadir un marcador, un grupo acetilo, que hace que altere su forma y, lógicamente, modifica su función.). Y eso cambia muchas cosas. Tantas que PKM2 es un enzima que se expresa en células cancerígenas de muy diversos tipos; mientras que PKM1 no lo hace o lo hace poco. De hecho, los análisis de sangre que revelan concentraciones anormalmente elevadas de PKM2 son elementos diagnósticos para varios tipos de cánceres. Porque la piruvato quinasa puede actuar también, además de en la glucólisis, catalizando reacciones de fosforilación de proteínas en el núcleo. Proteínas que pondrán en marcha determinados genes relacionados con la reproducción celular. Pero solo bajo la forma de PKM2. En cambio, concentraciones elevadas de PKM1 inhiben, no se sabe cómo, el desarrollo del tumor.

Son las dos caras de una molécula. Dos caras en dos isoformas pero también en dos funciones. Una en el citoplasma (glucólisis) y otra en el núcleo (fosforilación de proteínas).

Todo por quitar el exón 9 y poner el exón 10…

McCarthy, Nicola (2013). Nuclear or cytoplasmic? Nature Reviews Cancer DOI: 10.1038/nrc3630
Jill D. Dombrauckas, Bernard D. Santarsiero, & Andrew D. Mesecar (2005). Structural Basis for Tumor Pyruvate Kinase M2 Allosteric Regulation and Catalysis Biochemistry DOI: 10.1021/bi0474923

Cómo fabricar muchos ARNm a partir de un único gen

ResearchBlogging.org Esta entrada es acorde con ResearchBlogging.

¡Qué tiempos aquellos en que todo era sencillo, fácil! El ADN era copiado en ARN (transcripción), el cual era leído para fabricar proteínas (traducción). ¡Fácil e incompleto! Muy muy muy incompleto.

Porque el ARN de eucariotas sufre diversas operaciones posteriores a su transcripción: encaperuzamiento, añadido de cola, corte y empalme (splicing), escisiones, transporte desde el núcleo al citoplasma… Incluso hemos descubierto que había un orgánulo nuevo, llamado espliceosoma. Bueno, en realidad siempre había estado ahí, dentro del núcleo, pero no nos habíamos fijado en él. Ni siquiera sabíamos que mereciera un nombre. Y mira que hace cosas gordas…

Bueno, pero hoy vamos a por otra cuestión. Y es que resulta que ninguno de esos procesos post-transcripcionales, ninguno, funcionaría bien si la región CTD de la ARN polimerasa II fuera defectuosa.

Uffff!!! Perdona. Te estoy hablando de la región CTD como si fuera algo cotidiano. Bueno, sí que lo es, pero sucede dentro de tus células, dentro de todas y cada una de ellas, sí, pero fuera de nuestra percepción. Pasa todos los días a todas horas pero a nivel submicroscópico y no nos damos cuenta. Nuestra vida, nuestras acciones, nuestros pensamientos, nuestra muerte, dependen de esa región, sí, pero no la notamos.

Pero no te creas que eso yo lo sabía. Me he enterado leyendo el trabajo del equipo de Anton Meinhart et. al., de la Universidad de Münich.

Tomada de: http://tinyurl.com/mjmaes

Pues resulta que la región CTD es, en realidad, una secuencia de siete aminoácidos (Tyr-Ser-Pro-Thr-Ser-Pro-Ser) repetida una y otra vez (52 veces en humanos). Su estructura es la de una cola flexible. Una cola que se ubica cerca del poro de salida de la ARN polimerasa II (el lugar por el que va saliendo el ARN conforme el ADN va siendo transcrito). Por si te interesan detalles irrelevantes, esa cola está enganchada por una región intermedia, más larga que ella misma, al núcleo del enzima ARN Pol II (en concreto, a la región Rpb7).

Algo así como en el gráfico.

Pero puede que todo eso que te cuento de su forma no te interese mucho. Así que me voy a centrar en lo más notable. Su atividad. Que es intervenir en que al ARN en formación se unan proteínas que vayan a modificarlo. Para que el ARN sea funcional, para que sea correcto. Y que las distintas proteínas que van a actuar dependen de la región CTD . Ella decidirá qué proteínas se van a unir. En concreto, su estado de fosforilación será el que decidirá. Constituye un verdadero lenguaje que comprenden esas enzimas modificadoras.

¿Y qué es eso del estado de fosforilación?. Pues que a determinados aminoácidos de esa secuencia de siete se les pueden unir iones H3PO4 (habitualmente abreviados como Pi). Admiten esos grupos fosfóricos hasta cinco lugares de la secuencia básica de siete aminoácidos (Tyr-Ser-Pro-Thr-Ser-Pro-Ser). En concreto, las posiciones 1, 2, 4, 5 y 7, aunque las más importantes son las serinas ubicadas en los lugares 2 y 5. Aunque sean dos serinas, las fosforilaciones que suceden en ellas no son equivalentes. Lo importante es en qué posición esté el Pi, no sobre qué aminoácido vaya. Ese es el verdadero lenguaje. Y un conjunto de enzimas quinasas (de la familia de las CDK, que ponen Pi) y fosfatasas (de la familia Fcp1, que los quitan; aunque probablemente haya otras como la Ssu72) como las máquinas de escribir. Máquinas que actúan, poniendo y quitando Pi conforme el ARN avanza en su transcripción. O sea, que el mensaje de grupos fosfóricos unidos a la región CTD cambia conforme se fabrica el ARN. Y cambian, por tanto, las proteínas que se le van uniendo. Al principio serán unas, luego serán otras….

Casi que cabe imaginar la región CTD como un tablón de anuncios de un aeropuerto, que dice qué vuelo despega (qué región del ARN se esta transcribiendo) y los pasajeros (proteínas modificadores del ARN) que leen ese mensaje saben que deben subir o no. Lo que pasa es que estamos aprendiendo a leer lo que pone el tablón.

Parece que hay 16 posibles estados y que las proteínas leen, no grupos sueltos de siete aminoácidos, sino por pares. Y para más complicación, los Pi de las posiciones 3 y 6, cuando suceden simltáneamente, pueden estar las dos en el mismo lado, o ir cruzadas una respecto a la otra.

Dominio WW

Tomada de: http://tinyurl.com/l4mdpu

Pfffffff!!!! Bueno, para todos esos detalles ya están los biólogos moleculares. Nosotros, con saber que hay un lenguaje formado por la existencia o no de grupos fosfóricos en determinadas posiciones de dos grupos de siete aminoácidos, suficiente. ¿¡Qué digo!? Más que suficiente… Las que entienden bien ese lenguaje son toda esa serie de proteínas que tienen que modifcar el ARN, y que cuentan con regiones específicas que se pueden unir a CTD en función de qué grupos Pi haya o no (como los dominios WW, los dominios FF o los dominios CID).

Bueeeeeenoooo… Pues con toda esta complicación (en realidad, con mucha más) se logra que, con sólo unos 20.000 genes, tengamos unas 100.000 proteínas. Porque un ARN transcrito puede sufrir diferentes acciones que lo conviertan en una cosa o en otra, en función de lo que diga el código de fosforilaciones de la CTD en cada momento.

Y también puedes ver otra versión de este post en “Más de un lenguaje genético“.

Meinhart, A. (2005). A structural perspective of CTD function Genes & Development, 19 (12), 1401-1415 DOI: 10.1101/gad.1318105