En química , las proteínas (o prótidos ) son macromoléculas biológicas formadas por cadenas de aminoácidos unidos entre sí por un enlace peptídico (es decir, un enlace entre el grupo amino de un aminoácido y el grupo carboxilo del otro aminoácido, creado a través de una reacción de condensación con pérdida de una molécula de agua ) . Las proteínas realizan una amplia gama de funciones dentro de los organismos vivos , incluida la catálisis de reacciones metabólicas , la función de síntesis como la replicación del ADN , la respuesta a estímulos y el transporte de moléculas de un lugar a otro. Las proteínas se diferencian entre sí principalmente en su secuencia de aminoácidos, que viene dictada por la secuencia de nucleótidos almacenada en los genes y que suele dar como resultado el plegamiento de la proteína y una estructura tridimensional específica que determina su actividad.
Al igual que otras macromoléculas biológicas como los polisacáridos y los ácidos nucleicos , las proteínas forman parte esencial de los organismos vivos y participan prácticamente en todos los procesos que ocurren dentro de las células. Muchos pertenecen a la categoría de enzimas , cuya función es catalizar las reacciones bioquímicas vitales para el metabolismo de los organismos. Las proteínas también tienen funciones estructurales o mecánicas, como la actina y la miosina en los músculos y las proteínas que componen el citoesqueleto , que forman una estructura que permite que la célula mantenga su forma. Otros son esenciales para la transmisión de señales inter e intracelulares , en la respuesta inmune , para la adhesión celular y para el ciclo celular. Las proteínas también son elementos necesarios en la nutrición animal, ya que no pueden sintetizar todos los aminoácidos que necesitan y deben obtener los esenciales a través de los alimentos. Gracias al proceso de digestión, los animales descomponen las proteínas ingeridas en aminoácidos individuales, que luego se utilizan en el metabolismo.
Una vez sintetizadas en el cuerpo, las proteínas existen solo durante un cierto período de tiempo y luego se degradan y reciclan a través de mecanismos celulares para el proceso de renovación de proteínas. La vida útil de una proteína se mide en términos de su vida media y puede ser muy variada. Algunos pueden existir solo unos minutos, otros hasta unos pocos años, sin embargo, la vida útil promedio en las células de los mamíferos es de entre 1 y 2 días. Las proteínas anormales mal plegadas pueden causar inestabilidad si no se degradan más rápidamente.
Las proteínas se pueden purificar de otros componentes celulares utilizando una variedad de técnicas como ultracentrifugación , precipitación , electroforesis y cromatografía ; el advenimiento de la ingeniería genética ha hecho posible una serie de métodos para facilitar esta purificación. Los métodos comúnmente utilizados para estudiar la estructura y la función de las proteínas incluyen la inmunohistoquímica , la mutagénesis específica del sitio , la cristalografía de rayos X y la resonancia magnética nuclear . Las proteínas se diferencian principalmente en la secuencia de aminoácidos que las componen, que a su vez depende de la secuencia de nucleótidos de los genes que expresan su síntesis dentro de la célula .
Una cadena lineal de residuos de aminoácidos se denomina " polipéptido " (es decir, una cadena de múltiples aminoácidos unidos por enlaces peptídicos). Una proteína generalmente consta de uno o más polipéptidos largos posiblemente coordinados con grupos no peptídicos, llamados grupos prostéticos o cofactores. Los polipéptidos cortos, que contienen menos de aproximadamente 20-30 aminoácidos, rara vez se consideran proteínas y se denominan comúnmente péptidos o, a veces , oligopéptidos . La secuencia de aminoácidos en una proteína está definida por la secuencia presente en un gen , que está codificada en el código genético . En general, el código genético especifica 20 aminoácidos estándar; sin embargo, en algunos organismos el código puede incluir selenocisteína (SEC), y en algunas arqueas , pirrolisina y finalmente un aminoácido 23, N-formilmetionina , un derivado de la metionina , que inicia la síntesis proteica de algunas bacterias.
Poco después o incluso durante la síntesis de proteínas , los residuos de una proteína a menudo se modifican químicamente mediante una modificación postraduccional que, si está presente, altera las propiedades físicas y químicas, el plegamiento, la estabilidad, la actividad y, en última instancia, la función de la proteína. Las proteínas también pueden trabajar juntas para lograr una función particular y a menudo se asocian en complejos multiproteicos estables.
Las proteínas que contienen el mismo tipo y número de aminoácidos pueden diferir del orden en que se ubican en la estructura de la molécula . Este aspecto es muy importante porque una mínima variación en la secuencia de aminoácidos de una proteína (es decir, en el orden en que se suceden los distintos tipos de aminoácidos) puede dar lugar a variaciones en la estructura tridimensional de la macromolécula que pueden hacer la proteína no funcional. Un ejemplo bien conocido es el caso de la cadena beta de la hemoglobina humana , que en su secuencia normal lleva un rasgo formado por: valina - histidina - leucina - treonina - prolina - ácido glutámico - lisina .
Los aminoácidos de una proteína varían de 20 a 30 con 9 esenciales, por lo tanto, no sintetizados por el cuerpo humano, por lo tanto, para ser tomados externamente a través de los alimentos.
La formación de copias duplicadas de genes y la alteración de la función de una proteína durante la evolución llevaron a la formación de las aproximadamente 500 familias de proteínas identificadas. Dentro de una familia, aunque cada proteína realiza una función ligeramente diferente de la otra, la secuencia de aminoácidos, particularmente en los sitios catalíticos y en las regiones conservadas, es casi idéntica. Sin embargo, no es una ley que se aplique a todas las proteínas de una familia; de hecho, hay algunas proteínas con una secuencia de aminoácidos muy diferente y, sin embargo, con una conformación tridimensional muy similar.
Por lo tanto, se puede decir que en el curso de la evolución dentro de una familia de proteínas, la conformación tridimensional se conservó más que la secuencia de aminoácidos. Generalmente, cuando al menos una cuarta parte de la secuencia de aminoácidos de dos proteínas coincide, tienen la misma estructura general. Dos proteínas diferentes que pertenecen a la misma familia y tienen una función similar se denominan "parálogos", mientras que la misma proteína en dos organismos diferentes (por ejemplo, humanos y ratones) se denomina "ortólogos". Generalmente se acepta la relación entre dos proteínas cuando al menos el 30% de los aminoácidos coinciden, pero para comprobarlo se puede recurrir a las llamadas huellas dactilares , es decir secuencias cortas de aminoácidos comunes en casi todas las proteínas de una familia dada.
Algunas proteínas se formaron por mezcla de los dominios proteicos o por su duplicación dentro de la misma proteína debido a uniones accidentales de ADN codificante; ciertos dominios están particularmente extendidos y, por lo tanto, se denominan módulos de proteínas. Estos dominios tienen la característica de tener N-terminales y C-terminales en polos opuestos de la proteína, por lo que se favorece la agregación a otros dominios y otras proteínas para formar estructuras más grandes frente a lo que ocurriría si fueran ambos hacia la misma proteína. polo; un ejemplo es el módulo 1 de fibronectina . En este caso, los dominios se insertan en los bucles de proteínas de algunas proteínas, por ejemplo, el módulo kringle en la uroquinasa o el dominio SH2. Algunos de estos dominios no se encuentran solo entre proteínas paralógicas sino también ortólogas, por ejemplo el dominio SH2 muestra una difusión muy similar tanto en el gusano como en la mosca, pero es muy poco frecuente en las plantas . En cambio, hay dominios comunes solo a ciertas categorías de organismos como MHC, el complejo principal de histocompatibilidad , presente en humanos pero ausente en insectos y plantas, sin embargo, estos representan solo el 7% del total. También se ha observado que, aunque algunos organismos vivos aparentemente simples como la planta Arabidopsis thaliana poseen más genes que un ser humano, las proteínas humanas tienden a estar formadas por un mayor número de dominios y por tanto son más complejas que los ortólogos en otros organismos.
Por lo tanto, la clasificación se puede hacer sobre la base de la composición química, la configuración molecular o la solubilidad . Así, se distinguen proteínas simples (formadas únicamente por aminoácidos) y proteínas conjugadas (formadas por una proteína simple y un grupo protésico de naturaleza no proteica).
Las proteínas simples incluyen proteínas fibrosas , generalmente insolubles en solventes acuosos y, a veces, inatacables por enzimas proteolíticas, tales como: colágeno (componente esencial del tejido conectivo ), elastina (componente principal de las fibras elásticas y las paredes de los vasos), queratina (componente esencial de la epidermis ). . Además, siempre entre las simples se encuentran las proteínas globulares , las albúminas (muy extendidas en el mundo animal), las globulinas (insolubles en agua, que se encuentran en la sangre, músculos, tejidos en general y semillas) y las prolaminas (características del mundo vegetal).
Entre las proteínas conjugadas (compuestas al menos por apoproteína + grupo prostético ): hemoglobina , clorofilas y opsinas .
Otra clasificación de las proteínas es la que las distingue en función de su función, en la que podemos distinguir las proteínas estructurales que son componentes de las estructuras permanentes del organismo y tienen principalmente una función mecánica, las proteínas de transporte que se unen a agua pobremente Sustancias solubles y permiten su transporte en fluidos corporales y enzimas que son proteínas catalíticas . Otras funciones de las proteínas incluyen la regulación de la expresión génica , la duplicación , transcripción y traducción del ADN , la regulación de reacciones metabólicas, la generación y recepción de impulsos nerviosos. Muchas toxinas y alérgenos también son proteínas.
La mayoría de las proteínas están formadas por polímeros lineales construidos a partir de la serie de 20 L-α-aminoácidos diferentes. Todos los aminoácidos proteinogénicos poseen características estructurales comunes, incluido un carbono α con un grupo amino , un grupo carboxilo y una cadena lateral variable. Solo la prolina difiere de esta estructura básica en que contiene un anillo inusual en el grupo amino. [1] Las cadenas laterales de los aminoácidos estándar, detalladas en la lista de aminoácidos estándar , tienen una gran variedad de estructuras y propiedades químicas; es el efecto combinado de todas las cadenas laterales de aminoácidos en una proteína lo que finalmente determina su estructura tridimensional y su reactividad química. [2] Los aminoácidos de una cadena polipeptídica están unidos por enlaces peptídicos. Una vez enlazado en la cadena de la proteína, un aminoácido individual se denomina residuo y la serie enlazada de átomos de carbono , nitrógeno y oxígeno se conoce como "cadena principal" o " proteínas de la columna vertebral ". [3]
El enlace peptídico tiene dos formas de resonancia que contribuyen al doble enlace e inhiben la rotación alrededor de su eje, de modo que los carbonos α son aproximadamente coplanares. Los otros dos ángulos diédricos en el enlace peptídico determinan la forma local que asume la " proteína principal " . [4] El extremo de la proteína con un grupo carboxilo libre se conoce como dominio C-terminal , mientras que el extremo con un grupo amino libre se conoce como el dominio N-terminal . Los términos proteína, polipéptido y péptido son algo ambiguos y pueden superponerse en algunos significados. El término "proteína" se usa generalmente para referirse a la molécula biológica completa en una conformación estable, mientras que el "péptido " generalmente se reconoce como un oligómero de aminoácido corto que a menudo carece de una estructura tridimensional estable. Sin embargo, el límite entre los dos compuestos no está bien definido y, por lo general, el número de residuos que los diferencian es cercano a 20-30. [5 ] Con "polipéptido" se puede hacer referencia a cualquier cadena lineal única de aminoácidos, generalmente independientemente de su longitud, pero a menudo el término implica la ausencia de una conformación definida ejército de reserva.
Las proteínas tienen una estructura tridimensional muy compleja a la que siempre se asocia una función biológica. De esta consideración deriva uno de los dogmas fundamentales de la biología : " Estructura <--> Función ", en el sentido de que una función bioquímica específica está asociada a cada organización estructural diferente que posee una proteína (llamada proteína nativa). Desde este punto de vista, las proteínas se pueden clasificar en dos grandes familias: proteínas globulares y proteínas de estructura alargada o fibrosa. Estas dos organizaciones reflejan las dos principales separaciones funcionales que las distinguen:
Su composición en aminoácidos es variable y está bajo control genético por lo que su peso molecular puede ser muy variable y depende del número y tipo de aminoácidos (monómeros) que componen la molécula. Si la molécula está formada por unas pocas unidades de aminoácidos (normalmente no más de 10), se define como un "oligopéptido". Las moléculas con más de 10 unidades se denominan "polipéptidos" [6] . Una proteína está formada por uno o más polipéptidos posiblemente acompañados de uno o más grupos prostéticos y su peso molecular generalmente no es inferior a 10.000 [7] .
Una proteína en su organización nativa, y por lo tanto funcionalmente activa, sólo puede existir en soluciones salinas diluidas (muy similares en composición a las que existen en los sistemas celulares acuosos). Su estructura depende exclusivamente de las características físico-químicas de la solución acuosa en la que se encuentra ( pH , presencia de iones salinos, temperatura, presión, presencia de compuestos orgánicos como urea , alcoholes , etc.). La variación de estos parámetros puede determinar cambios estructurales que pueden alterar las propiedades funcionales, hasta anularlas (proteína desnaturalizada).
La molécula de proteína está compuesta por átomos de carbono , oxígeno , hidrógeno y nitrógeno ; a menudo también contiene azufre (presente en los aminoácidos metionina, cisteína y cistina) y, a veces, fósforo y/o metales como hierro , cobre , zinc y otros.
Las propiedades de las proteínas están ligadas a las de sus constituyentes, los aminoácidos: son electrolitos anfóteros , pueden someterse a electroforesis , son ópticamente activos (zurdos) y presentan el fenómeno de Tyndall .
El punto isoeléctrico (o PI) de una proteína está representado por aquella concentración de iones de hidrógeno del medio, que se comporta de tal forma que hace que el prótido asuma una forma de anfión .
Para obtener el peso molecular (o PM) de las proteínas es necesario recurrir a técnicas y metodologías que no siempre son fáciles de implementar. Entre las muchas, la que proporciona los resultados más precisos es, sin duda , la espectrometría de masas .
Desde el punto de vista mecánico, la cadena de aminoácidos se comporta como un polímero semiflexible cuya extensión está descrita por el modelo de cadena tipo gusano , con una longitud de persistencia de 0,4 nm.
Una proteína, al ser una macromolécula formada por decenas de miles de átomos, podría asumir potencialmente una cantidad increíblemente grande de pliegues posibles. Sin embargo, las consideraciones físicas limitan mucho los posibles pliegues y por tanto la conformación final de una proteína. Mientras tanto, los átomos nunca pueden superponerse y comportarse ampliamente como esferas con un radio definido llamado radio de van der Waals , lo que limita en gran medida la cantidad de ángulos permitidos en una cadena polipeptídica. Cada aminoácido contribuye a la formación de la cadena polipeptídica con tres enlaces:
El enlace peptídico es plano e impide una rotación real, mientras que los otros dos enlaces lo permiten.
El ángulo de rotación del enlace C α -C se llama ψ, el del enlace C α -N se llama φ. La conformación de los átomos de la cadena principal de una proteína está determinada por el par de estos ángulos de rotación para cada aminoácido. Dado que las colisiones estéricas entre aminoácidos no son posibles, los ángulos posibles son limitados. Ramachandran en función de los posibles pares de ángulos de rotación compiló un gráfico que hoy lleva su nombre donde se ve claramente que la mayoría de las proteínas asumen solo dos tipos principales de conformación: la hélice α y la hoja β .
Se establecen interacciones llamadas enlaces entre los átomos de una proteína, que pueden ser covalentes o no covalentes. Los enlaces no covalentes, tomados individualmente, son siempre más débiles que los covalentes en el orden de decenas o cientos de veces, sin embargo, su número dentro de una proteína los hace esenciales para comprender su plegamiento. Los enlaces no covalentes que se encuentran en las proteínas son enlaces de hidrógeno , atracciones electrostáticas y atracciones de van der Waals .
A estas interacciones hay que añadir la tendencia de los grupos de aminoácidos hidrofóbicos (fenilalanina, leucina, isoleucina, triptófano, valina, cisteína, metionina, prolina, alanina y glicina) a acercarse y unirse formando bolsas hidrofóbicas lejos de la red de enlaces. hidrógeno que siempre debe imaginarse presente dentro de un ambiente acuoso entre las moléculas de agua. Generalmente, los grupos de aminoácidos hidrofóbicos casi siempre se colocan dentro de la proteína, ya que esta se encuentra típicamente en un ambiente acuoso, mientras que sus aminoácidos hidrofílicos, polares y cargados tenderán a estar en el exterior. La estructura tridimensional de una proteína está determinada únicamente por la disposición secuencial de sus aminoácidos y la conformación que asume tiende a ser la de menor energía libre.
Fue posible descubrir esta peculiaridad de las proteínas realizando experimentos de desnaturalización (utilizando disolventes como la urea) y renaturalización de proteínas in vitro. Se ha observado que algunas proteínas, una vez desnaturalizadas y eliminado el disolvente, se pliegan de forma independiente. Sin embargo, no todas las proteínas, una vez desnaturalizadas, pueden volver a plegarse espontáneamente a su conformación original. La conformación de una proteína, aunque normalmente es lo más estable posible por la secuencia de sus aminoácidos, no es inmutable y sufre pequeños cambios debido a la interacción con ligandos u otras proteínas. Esta característica subyace a la funcionalidad de la mayoría de las proteínas. La conformación de una proteína puede ser ayudada y refinada en gran medida por chaperonas , proteínas que se unen a las cadenas parcialmente plegadas y las ayudan hasta que se alcanza la conformación correcta. A menudo funcionan aislando las bolsas hidrofóbicas de una proteína entre sí, que de otro modo tenderían a asociarse prematuramente.
Una porción de proteína que se pliega independientemente del resto de la cadena polipeptídica se denomina dominio proteico y una proteína puede tener más de uno. Se supone que hay alrededor de 2000 dominios de proteínas con diferentes estructuras en la naturaleza, se han identificado alrededor de 800, sin embargo, la gran mayoría de los dominios de proteínas asumen unas pocas docenas de conformaciones diferentes.
La hélice α y la lámina β plisadasLa hélice α y la hoja β son las conformaciones más comunes que se encuentran en las cadenas polipeptídicas de una proteína. Una sola proteína puede tener tanto hélices α como láminas β en cantidades variables.
Una proteína en su conjunto es una molécula en la que convencionalmente se distinguen varios niveles de organización, que pueden ser tres o cuatro según la proteína. [8]
Las proteínas que también contienen una parte no polipeptídica, el grupo prostético , se denominan proteínas conjugadas . Se dice que dos proteínas son isoformas si, con la misma estructura primaria, difieren en uno de los otros niveles de estructura. Desnaturalizar una proteína significa destruir su conformación espacial, rompiendo puentes de hidrógeno y puentes disulfuro por medio de ácidos , bases, calor, radiación o agitación (un ejemplo común de desnaturalización es la cocción de un huevo en el que la albúmina , que constituye la mayor parte de la la albúmina se desnaturaliza). Una proteína desnaturalizada, mientras mantiene intacta su estructura primaria, ya no puede realizar su función, a menos que se pueda restablecer su estructura terciaria.
Las proteínas, aunque sean complejas incluso tomadas individualmente, en los organismos vivos pueden agregarse a otras proteínas idénticas oa proteínas aparentemente muy diferentes creando complejos proteicos. Lo que permite este enlace son los mismos enlaces no covalentes que permiten que una proteína asuma una determinada conformación. En una proteína, a menudo hay una o más zonas características capaces de interacciones no covalentes con otras proteínas llamadas sitios de unión . Cuando una proteína, a través de un sitio de unión, se une a otra proteína formando un complejo proteico, cada proteína individual del complejo se denomina subunidad proteica.
Si las subunidades que forman el complejo proteico son dos, se dirá que es un dímero , si son tres un trímero , si son cuatro un tetrámero y así sucesivamente. Hay complejos proteicos que contienen decenas de subunidades. El enlace entre las subunidades puede ser, por ejemplo, "cabeza a cabeza" (en este caso se prefieren los dímeros) o "cabeza a cola" (donde a menudo las proteínas son globulares o en forma de anillo).
Un ejemplo de una proteína con múltiples subunidades es la hemoglobina , una proteína globular formada por cuatro subunidades, dos α-globulinas en uno de los dos polos y dos β-globulinas en el otro (por lo tanto, las subunidades no se alternan), con un grupo protésico (hemo) ligado a cada subunidad.
Otros complejos proteicos están formados por muchas más subunidades que permiten la creación de filamentos ya que en un polo tienen un sitio de unión y en el otro polo una estructura proteica complementaria a ese mismo sitio. Esto crea cadenas de filamentos de proteínas como la actina-F, formados por cientos de subunidades globulares de actina-G que les dan una apariencia similar a la de un collar de perlas helicoidales bajo el microscopio electrónico. La redundancia de la estructura helicoidal y no rectilínea se debe siempre a la afinidad de una conformación con la menor energía libre.
Una variante de la hélice es la bobina enrollada , que involucra dos o tres cadenas polipeptídicas, como en la queratina o el colágeno. Se puede decir, a grandes rasgos, que las proteínas globulares suelen tener una función enzimática, mientras que las que forman filamentos tienen una función estructural (por ejemplo, forman miofibrillas en las fibras musculares o las fibras de la matriz extracelular, o incluso el citoesqueleto de una celda).
Hay proteínas cuya función es posible precisamente por su estructura difícilmente caracterizable y aleatoria, un ejemplo es la elastina , que forma las fibras elásticas de la pared arterial y de muchos otros tejidos del cuerpo humano. En la elastina numerosas cadenas polipeptídicas están unidas covalentemente sin una disposición regular y esta estructura desordenada determina su deformabilidad. Las proteínas no estructuradas tienen varias funciones en la célula, algunas, por ejemplo, tienen una función estructural como la elastina, otras, sin embargo, son canales como las nucleoporinas colocadas en la membrana nuclear de cada célula, y otras actúan como proteínas de andamiaje, es decir, proteínas que se agrupan en estrecha proximidad de otras proteínas con función relacionada, fundamentales en la señalización y comunicación celular. Una característica común a todas las proteínas pobremente estructuradas es una gran redundancia de aminoácidos y una baja presencia de aminoácidos hidrofóbicos.
Ciertas proteínas muy expuestas a la degradación en el entorno extracelular se estabilizan mediante enlaces disulfuro (SS) que se forman entre dos proteínas; este enlace actúa como un verdadero alimento básico en la proteína, lo que le permite mantener su conformación incluso en entornos hostiles. Dentro del citoplasma es difícil encontrar enlaces disulfuro debido al entorno reductor, por lo que las cisteínas muestran grupos (-SH).
La evolución también hizo posible crear complejos de proteínas aún más grandes que los filamentos, las bobinas enrolladas o las proteínas globulares. La ventaja de tales estructuras es que, dado que a menudo se componen de la repetición de subunidades idénticas o similares, se necesita poco material genético para sintetizar grandes complejos de proteínas, como las cápsidas de virus . Además, la asociación entre las subunidades generalmente requiere una energía muy baja o, en algunos casos, las subunidades se autoensamblan (por ejemplo, el ribosoma bacteriano). La cápside de muchos virus está formada por un tubo hueco (como en el virus del mosaico del tabaco ) o se asemeja a un icosaedro o una esfera hueca, como en el poliovirus.
Generalmente estas estructuras resultan a la vez muy estables, dadas las numerosas interacciones entre las subunidades, y adaptables, ya que para infectar una célula deben permitir el escape de ácido nucleico, ya sea ARN o ADN.
Todos los aminoácidos excepto la glicina tienen un carbono unido a cuatro sustituyentes diferentes que es un centro quiral . Por lo tanto, todos los aminoácidos pueden existir en dos conformaciones: L o D , al sintetizarlos artificialmente se obtiene una mezcla racémica .
Sin embargo, todos los aminoácidos de los compuestos biológicos se encuentran en la naturaleza solo en la conformación L. Los aminoácidos en la conformación D se encuentran en algunas especies bacterianas y también se utilizan para la síntesis de fármacos. La gramicidina S, un péptido natural con función antibacteriana, en su estructura primaria también contiene algunos aminoácidos pertenecientes a la conformación D.
Las proteínas se forman a partir de aminoácidos usando información codificada en los genes . Cada proteína tiene su propia secuencia de aminoácidos que deriva de la secuencia de nucleótidos del gen que la codifica. El código genético está formado por tripletes de nucleótidos llamados codones y cada combinación de tres nucleótidos designa un aminoácido, por ejemplo AUG ( adenina - uracilo - guanina ) es el código de la metionina . Dado que el ADN contiene 4 nucleótidos diferentes, el número total de codones posibles es 64; siendo los aminoácidos estándar sólo 20 en el código genético existe cierto grado de redundancia y algunos aminoácidos corresponden a más codones. [9] Los genes presentes en el ADN se transcriben primero en pre-ARNm (pre-ARN mensajero) por proteínas como la ARN polimerasa .
La mayoría de los organismos procesan el pre-ARNm (también conocido como transcripción primaria ) mediante diversas formas de modificaciones postranscripcionales para formar ARNm maduro . El ARN mensajero maduro se usa luego como molde para la biosíntesis de proteínas en el ribosoma . En procariotas , el ARNm se puede usar inmediatamente después de producirse o después de alejarse del nucleoide . Por el contrario, los eucariotas forman ARNm en el núcleo celular y posteriormente lo translocan a través de la membrana nuclear hacia el citoplasma , donde tiene lugar la biosíntesis de proteínas . La velocidad de síntesis de proteínas es mayor en procariotas que en eucariotas y puede alcanzar los 20 residuos de aminoácidos por segundo. [10]
El proceso de sintetizar una proteína a partir de una plantilla de ARNm se conoce como traducción. El ARNm se carga en el ribosoma y lee tres nucleótidos a la vez acoplando cada codón con el anticodón correspondiente ubicado en el ARN de transporte que lleva el aminoácido correspondiente al codón reconocido. La enzima aminoacil-tRNA sintetasa "carga" la molécula de tRNA con el aminoácido correcto. Las proteínas siempre se biosintetizan a partir del extremo N-terminal hacia el extremo C-terminal . [9] Luego, los aminoácidos se unen mediante la eliminación de una molécula de agua por parte de la peptidil-transferasa.
El tamaño de una proteína sintetizada se puede medir por el número de aminoácidos que contiene y su masa molecular total , que normalmente se mide en dalton (sinónimo de unidad de masa atómica ) o la unidad derivada kilodalton (kDa). Por ejemplo, las proteínas de levadura tienen una longitud media de 466 residuos de aminoácidos y un peso medio de 53 kDa. [5]
Las proteínas más cortas también se pueden sintetizar químicamente mediante una serie de métodos de síntesis de péptidos que se basan en técnicas de síntesis orgánica , como la legación química, para producir péptidos con altos rendimientos. [11]
La síntesis química permite la introducción de aminoácidos no naturales en la secuencia, como la inserción de sondas fluorescentes . [12] Estos métodos son útiles en laboratorios de bioquímica y biología celular , aunque generalmente no tienen aplicación comercial.
La síntesis química es ineficiente (en términos de rendimiento) para polipéptidos de más de 300 residuos de aminoácidos, y las proteínas sintetizadas pueden tener problemas para asumir rápidamente la estructura terciaria de la conformación nativa. La mayoría de los métodos de síntesis química proceden del extremo C al extremo N, en dirección opuesta a la biosíntesis natural. [13]
Las proteínas juegan un papel fundamental dentro de la célula, realizando las tareas específicas codificadas en la información contenida en los genes. [5] Pueden realizar funciones estructurales, inmunes, de transporte (oxígeno, minerales, lípidos, membrana), identificando identidades genéticas, hormonales, enzimáticas, contráctiles, energéticas. Con la excepción de algunos tipos de ARN, la mayoría de las demás moléculas biológicas son elementos relativamente inertes sobre los que actúan las proteínas. Las proteínas representan la mitad del peso seco de una célula de Escherichia coli , mientras que otras macromoléculas, como el ADN y el ARN, constituyen solo el 3% y el 20% respectivamente. [14] El conjunto de proteínas expresadas en un tipo de célula en particular se conoce como su proteoma .
La característica principal de las proteínas que les permite un conjunto diverso de funciones es la capacidad de unirse a otras moléculas de una manera específica. La región de la proteína que permite la unión a la otra molécula se conoce como sitio de unión y suele ser una depresión o "bolsillo" en la superficie molecular. Esta capacidad de unión está mediada por la estructura terciaria de la proteína, que define el bolsillo del sitio de unión, y por las propiedades químicas de las cadenas laterales de los aminoácidos circundantes. Los enlaces entre proteínas pueden ser extraordinariamente estrechos y específicos; por ejemplo, la proteína inhibidora de la ribonucleasa se une a la angiogenina humana con una constante de disociación subfemtomolar (<10 −15 M), pero no se une en absoluto a su contraparte anfibia (> 1 M). Los cambios químicos extremadamente pequeños, como la adición de un solo grupo metilo a una proteína de unión, a veces pueden ser suficientes para eliminar esta restricción: por ejemplo, la aminoacil-tRNA sintetasa se especifica por el aminoácido valina que la distingue de la cadena lateral muy similar. de isoleucina . [15]
Las proteínas pueden unirse a otras proteínas así como a sustratos de moléculas pequeñas. Las interacciones proteína-proteína también regulan la actividad enzimática, controlan la progresión del ciclo celular y permiten el ensamblaje de grandes complejos proteicos que realizan muchas reacciones estrechamente relacionadas con una función biológica común. Las proteínas también pueden unirse o incluso integrarse con las membranas celulares . La capacidad de los socios de unión para inducir cambios conformacionales en las proteínas permite la construcción de redes de señalización extremadamente complejas. [16] [17]
Es importante destacar que las interacciones entre proteínas son reversibles y dependen en gran medida de la disponibilidad de diferentes grupos de proteínas asociadas para formar agregados que son capaces de formar conjuntos discretos. Estudiar las interacciones entre proteínas específicas es clave para comprender los aspectos importantes de la función celular y, en última instancia, las propiedades que distinguen tipos de células particulares. [18]
El papel más conocido de las proteínas dentro de la célula es actuar como enzimas capaces de catalizar reacciones químicas . La mayoría de los nombres de enzimas terminan en "-ase" por convención. Las enzimas son generalmente altamente específicas y pueden acelerar solo una o algunas otras reacciones. Son fundamentales para la mayoría de las reacciones implicadas en el metabolismo , así como en los procesos de manipulación del ADN , como la replicación del ADN , la reparación y la transcripción del ADN . Algunas enzimas actúan sobre otras proteínas agregando o eliminando grupos químicos en un proceso conocido como modificación postraduccional . Se conocen unas 4.000 reacciones catalizadas por enzimas. [19] La aceleración conferida por la catálisis enzimática suele ser enorme, hasta 10 17 veces mayor que la reacción no catalizada en el caso de la orotato descarboxilasa , que tardaría 78 millones de años sin la intervención de la enzima, pero gracias a su intervención este tiempo se reduce a sólo 18 milisegundos. [20]
El ligando de una enzima se llama sustrato y generalmente es mucho más pequeño que la propia enzima. Aunque las enzimas pueden estar formadas por cientos de aminoácidos, por lo general solo una pequeña fracción de los residuos entra en contacto con el sustrato y, en promedio, uno de cada cuatro está directamente involucrado en la catálisis , incluso menos de tres fracciones. [21] La región de la enzima que se une al sustrato y contiene los residuos catalíticos se conoce como sitio activo .
Muchas proteínas están involucradas en el proceso de señalización celular y en la transducción de señales . Algunas proteínas, como la insulina , operan en un ambiente extracelular al transmitir una señal desde la célula en la que fueron sintetizadas a otras células en tejidos distantes. Otras, como las proteínas de membrana , actúan como receptores cuya función principal es unir una molécula de señalización e inducir una respuesta bioquímica en la célula. Muchos receptores tienen un sitio de unión expuesto en la superficie celular y un dominio efector ubicado internamente que puede tener actividad enzimática o puede sufrir un cambio conformacional que es detectado por otras proteínas dentro de la célula. [22]
La proteína del biopigmento criptocromo es conocida por sus propiedades para formar radicales libres durante su interacción con la luz, para la sincronización de los ritmos circadianos .
Los anticuerpos son componentes proteicos del sistema inmunitario adaptativo cuya función principal es unir antígenos o sustancias extrañas en el cuerpo y luego marcarlos para su destrucción. Los anticuerpos pueden secretarse en el entorno extracelular o anclarse en las membranas de los linfocitos B , conocidos como células plasmáticas. Si las enzimas están limitadas en su afinidad de unión por sus sustratos por la necesidad de realizar la reacción, los anticuerpos no tienen tales restricciones. La afinidad de unión de un anticuerpo a su objetivo es extraordinariamente alta. [23]
Casi todas las proteínas conocidas interactúan con otras proteínas o con otro tipo de moléculas, sin embargo llamadas ligandos, a través de sus sitios de unión, esta es la base de la mayoría de las interacciones presentes en una célula. Una proteína generalmente tiene un sitio de unión que le permite unirse a uno o unos pocos ligandos, por lo que la mayoría de las proteínas tienen una alta especificidad. La extensión del enlace puede ser diferente, hay proteínas que se unen a sus ligandos de forma muy tenaz, otras en cambio lo hacen débilmente y el tipo de enlace influye en la función de la misma proteína. Por ejemplo, los anticuerpos se unen fuertemente a sus ligandos (llamados antígenos ), mientras que ciertas enzimas para la cinética y para acelerar las reacciones no se unen tan fuertemente a su sustrato.
La capacidad de unión siempre depende de la capacidad de la proteína para establecer enlaces no covalentes ( enlace de hidrógeno , atracciones electrostáticas , atracciones hidrofóbicas y fuerzas de van der Waals ) con el ligando. Cuantos más enlaces se formen, más intenso será el enlace con el ligando en general. El sitio de unión de una proteína tiene una forma generalmente casi complementaria a la del ligando que debe adherirse a él, lo que determina su especificidad. Las características de cada sitio de unión vienen dadas por las cadenas laterales de los aminoácidos que aparecen en él; los aminoácidos que intervienen en ella suelen estar distantes a lo largo de la cadena polipeptídica de la proteína. Las mutaciones en el sitio de unión generalmente dan como resultado un mal funcionamiento o el cese de la actividad catalítica o de unión original. No sorprende pensar que los sitios de unión son algunos de los aminoácidos más conservados dentro de una proteína. Los sitios de unión están aislados del ambiente acuoso en el que están inmersos ya que algunas cadenas laterales colocadas cerca del sitio de unión tienden a rechazar las moléculas de agua; también es desfavorable que una molécula de agua se disocie de la red de puentes de hidrógeno con la que está interconectada con otras moléculas de agua para reaccionar con una cadena lateral de aminoácidos del sitio de unión. El ligando puede ser atraído por medio de algunos recursos, como la agrupación en sitios específicos de aminoácidos cargados, que por lo tanto pueden atraer más fácilmente ligandos de carga opuesta y al mismo tiempo repeler aquellos con la misma carga. Las posibles interfaces entre una proteína y su ligando son muchas, siendo las más comunes la superficie (sitio de unión)-cadena (ligando), o hélice-hélice (común en las proteínas reguladoras de genes), o, más comúnmente, interacciones. -superficial (como ocurre en muchas enzimas). La fuerza de unión de una proteína a su ligando en equilibrio, es decir, en el estado en el que las asociaciones y disociaciones entre la proteína y el ligando son iguales en número, se mide por medio de la constante de equilibrio.
La tasa de disociación se calcula utilizando la fórmula: tasa de asociación = koff [ AB] donde [AB] es la concentración del complejo proteico en moles y koff es la constante de disociación.
La tasa de asociación se calcula mediante la fórmula: tasa de disociación = k on [A] [B], donde [A] y [B] son las dos moléculas y k on es la constante de asociación.
Igualando las dos velocidades obtenemos la constante de equilibrio (también llamada afinidad) K a = [AB] / [A] [B].
Cuanto mayor sea la constante de equilibrio, mayor será la fuerza de enlace, y es una medida directa de la diferencia de energía libre entre el estado enlazado y disociado de la proteína. Un modelo utilizado para determinar el grado de afinidad de un ligando por una proteína se basa en la ecuación de Scatchard .
Muchas proteínas unen moléculas pequeñas particulares y las transportan a otras áreas de un organismo multicelular. Estas proteínas poseen una alta afinidad de unión cuando su ligando está presente en altas concentraciones, pero también deben poder liberarlo cuando está presente en bajas concentraciones en los tejidos diana. El ejemplo clásico de proteína-ligando es la hemoglobina , que transporta oxígeno desde los pulmones a otros órganos en todos los vertebrados y tiene homólogos cercanos en todos los reinos biológicos. [24] Las lectinas son proteínas altamente específicas para ciertos azúcares . Desempeñan un papel biológico importante en el proceso de reconocimiento de los polisacáridos presentes en las membranas celulares. [25] Los receptores y las hormonas son proteínas de unión altamente específicas.
Las proteínas transmembrana también pueden servir como proteínas transportadoras de ligandos al alterar la permeabilidad de la membrana celular para moléculas pequeñas e iones. La membrana sola tiene un centro hidrofóbico a través del cual las moléculas polares o cargadas no pueden difundirse. Las proteínas de membrana contienen canales internos que permiten que estas moléculas entren y salgan de la célula. Muchos canales iónicos de proteínas están especializados para seleccionar solo un ion particular; por ejemplo, los canales de potasio y los canales de sodio a menudo seleccionan solo uno de los dos iones. [26]
Las proteínas estructurales imparten rigidez a los componentes biológicos que, de otro modo, serían fluidos. La mayoría de las proteínas estructurales son proteínas fibrosas; por ejemplo, el colágeno y la elastina son componentes fundamentales de los tejidos conectivos como el cartílago mientras que la queratina se encuentra en estructuras rígidas o filamentosas, como el pelo , las uñas , las plumas , las pezuñas y algunas conchas . [27] Algunas proteínas globulares también pueden realizar una función estructural, por ejemplo, la actina y la tubulina son globulares y solubles como monómeros, pero son capaces de polimerizarse para formar fibras largas y rígidas que forman el citoesqueleto , la estructura que permite la célula para mantener su forma y tamaño.
Otras proteínas que realizan funciones estructurales son las proteínas motoras como la miosina , la cinesina y la dineína , que son capaces de generar fuerzas mecánicas. Estas proteínas son fundamentales para la motilidad celular de los organismos unicelulares y para el esperma de muchos organismos multicelulares que se reproducen sexualmente . También permiten la contracción muscular [28] y juegan un papel esencial en el transporte intracelular.
Las actividades y estructuras de las proteínas se pueden examinar in vitro , in vivo e in silico . Los estudios in vitro sobre proteínas purificadas en entornos controlados son útiles para comprender cómo una proteína realiza su función: por ejemplo, los estudios de cinética enzimática exploran el mecanismo químico de la acción catalítica de una enzima y sus afinidades con posibles moléculas de sustrato. Por el contrario, los experimentos in vivo pueden proporcionar información sobre el papel fisiológico de una proteína en el contexto de una célula o de un organismo completo. Los estudios in silico utilizan métodos computacionales para estudiarlos.
Para realizar el análisis in vitro , se debe purificar una proteína, es decir, aislarla de otros componentes celulares. Este proceso generalmente comienza con la lisis celular , en la cual la membrana de una célula se rompe y su contenido interno se libera en una solución conocida como lisado crudo . La mezcla resultante se puede purificar por ultracentrifugación , que fracciona los diversos componentes celulares en partes que contienen proteínas solubles; lípidos y proteínas de membrana; orgánulos celulares y ácidos nucleicos. El fenómeno de la precipitación , por un método conocido como salting out , permite concentrar las proteínas de este lisado. A continuación, se utilizan varios tipos de técnicas cromatográficas para aislar la proteína o las proteínas de interés en función de propiedades como el peso molecular , la carga neta y la afinidad de unión. [29] El nivel de purificación se puede monitorear utilizando varios tipos de geles de poliacrilamida si se conocen el peso molecular y el punto isoeléctrico de la proteína deseada, mediante espectroscopia si la proteína tiene características espectroscópicas distinguibles o mediante ensayos enzimáticos si la proteína tiene actividad enzimática. . Además, las proteínas se pueden aislar según su carga gracias al enfoque isoeléctrico . [30]
En cuanto a las proteínas naturales, puede ser necesaria una serie de pasos de purificación para obtener proteínas lo suficientemente puras para aplicaciones de laboratorio. Para simplificar este proceso, la ingeniería genética se usa a menudo para agregar características químicas a las proteínas que las hacen fáciles de aislar sin comprometer su estructura o actividad. Funciona insertando una " etiqueta " que consta de una secuencia específica de aminoácidos, a menudo una serie de residuos de histidina (una " etiqueta His "), que se insertan en una terminal de la proteína. Como resultado, cuando el lisado pasa por una columna cromatográfica que contiene níquel , los residuos de histidina se unen al níquel y se agregan a la columna, mientras que los componentes no marcados pasan sin obstáculos. Se han desarrollado varias etiquetas diferentes para ayudar a los investigadores a aislar proteínas específicas de mezclas complejas. [31]
El estudio de proteínas in vivo a menudo se refiere a su síntesis y localización dentro de la célula. Aunque muchas proteínas intracelulares se sintetizan en el citoplasma mientras que las proteínas de membrana se secretan en el retículo endoplásmico , a menudo no está claro cómo las proteínas se dirigen a orgánulos o estructuras celulares específicos. Una técnica útil para evaluar la localización celular utiliza la ingeniería genética para expresar una proteína de fusión o quimera en una célula, que consta de la proteína natural de interés unida a un " gen informador ", como la proteína verde fluorescente (GFP). [32] La posición de la proteína fusionada dentro de la célula se puede aislar y observar con eficacia con un microscopio [33] , como se muestra en la figura opuesta.
Otros métodos para dilucidar la localización celular de proteínas requieren el uso de marcadores de compartimentos conocidos como el retículo endoplásmico , aparato de Golgi , lisosomas o vacuolas , mitocondrias , cloroplastos , membrana plasmática , etc. Con el uso de versiones fluorescentes de estos marcadores o mediante marcadores de anticuerpos conocidos, resulta mucho más fácil identificar la localización de una proteína de interés. Por ejemplo, la inmunofluorescencia indirecta permitirá demostrar la ubicación. Los tintes fluorescentes se utilizan para etiquetar los compartimentos celulares con un propósito similar. [34]
Hay más posibilidades. Por ejemplo, la inmunohistoquímica generalmente usa un anticuerpo para una o más proteínas de interés que se conjugan con enzimas que producen señales luminiscentes y cromogénicas y que luego se pueden comparar entre muestras, lo que permite obtener información de localización. Otra técnica aplicable es la comparación en el gradiente de sacarosa (u otro material) por centrifugación isopícnica . [35] Esta técnica se utiliza principalmente para estudios a gran escala.
Finalmente, el método considerado el estándar de oro para la localización celular es el uso del microscopio electrónico . Esta técnica también utiliza un anticuerpo contra la proteína de interés, con técnicas clásicas de microscopía electrónica. La muestra se prepara para un examen microscópico electrónico normal y luego se trata con un anticuerpo contra la proteína de interés que se conjuga con un material extremadamente electrodenso, generalmente oro. Esto permite tanto la localización de los detalles ultraestructurales como la proteína de interés. [36]
A través de otra aplicación de la ingeniería genética, conocida como mutagénesis específica del sitio , los investigadores pueden alterar la secuencia de la proteína y, por lo tanto, su estructura, ubicación celular y susceptibilidad a la regulación. Esta técnica también permite la incorporación de aminoácidos no naturales en las proteínas, utilizando ARNt modificados [37] y puede permitir el diseño de nuevas proteínas con propiedades novedosas. [38]
El conjunto de todas las proteínas en una célula o tipo de célula se llama proteoma , y el estudio de estos conjuntos de datos a gran escala se identifica como el campo de la proteómica , análogo al nombre del campo de la genómica . Las técnicas experimentales clave de proteómica incluyen la electroforesis bidimensional , [39] que permite la separación de un gran número de proteínas, la espectrometría de masas , [40] que permite la identificación rápida y de alto rendimiento de proteínas y la secuenciación de péptidos, la técnica de micromatrices para proteínas , [41] que permite la determinación de los niveles relativos de un gran número de proteínas presentes en una célula y el cribado del doble híbrido que permite el análisis sistemático de las interacciones proteína-proteína. [42] El complemento completo de tales interacciones biológicamente posibles se conoce como interactoma . [43] Un intento sistemático de determinar las estructuras de las proteínas que representan todos los pliegues posibles se conoce como genómica estructural . [44]
Se ha desarrollado una amplia gama de métodos computacionales para analizar la estructura, función y evolución de las proteínas.
El desarrollo de tales herramientas ha sido impulsado por la gran cantidad de datos genómicos y proteómicos disponibles para una variedad de organismos, incluido el genoma humano . Es simplemente imposible estudiar todas las proteínas de forma experimental, por lo que solo unas pocas se someten a experimentos de laboratorio, mientras que las herramientas informáticas se utilizan para extrapolar datos de proteínas similares. Dichas proteínas homólogas pueden identificarse eficazmente en organismos relacionados de forma lejana a partir del alineamiento de secuencias. El genoma y la secuencia genética se pueden determinar gracias a una gran variedad de herramientas y explotando algunas propiedades. Las herramientas de perfilado de secuencias pueden encontrar sitios de enzimas de restricción , abrir marcos de lectura en secuencias de nucleótidos y predecir estructuras secundarias. Se pueden construir árboles filogenéticos y desarrollar hipótesis evolutivas utilizando un software especial, como ClustalW, con respecto a la ascendencia de los organismos modernos y los genes que expresan. El campo de la bioinformática es ahora indispensable para el análisis de genes y proteínas.
Predicción y simulación de estructurasComo complemento al campo de la genómica estructural, la predicción de la estructura de proteínas tiene como objetivo desarrollar formas eficaces de proporcionar modelos plausibles para proteínas cuya estructura aún no se ha determinado experimentalmente. [45] La forma más efectiva de predecir una estructura, conocida como modelado homólogo, se basa en la existencia de una estructura "modelo" con similitud de secuencia con la proteína a identificar; El objetivo de la genómica estructural es proporcionar una representación suficiente de las estructuras resueltas para modelar la mayoría de las que no lo fueron. [46] Aunque la producción de modelos precisos sigue siendo un desafío cuando solo se dispone de estructuras de modelos correlacionadas, se ha sugerido que el alineamiento de secuencias es el " cuello de botella " de este proceso; de hecho, se podrían realizar modelos muy precisos si se lograra un alineamiento de secuencias "perfecto". conocido. [47] Muchos métodos de predicción de estructuras han servido para informar el campo emergente de la ingeniería de proteínas, donde ya se han explorado los pliegues de la nueva proteína. [48] Un problema computacional más complejo es la predicción de interacciones intermoleculares, como en el acoplamiento molecular y la predicción de interacciones proteína-proteína. [49]
Los procesos de plegamiento de proteínas y las interacciones se pueden simular utilizando técnicas de mecánica molecular , en particular, la dinámica molecular y el método de Monte Carlo , que hacen un uso cada vez mayor de la computación paralela y distribuida ( proyecto Folding @ home ; [50] modelado molecular en GPU ). El plegamiento de pequeños dominios de proteínas de hélice alfa, como la cabeza de villina [51] y la proteína accesoria del VIH [52] , se ha simulado con éxito por computadora, y los métodos híbridos que combinan la dinámica molecular estándar con cálculos mecánicos cuánticos han permitido el estudio de la Estados electrónicos de la rodopsina . [53]
Proteínas desordenadasMuchas proteínas (entre el 20 y el 40% de muchos proteomas) contienen grandes segmentos estructurados biológicamente funcionales y pueden clasificarse como proteínas intrínsecamente desordenadas . Predecir el desorden de una proteína es, por tanto, una parte cada vez más importante de la caracterización de su estructura.
La proteína es necesaria en la dieta de los animales, ya que los animales no pueden sintetizar todos los aminoácidos que necesitan y deben obtener algunos de ellos (los llamados aminoácidos esenciales ) de los alimentos. A través del proceso de digestión , los animales descomponen las proteínas ingeridas en aminoácidos libres, que posteriormente se utilizan en la creación de nuevas proteínas estructurales, enzimas, hormonas o como fuentes de energía a través de la gluconeogénesis .
Las proteínas se pueden purificar separándolas de otros componentes celulares utilizando diferentes técnicas, que incluyen ultracentrifugación , precipitación , electroforesis y cromatografía ; el advenimiento de la ingeniería genética ha hecho posibles muchos métodos que facilitan la purificación de proteínas. Los métodos comúnmente utilizados para estudiar la estructura y la función de las proteínas incluyen la inmunohistoquímica , la mutagénesis específica del sitio , la resonancia magnética nuclear y la espectrometría de masas .
La mayoría de los microorganismos y las plantas pueden sintetizar los 20 aminoácidos estándar , mientras que los animales (incluidos los humanos) deben obtener algunos de ellos de su dieta . [54] Los aminoácidos que el cuerpo no puede sintetizar se denominan " aminoácidos esenciales ". [55] Algunas enzimas clave que sintetizan algunos aminoicidas no están presentes en animales, incluida la aspartato quinasa , que cataliza el primer paso en la síntesis de lisina , metionina y treonina a partir de aspartato . Si los aminoácidos están presentes en el ambiente, los microorganismos pueden ahorrar energía tomándolos del ambiente circundante y limitando sus propias rutas biosintéticas.
En los animales, los aminoácidos se obtienen al consumir alimentos que contienen proteínas. Las proteínas ingeridas se descomponen en aminoácidos mediante la digestión , [55] que generalmente implica la desnaturalización de las proteínas en el ambiente ácido del estómago y la hidrólisis por enzimas llamadas proteasas . Algunos aminoácidos ingeridos se utilizan en la biosíntesis de proteínas, mientras que otros se convierten en glucosa a través de la gluconeogénesis o se vuelven parte del ciclo del ácido cítrico . Este uso de proteínas como fuente de energía es particularmente importante en condiciones de inanición , ya que también permite el uso de proteínas corporales, en particular las presentes en los músculos, como sustrato para mantener la vida. [56]
Los dos principales índices nutricionales de los alimentos que contienen proteínas son:
Las proteínas han sido reconocidas como una clase distinta de moléculas biológicas desde el siglo XVIII gracias a los estudios realizados por Antoine Fourcroy y otros, basados en la capacidad de estas sustancias para coagular o flocular bajo tratamiento térmico o ácido . [57] En esta época, algunos ejemplos famosos incluyen clara de huevo , albúmina sanguínea , fibrina y gluten de trigo .
Las proteínas fueron descritas por el químico holandés Gerardus Johannes Mulder y recibieron su nombre del químico sueco Jöns Jacob Berzelius en 1838. [58] [59] Mulder llevó a cabo análisis elementales sobre proteínas comunes y descubrió que casi todas tenían la misma fórmula empírica . C 400 H 620 N 100 O 120 P 1 S 1 . [60] Llegó a la conclusión errónea de que estaban compuestos de un solo tipo de molécula, pero muy grande. El término "proteína" para describir estas moléculas fue propuesto por Berzelius, colega de Mulder; el término deriva de la palabra griega ( proteios , πρώτειος ), que significa "primario", [61] "en la cabeza" o "de pie al frente", [62] Mulder siguió identificando los productos de descomposición de las proteínas, como el aminoácido leucina del que calculó un peso molecular casi correcto de 131 Da . [60]
Los primeros científicos nutricionales, como el alemán Carl von Voit , creían que la proteína era el nutriente más importante para mantener la estructura del cuerpo, ya que se pensaba que "la carne hace carne". [63] Karl Heinrich Ritthausen amplió las formas proteicas conocidas con el descubrimiento del ácido glutámico . El científico Thomas Osborne Burr realizó un examen detallado de las proteínas vegetales en la Estación Experimental Agrícola de Connecticut . Trabajando con Lafayette Mendel y aplicando la ley del mínimo a la alimentación de ratas de laboratorio, se logró establecer cuáles eran los aminoácidos esenciales . El estudio fue continuado por William Cumming Rose . Fue gracias al trabajo de Franz Hofmeister y Hermann Emil Fischer que las proteínas se identificaron como polipéptidos. El papel central de las proteínas como enzimas en los organismos vivos no se aceptó por completo hasta 1926, cuando James Batcheller Sumner demostró que la ureasa era en realidad una proteína. [64]
La dificultad de aislar proteínas en grandes cantidades hizo que el estudio de las proteínas fuera muy difícil para los primeros bioquímicos. Así, los primeros experimentos se centraron en aquellos que podían purificarse con mayor facilidad, como los de la sangre, la clara de huevo, diversas toxinas y enzimas metabólicas/digestivas obtenidas en los mataderos . En 1950, Armor and Company purificó 1 kg de ribonucleasa A de páncreas bovino y la puso a disposición de los científicos de forma gratuita; esto convirtió a la ribonucleasa A en una herramienta importante para el estudio de la bioquímica durante las décadas siguientes. [60]
Linus Pauling es reconocido por predecir las estructuras de proteínas secundarias regulares basadas en enlaces de hidrógeno , una idea que ya había sido propuesta por William Astbury en 1933. [65] El trabajo posterior de Walter Kauzmann sobre desnaturalización, [66] [67] basado en parte en estudios anteriores de Kaj Linderstrøm-Lang , [68] contribuyó a la comprensión del plegamiento y la estructura de proteínas mediada por interacciones hidrofóbicas.
La primera proteína secuenciada fue la insulina en 1949, gracias al trabajo de Frederick Sanger . Sanger determinó correctamente la secuencia de aminoácidos de la insulina y, por lo tanto, demostró de manera concluyente que las proteínas están formadas por polímeros lineales de aminoácidos en lugar de cadenas ramificadas o coloides . [69] Este descubrimiento le valió el Premio Nobel en 1958.
Las primeras estructuras proteicas resueltas fueron las de la hemoglobina y la mioglobina , respectivamente gracias a Max Perutz y Sir John Cowdery Kendrew , en 1958. [70] [71] A partir de 2014, el Protein Data Bank cuenta con más de 90.000 estructuras proteicas a nivel atómico. [72] En tiempos más recientes, la criomicroscopía electrónica de grandes conjuntos macromoleculares [73] y la predicción computacional de estructuras proteicas de pequeños dominios proteicos [74] son dos enfoques para la resolución atómica.