Motivos, estructura
y función
Prof. Inma Ponte
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Objetivos
•Análisis de la secuencia de aa de una proteína
•alineamiento con proteínas homólogas
•búsqueda de zonas conservadas
•Predecir la presencia de estructuras secundarias
•Analizar la presencia de motivos
© Copyright Ebiointel,SL 2006
Motivos y estructuras: estructura secundaria
Posibles estructuras secundarias
• Hélice
alfa
•Random
coil
• Hoja beta
• Giro beta
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
CHOU-FASMAN
• Método estadístico basado en estructuras cristalográficas ya resueltas
• Calcula un parámetro conformacional para cada residuo de la proteína
• Este parámetro refleja la preferencia de este residuo en hallarse en un
tipo de estructura determinado
• Inicialmente se basaron en 15 proteínas, después en 24 y finalmente en
64
• Cuatro grupos de proteínas: alfa, beta, alfa+beta, alfa/beta
Limitaciones: no se puede usar con proteínas muy distintas
a las 64 proteínas con la estructura conocida en que se
basa este método
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
DELEAGE&ROUX
-Método estadístico basado en tres pasos:
predicción de la clase de proteína (según comp. Aa)
predicción de la estructura secundaria (frecuencia de cada
residuo) nueva predicción optimizando parámetros
Limitaciones:si la predicción de la clase de proteína es
correcto, la predicción de estructura secundaria es más
acertada que en los otros métodos. Si la proteína no
queda bien clasificada, la predicción no es fiable.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
GARNIER-ROBSON
-Método estadístico basado en estructuras cristalográficas ya
resueltas (25)
-No sólo tiene encuenta la preferencia de un aa por una
estructura, sino que además considera el entorno de este aa
(ventana de 16 aa)
-Fundamentalmente se basa en los ángulos f y y del enlace
peptídico y en los puentes de hidrógeno de las estructuras
secundarias.
Limitaciones:la proteína problema no debe diferir
substancialmente de las 25 proteínas de estructura
conocida.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
Perfiles de hidroafinidad (hidrofobicidad/hidrofilicidad)
-Eisemberg moment
-Kyte-Doolitte
Perfiles de flexibilidad. (flexibilidad de la cadena peptídica)
-Karplus flexibility
Perfiles de probabilidad de encontrase en la superfície de la
proteína
-Emini surface probability
Perfiles de densidad de carga
-Charge density
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
Perfiles de hidroafinidad (hidrofobicidad/hidrofilicidad)
-Eisemberg moment
-Kyte-Doolitte
Perfiles de flexibilidad. (flexibilidad de la cadena peptídica)
-Karplus flexibility
Perfiles de probabilidad de encontrase en la superfície de la
proteína
-Emini surface probability
Perfiles de densidad de carga
-Charge density
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
•http://cubic.bioc.columbia.edu/predictprotein/
http://us.expasy.org
•http://bmerc-www.bu.edu/
http://npsa-pbil.ibcp.fr/
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
GOR – METHOD (Garnier, Ousguthorpe and Robson)
• Se basa en la consideración de que la estructura que
adoptan los aa que flanquean un determinado aa central
determinan la estructura que adapta este aa central.
• El método estudia los 8 aa N-terminales y los 8 aa Cterminal. Establece tres o cuatro (GOR III /GOR IV) matrices:
una cuando el aa central es alfa, otra para beta, otro para
random, y otra turn.
•Usa información teórica para la decisión final.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
Neural Networks Models
Estos métodos contemplan tres niveles:
•El primer nivel: la preedición se realiza sobre alineamientos
múltiples
• El segundo nivel: se consideran los elementos de estructura
secundaria en las proteínas homologa
•El tercer nivel: promediar las predicciones obtenidas
independientemente.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
PSA – METHOD (Protein Sequence Analysis)
•Este método predice la estructura secundaria de
proteínas sin homología de secuencia y sin homología
de estructura.
•Se basa en 15 modelos matemáticos. Se han
establecido tres o cuatro superclases. Los modelos
matemáticos establecen las restricciones de cada tipo
de estructura alfa, beta, etc.. en cada superclase.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
© Copyright Ebiointel,SL 2006
Motivos y estructuras: métodos de predicción
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Dominio/motivo/patron
•Muchas proteínas tienen estructura «modular»
•Estimación: ~ 3 dominios / proteína
•Dominios (secuencias o estructuras conservadas)
identificadas por alineamiento múltiple de secuencia
Métodos para definir dominios
• Patrones (expresión regular); usado en dominios muy conservados
•Perfiles (matrices de pesos): tablas de dos dimensiones
por posición específicos para match-, gap-, y insertion,
derivados del alineamiento
de secuencia de la familia, usado para dominios menos
conservados
•Hidden Markov Model (HMM); modelo probabilístico.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Bancos de datos de motivos/familia
PROSITE
ProDom
PRINTS
Pfam
SMART
TIGRfam
Patrones / Perfiles
Alineado de motivos (PSI-BLAST) (Pfam B)
Alineado de motivos
HMM (Hidden Markov Models)
HMM
HMM
DOMO
BLOCKS
CDD(CDART)
Alineado de motivos
Alineado de motivos (PSI-BLAST)
PSI-BLAST(PSSM) de Pfam y SMART
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
•consiste en patrones y perfiles significativos biológicamente
•ayudar a determinar a que familia de proteínas pertenece la secuencia.
http://us.expasy.org/prosite/
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Generar Patrón Prosite
• G-H-E-x(2)-G-x(5)-[GA]-x(3)
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Ejemplo Patrón Prosite
<A-x-[ST](2)-x(3,5)-{V}
•< N-terminal
•x cualquier aa
•[ST] serina o treonina dos veces
•x(3,5) cualquier aa de 3 a 5 veces
•{V} cualquier aa excepto valina
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Patrón Prosite
•Http://www.expasy.org/prosite/
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Patrón Prosite
. Ventajas:
. Rápido y fácil de implementar.
. Los modelos son fáciles de comprender.
. Limitaciones:
. Pobre tratamiento de las inserciones/delecciones.
. Cuando los patrones son pequeños da muchos falsos
positivos.
. Los patrones largos son difíciles de ajustar al modelo.
. No nos proporciona un score, está o no está.
. ¿Cuándo usar los patrones?
. Para usar motivos pequeños o centros activos.
. Para describir un motivo de forma sencilla.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Perfil Prosite
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Perfil Prosite
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Perfil Prosite
© Copyright Ebiointel,SL 2006
Motivos y estructuras: busqueda de motivos
Perfil Prosite
. V entajas:
. P odem os especificar cuando ocur r en inser ciones o
delecciones.
. N os pr opor ciona un scor e.
. Se puede constr uir autom áticam ente.
. L im itaciones:
. M uy car o en tiem po de C P U .
. E l softw ar e es m ás sofisticado.
. L a lectur a del patr ón no es intuitiva.
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
InterPro
InterPro integra:
•
•
•
•
•
Pfam
PROSITE
ProDom
SMART
TIGRFAMs
www.ebi.ac.uk/interpro
© Copyright Ebiointel,SL 2006
Motivos y estructuras: Interpro
InterPro
www.ebi.ac.uk/interpro
© Copyright Ebiointel,SL 2006
Ejercicio 1
Determinar la predicción de estructura secundaria de
las siguientes proteínas. Utilizar diferentes métodos y
decidir que tipo de estructura es el mayoritario.
Que proteasa utilitarias para aislar el C-terminal
(aprox 100 últimos aa) de la histona H10. Te serviría
esta misma proteasa para los otros subtipos
El C-terminal de esta proteína tiene putativos sitios
de fosforilacions para la CK2 y para la PKC.
© Copyright Ebiointel,SL 2006
Secuencias:
H10,
TENSTSAPAAKPKRAKASKKSTDHPKYSDMIVAAIQAEKNRAGSSRQSIQK
YIKSHYKVGENADSQIKLSIKRLVTTGVLKQTKGVGASGSFRLAKSDEPKKS
VAFKKTKKEIKKVATPKKASKPKKAASKAPTKKPKATPVKKAKKKLAATPKK
AKKPKTVKAKPVKASKPKKAKPVKPKAKSSAKRAGKKK
H12
SETAPAAPAAAPPAEKAPVKKKAAKKAGGTPRKASGPPVSELITKAVAASK
ERSGVSLAALKKALAAAGYDVEKNNSRIKLGLKSLVSKGTLVQTKGTGASG
SFKLNKKAASGEAKPKVKKAGGTKPKKPVGAAKKPKKAAGGATPKKSAKK
TPKKAKKPAAATVTKKVAKSPKKAKVAKPKKAAKSAAKAVKPKAAKPKVVK
PKKAAPKKK
H13
SETAPLAPTIPAPAEKTPVKKKAKKAGATAGKRKASGPPVSELITKAVAASK
ERSGVSLAALKKALAAAGYDVEKNNSRIKLGLKSLVSKGTLVQTKGTGASG
SFKLNKKAASGEGKPKAKKAGAAKPRKPAGAAKKPKKVAGAATPKKSIKKT
PKKVKKPATAAGTKKVAKSAKKVKTPQPKKAAKSPAKAKAPKPKAAKPKSG
KPKVTKAKKAAPKKK
© Copyright Ebiointel,SL 2006
Ejercicio 2
Para una proteína dada (ejemplo TDF humana):
• ¿Cómo saber si contiene dominios
funcionales?
•¿Qué otras proteínas contienen ese mismo
dominio funcional?
© Copyright Ebiointel,SL 2006
Ejercico 3:
Has realizado un protocoloo de purificaciónn de
la prothymosin alfa humana (Q15200). En lugar
de obtener una sola proteína, obtienes tres, con
las siguientes características:
proteína 1 Mr: 16000 pI: 7
proteína 2 Mr: 12000 pI: 3.7
proteina 3 Mr: 11000 pI: 6
Cual de ellas es la correcta,
Que estrategia puedes utilizar para comprobar
que realmente esta es tu proteína.
© Copyright Ebiointel,SL 2006
•Ejercicio 4:
El domino globular de la histona H5 (1Hst) se ha
resuelto por cristalografía.
Quieres estudiar la estabilidad de la primera hélice
alfa.
Que aproximación puedes seguir.
© Copyright Ebiointel,SL 2006
•Ejercicio 5: Construir un Patrón
© Copyright Ebiointel,SL 2006
Descargar

Ejercicio 1 Determinar la predicción de estructura secundaria de las