Unidad 3_Alineamiento II.pdf aplicados a la ingeniería de proteínas

BlancaDeLosReyes5 0 views 102 slides Sep 28, 2025
Slide 1
Slide 1 of 102
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55
Slide 56
56
Slide 57
57
Slide 58
58
Slide 59
59
Slide 60
60
Slide 61
61
Slide 62
62
Slide 63
63
Slide 64
64
Slide 65
65
Slide 66
66
Slide 67
67
Slide 68
68
Slide 69
69
Slide 70
70
Slide 71
71
Slide 72
72
Slide 73
73
Slide 74
74
Slide 75
75
Slide 76
76
Slide 77
77
Slide 78
78
Slide 79
79
Slide 80
80
Slide 81
81
Slide 82
82
Slide 83
83
Slide 84
84
Slide 85
85
Slide 86
86
Slide 87
87
Slide 88
88
Slide 89
89
Slide 90
90
Slide 91
91
Slide 92
92
Slide 93
93
Slide 94
94
Slide 95
95
Slide 96
96
Slide 97
97
Slide 98
98
Slide 99
99
Slide 100
100
Slide 101
101
Slide 102
102

About This Presentation

alineamiento multiple de secuencias


Slide Content

Unidad 3: Alineamiento de secuencias II
Bloque I
Bioquímica e ingeniería de proteínas
Bloque I

Introducción
! Multiple Sequence Alignment (MSA)
! Hemos visto cómo comparar una secuencia con otra
(alineamiento de pares)
! Hemos visto cómo comparar una secuencia con muchas
otras en una BD (muchos alineamientos de pares - BLAST)
! Ahora veremos cómo comparar múltiples secuencias
simultáneamente, no de dos en dos.
3
Bloque I: Alineamiento de secuencia II

Tipos de alineamientos en función de número de
secuencias a comparar
1.- Alineamiento de dos secuencias
2.- Alineamiento múltiple de secuencias (AMS)
Tipos de alineamiento
Bloque I: Alineamiento de secuencia II

Los aa importantes para el mantenimiento de la estructura y/o función de la
proteína se encuentran bajo presión evolutiva: o se conservan o, si cambian,
lo hacen por aa parecidos. Un alineamiento múltiple de secuencias (AMS) de
proteínas homólogas permite identificar estos aa.
Si dos secuencias están muy próximas en
la evolución, habrán cambiado muy poco y
será difícil detectar qué aa son los
realmente importantes
Alineamiento de dos secuencias
Bloque I: Alineamiento de secuenciasBloque I: Alineamiento de secuencia II

Los aa importantes para el mantenimiento de la estructura y/o función de la
proteína se encuentran bajo presión evolutiva: o se conservan o, si cambian,
lo hacen por aa parecidos. Un alineamiento múltiple de secuencias (AMS) de
proteínas homólogas permite identificar estos aa.
Si dos secuencias están muy próximas en
la evolución, habrán cambiado muy poco y
será difícil detectar qué aa son los
realmente importantes
Si dos secuencias
están muy lejanas
será difícil hacer un
alineamiento capaz de
detectar los residuos
importantes.
Alineamiento de dos secuencias

Los aa importantes para el mantenimiento de la estructura y/o función de la
proteína se encuentran bajo presión evolutiva: o se conservan o, si cambian,
lo hacen por aa parecidos. Un alineamiento múltiple de secuencias (AMS) de
proteínas homólogas permite identificar estos aa.
Si dos secuencias están muy próximas en
la evolución, habrán cambiado muy poco y
será difícil detectar qué aa son los
realmente importantes
Si dos secuencias
están muy lejanas
será difícil hacer
un alineamiento
capaz de detectar
los residuos
importantes.
Este problema se
puede resolver
alineando el mayor
número posible de
secuencias
homólogas.
Alineamiento de dos secuencias
Bloque I: Alineamiento de secuenciasBloque I: Alineamiento de secuencia II

Bloque I: Alineamiento de secuenciasBloque I: Alineamiento de secuencia II
Alineamiento múltiple secuencias (AMS)

La fortaleza de los AMS
El AMS permite identificar los residuos conservados que
resultan cruciales para mantener la estructura y/o función.
Bloque I: Alineamiento de secuencia II
Mo#vo DFG

MSA
Bloque I: Alineamiento de secuencia II
El AMS permite identificar homologías.

Análisis de secuencias (alineamiento múltiple)
Cuanto más similares sean dos secuencias, más similares tenderán a ser
también las funciones de las proteínas. Identidades, cambios conservativos/
cambios no conservativos
Normalmente dos secuencias tienen una alta similitud porque son homólogas,
es decir comparten un ancestro común. Cuanto más tiempo pase desde el
último antecesor común más diferentes serán las secuencias
La acumulación de mutaciones a lo largo del tiempo es la causa de que las
secuencias de una misma proteína en dos especies distintas no sean idénticas.
Utilidad de los alineamientos múltiples. Pueden servir para varias cosas,
entre las que a nosotros nos puede interesar:
Identificar dominios funcionales.
Identificar sitios potencialmente mutables para mejorar
Los aa conservados van a ser más importante para el
mantenimiento de la estructura/función de una proteína
Bloque I: Alineamiento de secuencia II

AMS: a tener en cuenta1
2
3
4
5
Bloque I: Alineamiento de secuencia II

Distintos grados de conservaciónAlineamiento AMS
Bloque I:Alineamiento de secuencias
Aminoácidosidénticos
Sustitucionesconservadoras
Sustituciones noconservadoras
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote
HumanoCachalote84%identidad94%incluyendocambiosconservadores
Comparacióndelassecuenciasdeaminoácidosdelasmioglobinashumanaydecachalote
Comparación de secuencias de proteínas
→ cambios su5les
→ cambios estructurales y/o funcionales
Mismatch
Bloque I: Alineamiento de secuencia II
Puntuación del
0 al 9

1. Siempre que puedas, u0liza proteínas.
2. Empieza con un número pequeño de secuencias (5-10), y luego
añadir de forma progresiva.
3. No puedo alinear secuencias muy diferentes, por lo que
descartamos aquellas que coincidan menos del 30%. Una buena idea
es que la secuencia tenga un parecido entre el 30 y 70% con, al menos,
la mitad de las secuencias con las que quiero trabajar.
4. No es bueno u<lizar secuencias con longitudes muy dis<ntas,
porque la herramienta 0ende a expandir las secuencias y va a meter
huecos por todas partes.
5. Las secuencias proceden de proteínas homologas.
¿Qué pautas sigo para seleccionar las secuencias a incluir en un AMS?
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Pasos básicos
! Para hacer un alineamiento, generalmente necesitamos
seleccionar:
1. Las secuencias homólogas a alinear
2. El software que utilice una función de puntuación óptima
3. Los parámetros adecuados (fundamentalmente huecos)
! No hay un alineamiento perfecto
! Las secuencias evolucionan más rápido que las estructuras o
funcionalidades (la secuencia puede variar y la estructura o
función seguir invariante)
6
Pasos básicos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Algoritmos
! Existen cinco aproximaciones algorítmicas distintas al MSA
1. Métodos exactos
2. Alineamiento progresivo
3. Aproximaciones iterativas
4. Métodos basados en la consistencia
5. Métodos basados en la estructura
! Las aproximaciones no son excluyentes
! Las tres últimas, por ejemplo, utilizan alineamiento progresivo
9
Algoritmos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

DIALIGN
AMS globales
PROBCONSMétodos
probabilísticos
1. Métodos exactos
(basados en la PD)
CLUSTAL OMEGA
T-COFFEE
MUSCLE
PRALINE
Métodos
progresivos
Métodos híbridos
2. Métodos
heurísticos
MAFFT
Métodos
iterativos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II
TOOLS

1. Métodos exactos
- Para alinear dos secuencias de 300 aa, el algoritmo de programación
dinámica u?liza una matriz bidimensional, por lo que el número
de operaciones que hay que hacer es de 3002.
- Para N secuencias se u?liza una matriz N-dimensional, con 300N
operaciones. Debido a esto, necesita una gran can?dad de
recursos computacionales y mucho ?empo. En la prác?ca apenas se
u?liza, solo si N = 3 o si las secuencias son cortas, 6 < N < 8.
Solo recomendado para número pequeño de secuencias
(7-10) cuya longitud no sea muy grande (200-300 aa)
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II
GATACTA----A
G--AT--TACCA

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos, ejemplo
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

1. Métodos exactos
- Para alinear dos secuencias de 300 aa, el algoritmo de programación
dinámica u?liza una matriz bidimensional, por lo que el número
de operaciones que hay que hacer es de 3002.
- Para N secuencias se u?liza una matriz N-dimensional, con 300N
operaciones. Debido a esto, necesita una gran can?dad de
recursos computacionales y mucho ?empo. En la prác?ca apenas se
u?liza, solo si N = 3 o si las secuencias son cortas, 6 < N < 8.
Solo recomendado para número pequeño de secuencias
(7-10) cuya longitud no sea muy grande (200-300 aa)
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

DIALIGN
AMS globales
PROBCONSMétodos
probabilísticos
1. Métodos exactos
(basados en la PD)
CLUSTAL OMEGA
T-COFFEE
MUSCLE
PRALINE
Métodos
progresivos
Métodos híbridos
2. Métodos
heurísticos
MAFFT
Métodos
iterativos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II
TOOLS

Tipos de métodos de alineamiento múltiple de secuencias
Se puede usar la programación dinámica para alinear cualquier número de
secuencias, sin embargo el tiempo de cálculo y la memoria requerida
aumenta exponencialmente. En la práctica los enfoques heurísticos son
los más utilizados.
Existen tres tipos de algoritmos heurísticos:
Alineamiento progresivo (ClustalW/Omega)
Alineamiento iterativo
Alineamiento basado en bloques
2. Métodos heurís=cos
!Alineamiento progresivo
!Alineamiento itera?vo
!Alineamiento probabilís?cos
!Alineamiento híbridos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II
En la prácHca los métodos heurís1cos son más empleados

Se cuenta el número de residuos que coinciden en cada pareja de secuencias.
Con esos datos se genera un árbol filogené;co (árbol guía) que servirá de guía
para la construcción del AMS.
El AMS comienza alineando las dos secuencias más parecidas. A continuación, va
añadiendo de forma progresiva las secuencias (o grupos de secuencias) que más
se parecen a las que ya están alineadas.
El AMS depende mucho de los alineamientos iniciales por parejas. Cualquier
error come;do en las primeras etapas se va arrastrando durante todo el
proceso.
Hace un análisis de grupo (cluster analysis) para generar una jerarquía de
secuencias en base a su similitud. En base a su similitud, se comparan todas las
secuencias, dos a dos, u;lizando el algoritmo de programación dinámica.
CaracterísHcas
Alineamiento progresivo (jerárquico o de árbol)
Alineamiento AMS (métodos heurísticos)
Bloque I: Alineamiento de secuencia II

Árbol guía
Matriz de
distancias
(distancias
entre seq.)
Alineamiento progresivo1 2
34
Bloque I: Alineamiento de secuencia II

Ventajas e inconvenientes
Alineamiento progresivo
Bloque I: Alineamiento de secuencia II

Clustal Omega
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Clustal Omega: Etapas
Árbol guía
Matriz de distancias
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Se empieza alineando las dos
secuencias más parecidas. A
este alineamiento se le van
añadiendo secuencias o
alineamientos por orden
decreciente de similitud.
Clustal Omega: etapa nº 3
Árbol guía
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Para hacer un AMS con Clustal Omega:
2.- Selecciona el tipo de secuencias a alinear
3.- Introduce las secuencias en el campo (FASTA)
4.- Selecciona el formato de salida para los resultados
5.- Selecciona los parámetros del alineamiento (opta?vo)
6.- Indica si quieres recibir los resultados por e-mail
Cómo se hace un AMS con Clustal Omega
7.- Submit
1.- hYps://www.ebi.ac.uk/Tools/msa/clustalo/
Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

Formato FASTA
Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

Escoge ADN,
ARN o proteínas
Corta/pega las secuencias
aquí. El límite son 4000.
Si ya tienes las secuencias
seleccionadas en un único
archivo, pincha aquí para cargarlo
en el formulario. El tamaño
máximo del archivo es 4 Megas
Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

Selecciona el
formato de salida
del alineamiento
Selecciona los
parámetros del
alineamiento (opcional)
Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

mu
lambda
beta
TdT
Alineamiento
Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

NUEVO 2025
Bloque I: Alineamiento de secuencia II
Alineamiento progresivo, Ejemplo: Clustal

Árbol guía
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Jalview es una herramienta que te
permite crear MSA o modificar MSA
hechos con otros programas
introduciendo otros tipos de información
que ClustalW no ha tenido en cuenta.
La herramienta Jalview
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Estructura secundaria
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

Error
inicial
ABCD
El gran inconveniente de ClustalW
Propagación
del error inicial
Alineamiento progresivo, Ejemplo: Clustal
Bloque I: Alineamiento de secuencia II

DIALIGN
AMS globales
PROBCONSMétodos
probabilísticos
1. Métodos exactos
(basados en la PD)
CLUSTAL OMEGA
T-COFFEE
MUSCLE
PRALINE
Métodos
progresivos
Métodos híbridos
2. Métodos
heurísticos
MAFFT
Métodos
iterativos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

T-Coffee = Tree-based Consistency
Objective Function for alignmEnt Evaluation
Bloque I: Alineamiento de secuencias
T-CoffeeAlineamiento progresivo, Ejemplo: T-Coffee
Bloque I: Alineamiento de secuencia II

Clustal Lalign
1.- El programa comienza
haciendo alineamientos
globales (con CLUSTALW)
y locales (con Lalign) en
cada pareja de secuencias
2.- A partir de los
alineamientos crea una
biblioteca primaria en la
que cada pareja de
residuos alineados está
ponderada (su
importancia depende del
porcentaje de identidad
entre las dos secuencias)
Bloque I: Alineamiento de secuencias
Alineamiento progresivo, Ejemplo: T-Coffee
Bloque I: Alineamiento de secuencia II

3.- Se extiende la biblioteca: cada pareja
de secuencias se alinea con una tercera
(si es posible) y se recalcula el factor de
ponderación para cada posición del
alineamiento.
4.- Se hace un alineamiento progresivo.
utilizando los nuevos factores de
ponderación. Primero se calcula una
matriz de distancias y luego se construye
un árbol guía que dirija el alineamiento.
Se empieza por las más parecidas y se
van añadiendo las secuencias restantes
(o parejas de secuencias), empezando
por las de mayor parecido, hasta
completar el alineamiento.
T-Coffee
Bloque I: Alineamiento de secuencias
Alineamiento progresivo, Ejemplo: T-Coffee
Bloque I: Alineamiento de secuencia II

T-Coffee
Ejemplo de la extensión de la biblioteca
Librería primaria: cada pareja de secuencias alineada recibe un factor de ponderación
Librería extendida: Cada pareja de secuencias alineada se compara con una tercera (si
es posible) y se recalculan los factores de ponderación de cada pareja de residuos
El trazo grueso
tiene mayor
factor de
ponderación
Bloque I: Alineamiento de secuencias
Alineamiento progresivo, Ejemplo: T-Coffee
Bloque I: Alineamiento de secuencia II

MSA en T-Coffee
http://tcoffee.crg.cat/
Pincha aquí para hacer
un AMS sencillo
Bloque I: Alineamiento de secuencias
Alineamiento progresivo, Ejemplo: T-Coffee
Bloque I: Alineamiento de secuencia II

AMS en T-Coffee
(mas preciso pero lento)
AMS en Clustal
(rápido)
finger domain as well as an EAR transcriptional
repression motif [(L/F)DLN(L/F)XP, where X is any
amino acid; Ohta et al., 2001]. The interaction was
confirmed by cotransforming yeast cells with the can-
didate cDNA and with either PtiMPK3-1 or PtiMPK6-2,
two MAPKs belonging to group A (Supplemental Fig.
S1; Hamel et al., 2006). No interaction could be de-
tected using empty vectors or the group C MAPK
PtiMPK2, suggesting a specific interaction between the
truncated TF and group A MAPKs.
Search of thePopulus trichocarpagenome identified a
540-bp gene model corresponding to the cDNA iso-
lated using Y2H assay. The novel gene is located on
chromosome X and displays no intron (Supplemental
Fig. S2). The deduced amino acid sequence shares
closest similarity to that of zinc finger proteins that
possess two Cys-2/His-2 zinc finger domains (Fig.
1A) and was namedP. tr ich o ca rp aZinc Finger Pro-
tein1 (PtiZFP1; protein identifier 659738). Within
the conserved sequence of each zinc finger domain
(Cx
2–4
Cx
3
Fx
5
Lx
2
Hx
3–5
H), two Cys and two His resi-
dues tetrahedrally coordinate a zinc atom to produce
a compact structure that interacts with the major
groove of the DNA in a sequence-specific manner
(Choo and Klug, 1997). Zinc fingers found in PtiZFP1
are separated by a 24-amino acid spacer, and both
domains display a QALGGH motif that is the main
DNA-contacting surface and is specific to plant zinc
finger proteins (Fig. 1B; Kubo et al., 1998). Apart from
the two zinc fingers, the primary sequence of this
class of TF is overall poorly conserved, with only two
other recognizable regions preserved across putative
orthologs: an N-terminal L-box motif of unknown
function and the C-terminal EAR motif (Fig. 1B).
With 176 members in Arabidopsis, Cys-2/His-2-
type zinc finger proteins form one of the largest groups
of transcriptional regulators in plants (Englbrecht
et al., 2004). These proteins are further classified into
different families, with the most studied members
belonging to the C1 family (Ciftci-Yilmaz and Mittler,
2008). C1 members either possess one isolated or two
to five separated zinc fingers, denoted by the acronym
“i”; for example, PtiZFP1 belongs to subclass C1-2i.
Phylogenetic analysis was conducted to identify the
closest putative orthologs of PtiZFP1 (Supplemental
Fig. S3). Among Arabidopsis candidates, AtZAT7,
AtZAT10, and AtZAT12 are the most extensively
characterized, as they have been associated with abi-
otic stress relief (Ciftci-Yilmaz and Mittler, 2008). Other
members from this subclass are induced by biotic
challenges, including AtZAT11 in response to Flg22
elicitor peptide (Zipfel et al., 2004). Several Cys-2/His-
2-type zinc finger proteins have also been studied in
Catharanthus roseus, where they were shown to repress
Figure 1.Structure and conservation of PtiZFP1. A, Schematic view of the PtiZFP1 protein and organization of its conserved
motifs. B, Protein sequence alignment of homologous Cys-2/His-2-type zinc finger proteins. PtiZFP1 (protein identifier 659738)
is derived fromP. trichocarpa. CrZCT2 (CAF74934) is derived fromC. roseus. PhZPT2-5 (BAA19110) and PhZPT2-14
(BAA21923) are derived fromPetunia hybrida. AtZAT11 (NP_181279) and AtZAT18 (NP_190928) are derived from Arabidopsis.
The unnamed product (ACB20696) is derived fromCamellia sinensis.
MAPK-Promoted Degradation of an EAR Repressor
Plant Physiol. Vol. 157, 2011 1381
www.plant.org on May 18, 2016 - Published by www.plantphysiol.orgDownloaded from
Copyright © 2011 American Society of Plant Biologists. All rights reserved.
Bloque I: Alineamiento de secuenciasBloque I: Alineamiento de secuencia II
Artículo

DIALIGN
AMS globales
PROBCONSMétodos
probabilísticos
1. Métodos exactos
(basados en la PD)
CLUSTAL OMEGA
T-COFFEE
MUSCLE
PRALINE
Métodos
progresivos
Métodos híbridos
2. Métodos
heurísticos
MAFFT
Métodos
iterativos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

El principal problema de los alineamientos progresivos es que los errores iniciales
se arrastran. Los métodos itera;vos intentan corregir este problema por
medio de realineamientos de subgrupos de secuencias, que después se alinean
para obtener un AMS global de las secuencias.
-DIALIGN: pone énfasis en alineamiento locales entre las secuencias
-MUSCLE: alineamiento múl;ple de secuencias porlog-esperanza
Otros métodos heurís=cos
Métodos itera0vos
Alineamiento AMS (métodos heurísticos)
Bloque I: Alineamiento de secuencia II

Alineamiento itera?vo
Árbol
guía
Matriz de
distancias
Una razón por la que los métodos progresivos (CLUSTAL, T-COFFEE) son tan
fuertemente dependientes de la alta calidad del alineamiento inicial es el hecho de que
estos alineamientos se incorporan siempre al resultado final; esto es, una vez que una
secuencia ha sido alineada dentro del AMS, su alineamiento no vuelve a ser
considerado.
Bloque I: Alineamiento de secuencia II

Se pueden alinear 5000 secuencias
de 350 caracteres en 7 minutos con
un ordenador personal.
MUltiple Sequence Comparison
by Log- Expectation
Alineamiento itera?vo, MUSCLE
Bloque I: Alineamiento de secuencia II

MUSCLE permite
alinear miles de
secuencias
El proceso se lleva
a cabo en 3 etapas:
1.- AMS progresivo (borrador)
2.- AMS progresivo (mejorado)
3.- Refinado
Alineamiento itera?vo, MUSCLE
Bloque I: Alineamiento de secuencia II

El algoritmo de MUSCLE: Etapa 1 (AMS provisional)
The kmerdistance is derived
from the fraction of kmersin
common. This measure does
not require an alignment,
giving a significant speed
advantage.
Alineamiento itera?vo, MUSCLE
Bloque I: Alineamiento de secuencia II

The approximate
kmer distance
results in a
suboptimal tree.
Now is time to
improveit.
El algoritmo de MUSCLE: Etapa 2 (AMS mejorado)
Alineamiento itera?vo, MUSCLE
Bloque I: Alineamiento de secuencia II

El algoritmo de MUSCLE: Etapa 3 (Refinado)
Alineamiento iterativo, MUSCLE
Bloque I: Alineamiento de secuencia II

Alineamiento itera?vo
Bloque I: Alineamiento de secuencia II
MUSCLEClustalW
MUSCLErealizaelalineamientousandomenoshuecos,perosigue
teniendoproblemas

3 Métodos probabilís7cos
U;lizan el cálculo de una probabilidad, por lo que es una puntuación con
un fundamento matemá;co más sólido. A par;r de ahí te genera la función
obje;va y detecta los mejores alineamientos.
4 Métodos híbridos
U;liza dos ;pos de aproximaciones: combina los métodos progresivos con
los métodos itera;vos.
Otros métodos heurísticos
Alineamiento AMS (métodos heurísticos)
Bloque I: Alineamiento de secuencia II

ConclusionesAlineamiento AMS
Bloque I: Alineamiento de secuencia II

DIALIGN
AMS globales
PROBCONSMétodos
probabilísticos
1. Métodos exactos
(basados en la PD)
CLUSTAL OMEGA
T-COFFEE
MUSCLE
PRALINE
Métodos
progresivos
Métodos híbridos
2. Métodos
heurísticos
Métodos
iterativos
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Los mejores programas para hacer MSA
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Algunas recomendaciones para elegir programa
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Herramientas para editar AMS
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Editores de AMS : Jalview y Boxshade
Los editores de AMS son programas que permiten
modificar los AMS generados por otros métodos.
Permiten retocar los alineamientos para que tengan
en cuenta otros tipos de información o cambiar el
formato por otro más adecuado para su publicación
en una revista científica.
http://www.jalview.org/
http://www.ch.embnet.org/software/BOX_form.html
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

La herramienta WebLogo3
http://weblogo.threeplusone.com/
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

La herramienta cons (EMBOSS)
http://emboss.bioinformatics.nl/cgi-bin/emboss/cons
La herramienta cons
(EMBOSS) genera una
secuencia consenso a
partir de un AMS.
Selecciona el fichero con el AMS
Selecciona el formato de
salida de la secuencia
consenso
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Aplicaciones del AMS
> Identificación de regiones conservadas o semiconservadas
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

> Iden?ficación de regiones conservadas o semiconservadas
>Iden?ficación de lugares variables dentro de secuencias conservadas
Aplicaciones del AMS
Alineamiento AMS
Lospolimorfismosdeunsolonucleó0do(SNP)representanalasvariantesgené0cas
máscomúnmenteencontradasenelgenomahumano.
Bloque I: Alineamiento de secuencia II

> Identificación de regiones conservadas o semiconservadas
>Identificación de lugares variables dentro de secuencias conservadas
> Detectar motivos o regiones conservados con función común
Aplicaciones del AMS
Alineamiento AMS
Jalview
Bloque I: Alineamiento de secuencia II

> Iden?ficación de regiones conservadas o semiconservadas
>Iden?ficación de lugares variables dentro de secuencias conservadas
> Detectar mo?vos o regiones conservados con función común
> Ayuda a predecir la estructura secundaria / terciaria
Aplicaciones del AMS
Alineamiento AMS
Jalview
Bloque I: Alineamiento de secuencia II

Aplicaciones del MSA
IdenHficación de regiones conservadas
Iden;ficación de dominios de unión a ATP de dimerización de la proteína RD2
(universal stress protein) de Arabidopsis
!"# $%!&#%' (! !)* +#'$!$#%' $%,$-(!*, $% .$/0 10 2%!&#% 3 )('
( 4*%/!) #5 363 %7-4*#!$,*' (%, $%!&#% 1 )(' ( 4*%/!) #5 338
%7-4*#!$,*'0
9#:#4#/; '*(&-)*' $% <=>? -@AB (%, /*%#:$-
,(!(C('*' &*D*(4*, !)(! E'F=G3H4$I* +&#!*$%' (&* +&*'*%!
$% :#%#-#! (%, ,$-#! +4(%!' J.$/0 KBL ,(!( %#! ')#"%M0 >)*
,(!( (D($4(C4* 57&!)*& $%,$-(!*, !)(! !)*; (&* *%-#,*, C;
/*%* 5(:$4$*' "$!) (! 4*('! !*% :*:C*&' $% &$-*0 B ,(!(C('*
'*(&-) "(' +*&5#&:*, #% !)*!"#$%&'()%) *+#,%#-#
/*%#:*0 2! $%,$-(!*, !)(!!"#$%&'()%))(' 36.)(/*%*'
4#-(!*, #% (44 ND* -)&#:#'#:*'0 >)* +&*D$#7'4; $,*%!$N*,
!#:(!# /*%*/01JO*/P#7!$2* #,0? 3QQQM (%, !)* +&*D$#7'4;
$,*%!$N*, %#,74(!$#% /*%* 5&#:3%4%# 5#$#? R5/6789:
J9#)%S*-2* #,0? 1TTTM? *%-#,* :*:C*&' #5 !)* F=G 5(:$4;0
>)*; )(D* (++&#U$:(!*4; VTW (:$%# (-$, '*X7*%-*
'$:$4(&$!; !# E'F=G30 ED*&(44? F=G +&#!*$%' (&* +&*'*%!
$% (&-)(*(? $% C(-!*&$( (%, $% +4(%!'? C7! %#! $% (%$:(4'0
!"#$%& '()*+," -* -.( /0%1'2+32+, 456788
"9':;<2)= *: #$% >?*-(2+"
Y('*, #% '!&7-!7&(4 (%, C$#-)*:$-(4 ,(!( $! "(' +&*,$-!*,
!)(! !)* 7%$D*&'(4 '!&*'' +&#!*$% 5(:$4; $% C(-!*&$( '*/&*H
/(!*' $%!# !"# /&#7+'? ( /&#7+ !)(! C$%,' B>G (%, ( /&#7+
!)(! ,#*' %#! C$%, B>G J=#7'( (%, Z-[(;? 1TT3M0 >)*
B>GHC$%,$%/ F'+ +&#!*$%' (&* &*+&*'*%!*, C; !)* Z\TV66
+&#!*$% 5&#:;2*+#-'4'44<) =#--#)4+%%JO(&*:C$%'I$
2* #,0? 3QQ]M ")*&*(' !)* F=G +&#!*$%' ")$-) ,# %#! C$%,
B>G (&* &*+&*'*%!*, C; !)* F'+B +&#!*$%' 5&#:
>#2?'(+%,<) %-@<2-A#2(%,/)4+2"%4+%# 4',%0 Y#!)?
Z\TV66 5&#:;B =#--#)4+%%(%, F'+B 5&#:>B %-@<2-A#2
"*&* ')#"% !# *U$'! (' )#:#,$:*&' #5 '$:$4(& '!&7-!7&*
J=#7'( (%, Z-[(;? 1TT3L O(&*:C$%'I$2* #,0? 3QQ]M0
.#&;B =#--#)4+%%Z\TV66 !)* &*'$,7*' ")$-) (&* $%
-#%!(-! "$!) B>G "*&* $,*%!$N*, C; -&;'!(4 '!&7-!7&*
(%(4;'$' JO(&*:C$%'I$2* #,0? 3QQ]M0 >)*'* ,#:($%' (&*
$%,$-(!*, $% .$/0 KB0 ^#:+(&$'#% C*!"**% F'+B' 5&#:
/B4',%(%,>B %-@<2-A#2? Z\TV66 5&#:;B =#--#)4+%%(%,
'*D*&(4 +4(%! F'+ )#:#4#/7*' &*D*(4*, !)(! !)* B>GH
C$%,$%/ &*/$#%' (&* )$/)4; -#%'*&D*, C*!"**% Z\TV66 (%,
E'F=G3 5&#: &$-*? <_` 5&#: !#:(!# (%, R5<AE@3]
5&#: C*(%? C7! (&* 4*'' -#%'*&D*, $% !)* F'+B +&#!*$%'
5&#:/B4',%#&>B %-@<2-A#20 O(&*:C$%'I$2* #,0 J3QQ]M (4'#
$,*%!$N*, !)* &*'$,7*' ")$-) (&* +&*'*%! (! !)* $%!*&5(-* #5
!)* )#:#,$:*& !)(! $' 5#&:*, C; C(-!*&$(4 F'+ +&#!*$%'0
=*X7*%-* -#:+(&$'#% $%,$-(!*, -#%'*&D(!$#% C*!"**%
+4(%! (%, C(-!*&$(4 F'+ +&#!*$%' "$!)$% !)* ,$:*&$P(!$#%
,#:($% J.$/0 KBM0 F'$%/ -#:+7!(!$#%(4 (%(4;'$' !)*
'*-#%,(&; '!&7-!7&* #5 &$-* E'F=G3 "(' +&*,$-!*,0 >)*
,$'!&$C7!$#% #5!H)*4$-*' (%,"H'!&(%,' (++*(&*, !# C* D*&;
'$:$4(& !# !)(! ,*'-&$C*, 5#&;B =#--#)4+%%Z\TV66 ('
,*&$D*, 5&#: -&;'!(4 '!&7-!7&* (%(4;'$' JO(&*:C$%'I$2* #,0?
3QQ]M '7++#&!$%/ ( -4#'* '!&7-!7&(4 (%,? +#''$C4;? 57%-H
!$#%(4 &*4(!$#%')$+ C*!"**% !)* !"# +&#!*$%' J.$/0 KBM0 B
'$:$4(& '*-#%,(&; '!&7-!7&* "(' (4'# +&*,$-!*, 5#& C*(%
R5<AE@3] JY*-I*&2* #,0? 1TT3M0
!"#$ %$=*X7*%-* -#:+(&$'#% #5 F'+ +&#!*$%' 5&#:/)4+2"%4+%# 4',%
J<-F'+BM? F'+B 5&#: >#2?'(+%,<) %-@<2-A#2J9$F'+BM?
;2*+#-'4'44<) =#--#)4+%%Z\TV66?7"CA# )#*%D#E'F=G3?3%4%# 5#$#
R5<AE@3]? (%,EC4'(2")%4'- 2)4<,2-*<?a*<_`0 JBM =*X7*%-*
(4$/%:*%! "$!) -#%'*&D*, &*'$,7*' ')(,*,0 _*'$,7*' ")$-) (&*
-#%'*&D*, $% (44 '$U '*X7*%-*' (&* ')#"% #% C4(-I C(-I/&#7%,0
_*'$,7*' ")$-) (&* -#%'*&D*, $% (! 4*('! 5#7& #7! #5 '$U '*X7*%-*' (&*
')(,*, $% /&*;0 >)* C4(-I C(&' C*4#" !)* '*X7*%-*' $%,$-(!* *$!)*&
&*'$,7*' !)(! (&* 5(-$%/ (,*%$%* #5 B>G JBM? +)#'+)(!* #5 B>G JGM #&
&$C#'* #5 B>G J_M #& (&* 4#-(!*, $% !)* ,$:*&$P(!$#% ,#:($% J@M ('
,*&$D*, 5&#: !)* -&;'!(4 '!&7-!7&* #5;B =#--#)4+%%Z\TV660 >)*
+&*,$-!*, ,$'!&$C7!$#% #5"H'!&(%,' J#+*% )#&$P#%!(4 C(&'M (%, #5!H
)*4$-*' J/&*;H')(,*, )#&$P#%!(4 C(&'M #5 E'F=G3 $' )$/)4; '$:$4(& !#
!)* -&;'!(4 '!&7-!7&*H,*&$D*, '*-#%,(&; '!&7-!7&* #5 Z\TV660 Y#!) (&*
')#"% (C#D* !)* '*X7*%-* (4$/%:*%!0 JYM G);4#/*%*!$- &*4(!$#%')$+ #5
!)* '*X7*%-*' ')#"% $% JBM $%,$-(!$%/ :*:C*&')$+ #5 +4(%! F'+
+&#!*$%' !# !)*;B =#--#)4+%%Z\TV66 '7C/&#7+ #5 C(-!*&$(4 F'+
+&#!*$%'0
!"!#$;9-(?$% &'@
Downloaded from https://academic.oup.com/jxb/article/53/379/2325/512535 by Centro de Investigaciones Científicas Isla de la Cartuja user on 07 October 2020
purified SlRd2 protein and performed a nucleotide
binding assay in vitro by incubating SlRd2 in the
presence of [a-
32
P]ATP. Samples were then analyzed by
SDS-PAGE followed by autoradiography (Fig. 5B, up-
per panel). Indeed, SlRd2 was able to bind [a-
32
P]ATP,
whereas no [a-
32
P]ATP binding was observed when the
GFP protein was incubated in its presence. To further
confirm that SlRd2 was also able to bind ATP in vivo,
a synthetic analog of ATP, (+)-biotin-hex-acyl-ATP
(BHAcATP), consisting of ATP, an acyl-P linker and a
biotin tag, was used (Villamor et al., 2013). Incubation
of GFP-SlRd2 expressing plant extracts with BHAcATP
followed by streptavidin purification revealed that
SlRd2 was able to bind BHAcATP in planta (Fig. 5C,
upper panel). Moreover, ATP addition suppressed
BHAcATP labeling by competing with BHAcATP and
saturating the nucleotide-binding site of SlRd2 (Fig. 5C,
upper panel). Thesefindings indicate that SlRd2 binds
ATP and therefore functionally belongs to the ATP-
binding subgroup of the UspA family represented by
Mj0577.
The dimerization motif, present in UspA family
proteins, is also conserved in SlRd2 and is localized
close to the C terminus (Figs. 5A and S4). Mj0577 and
HiUspA were shown to exist as homodimers in vivo
(Sousa and McKay, 2001; Zarembinski et al., 1998).
Mj0577 crystallizes as a homodimer, and each mono-
mer binds the other through antiparallel hydrogen
bonds in thefifth beta sheet within each subunit. To test
whether SlRd2 was also able to form homodimers, we
performed a Y2H analysis in which the yeast strain
expressed SlRd2 both in the prey (pJG4-5) and in the
bait (pEG202) plasmids. Indeed, SlRd2 can form homo-
dimers because growth was observed in restrictive me-
dia and blue color developed in the presence of X-gal
(Fig. 6A). No interaction was detected when Y2H anal-
ysis was performed using a SlRd2 mutant version,
SlRd2∆dim (amino acids 163 to 166 deletion), in which
the putative dimerization domain VIIV was deleted (Fig.
6A). SlRd2 and SlRd2∆dim, were expressed in yeast (Fig.
6B). Therefore, SlRd2 forms dimers and the conserved
VIIV domain is necessary for dimerization in vivo.
It has been described thatE.coliUspC is able to form
tetramers in vivo (Nachin et al., 2008). To check if SlRd2
also formed homotetramers in vivo, anE.coliculture
overexpressing SlRd2 tagged at the N terminus with the
epitope His (His-SlRd2) was treated with a cross-linking
agent, disuccinimidyl glutarate (DSG), for 30 min.
Thereafter, protein extractswereobtained,analyzed
by SDS-PAGE and His-SlRd2 detected by immuno-
blot. Two bands of approximately 42 and 24 kD were
observed in the extracts treated with the crosslinker,
which corresponded likely with SlRd2 dimer and mon-
omer, whereas only the lowerM
r
band was observed in
control conditions (Fig. 6C). Thus, we concluded that
SlRd2 is able to form homodimers but not homote-
tramers in vivo.
To determine that SlRd2 formed homodimers in
planta and their putative subcellular localization, BiFC
assays were performed.SlRd2cDNA was cloned in the
BiFC vectors, transformed intoAgrobacteriumand agro-
infiltrated inN.benthamianaleaves. Reconstitution of
YFPfluorescence was observed 2 d after under the
confocal microscope when SlRd2-YFP
C
and SlRd2-YFP
N
Figure 4.Tomato SlRd2 protein structure and
phylogenetic analysis. A, Schematic structure of
SlRd2 containing N-terminal and C-terminal domains
and a conservedUspdomain, which encompasses
a dimerization motif. Special symbols indicate the
conserved residues described to be involved in
ATP-binding. B, Phylogenetic relationship of pro-
teins containing Usp domains from plants and
bacteria includingA.thaliana,AtRD2;tomato,SlRd2
and LeER6;N.benthamiana,NbRd2;O. sativa,
OsUSP1;V. faba, VfENOD18;E. coli, EcUspG and
EcUspA;H. influenzae,HiUspA;andM. jannaschii,
Mj0577. SlCbl10 was used as the outgroup. The
numbers on the tree represent bootstrap scores.
Plant Physiol. Vol. 173, 2017 841
SlRd2 Phosphorylation and Role in Stress Defense
www.plantphysiol.org on January 27, 2017 - Published by www.plantphysiol.orgDownloaded from
Copyright © 2017 American Society of Plant Biologists. All rights reserved.
Bloque I: Alineamiento de secuencia II

IdenHficación de regiones conservadas
>AtRD2
MEALPEDEEYSFREVVLPSLIPVVPEPELERESGERRRGRDVIVAVDHGPNSKHAFDWALVHFCRLADTLHLVHAVSSSFSLQCVK
NDVVYETSQALMEKLAVEAYQVAMVKSVARVVEGDAGKVICKEAEKVKPAAVIVGTRGRSLVRSVLQGSVSEYCFHNCKSAPVII
VPGKEAGDESIVDWTRSEDPKPS
>SlRd
MVMEDEKYNWSEVKLHSLIPIVPEPELDRETGERRRGRDIVIAIDHGPNSKHAFDWAVTHLCRLADTLHLVHAVSSLKNEIVYEAT
QGLMEKLAVEAFSVAMVKTVARIVEGDAGKVICKEAERLKPSAVVMGTRGRGIIQSVLQGSVAEYCLHNCKIAPVIIVPGKEAGEV
SVI
>NbRd
METLMEEEEYNWREVKLPSLIPVVPPPELERETGERRRGRDIVIAIDHGPNSKHAFDWAVTHICRLADTIHLVHAVSSLRNEIVYEA
TQALMEKLAIEAFEVAMVKTVARIVEGDAGKVICKEAERLKPAAVVMGTRGRSLIKSVLQGSVSEHCFHQCKTAPIIIVPGKEAGEE
SVI
>LeER6
MNALNWTLDNIKLKPHDPDSPESQGFIVILHVQSPPSIAAGLNPGAIPFGGPSDVEVPAFTAAIEAHQKRITQAILDHALGICAKKN
ANVKTQVVIGDPKEKICDAVEEMNADLLVMGSRAFGPIKRMFLGSVSNYCTNHAQCPVIIVKATP
>OsUSP1
MAAAEGEQRKTVVVVGVDDSEHSNYALEWTMQHLASGMAGGGGAELVIVHAKPSPSSVVGFGAGPGSGEVVRYVEADLRKT
AEDVVEKARRLCIANAMHALIEVIEGEPRYVLCNAVEKHSAGLLVVGSHGYGAIKRAFLGSVSDYCAHHAHCSVMIVKQPKAKRSR
AETA
>VfEnod18
MVEDRKVGVGIDFSKNSKNALKWAIVNMADKGDTFYLIHINSNSSDESRSKLFAKTGSPLIPLELKEAGVMKQYGVQTDVEVIDLL
EIAATQKEVSVVAKLYWGDARQKLMDSIEDLKLDALVLGSRGLSTIKRILLGSVSNFVMVHSPCPVTIVKDYSSSSSD
>Mj0577
MSVMYKKILYPTDFSETAEIALKHVKAFKTLKAEEVILLHVIDEREIKKRDIFSLLLGVAGLNKSVEEFENELKNKLTEEAKNKMENIKK
ELEDVGFKVKDIIVVGIPHEEIVKIAEDEGVDIIIMGSHGKTNLKEILLGSVTENVIKKSNKPVLVVKRKNS
>EcUspA
MAYKHILIAVDLSPESKVLVEKAVSMARPYNAKVSLIHVDVNYSDLYTGLIDVNLGDMQKRISEETHHALTELSTNAGYPITETLSGS
GDLGQVLVDAIKKYDMDLVVCGHHQDFWSKLMSSARQLINTVHVDMLIVPLRDEEES
>HiUspA
MYKHILVAVDLSEESPILLKKAVGIAKRHDAKLSIIHVDVNFSDLYTGLIDVNMSSMQDRISTETQKALLDLAESVDYPISEKLSGSGD
LGQVLSDAIEQYDVDLLVTGHHQDFWSKLMSSTRQVMNTIKIDMLVVPLRDE
Aplicaciones del MSA
Bloque I: Alineamiento de secuencia II

Clustal
Aplicaciones del MSA
Bloque I: Alineamiento de secuencia II

Results colour-coded for amino acid conservation
The current colourscheme of the alignment is for amino acid conservation.
The conservation scoring is performed by PRALINE. The scoring scheme works from 0 for the least conserved alignment position, up to 10 for the most conserved alignment position.
The colour assignments are:
Unconserved012345678910Conserved
.........10.........20.........30.........40.........50
SlRd M--VMEDEKYNWSEVKLHSLIPIVPEPELDRETGERRRGRDIVIAIDHGP
NbRd METLMEEEEYNWREVKLPSLIPVVPPPELERETGERRRGRDIVIAIDHGP
AtRD2 MEALPEDEEYSFREVVLPSLIPVVPEPELERESGERRRGRDVIVAVDHGP
LeER6 --------------------------------------------------
OsUSP1 ----------------------MAAAEGEQRKT-------VVVVGVDDSE
VfEnod18----------------------MV----EDR---------KVGVGIDFSK
Mj0577 --------------------MSVM-----YK---------KILYPTDFSE
EcUspA ----------------------MA-----YK---------HILIAVDLSP
HiUspA ----------------------M------YK---------HILVAVDLSE
Consistency00000000000000000000115310111361100000002746467254
.........60.........70.........80.........90.........100
SlRd NSKHAFDWAVTHLCRL-----AD----TLHLVHAVS---SL---------
NbRd NSKHAFDWAVTHICRL-----AD----TIHLVHAVS---SL---------
AtRD2 NSKHAFDWALVHFCRL-----AD----TLHLVHAVSSSFSL---------
LeER6 --MNALNWTLDNIKLKPHDPDSPESQGFIVILHVQSPPSIAAGLNP-GAI
OsUSP1 HSNYALEWTMQHLASGMAGGGGA----ELVIVHAKPSPSSVVG---FGAG
VfEnod18NSKNALKWAIVNMADK-----GD----TFYLIHINSNSSDESRSKLF-AK
Mj0577 TAEIALKHVKAFKTLKAE---------EVILLHVIDE-REIKKRDIF-SL
EcUspA ESKVLVEKAVSMARPYNA---------KVSLIHVD-----VN----Y-SD
HiUspA ESPILLKKAVGIAKRHDA---------KLSIIHVD-----VN----F-SD
Consistency47537655763444330100022000047388*63310135100002031
.........110.........120.........130.........140.........150
SlRd ------------KNEIVYEATQGLMEKLAVEAFSVAMVK----TVARIVE
NbRd ------------RNEIVYEATQALMEKLAIEAFEVAMVK----TVARIVE
AtRD2 ---------QCVKNDVVYETSQALMEKLAVEAYQVAMVK----SVARVVE
LeER6 PFGGPSDVEVPAFTAAIEAHQKRITQAILDHALGICAKK-NANVKTQVVI
OsUSP1 P--GSGEV-VRYVEADLRK--TAEDVVEKARRLCIANAM---HALIEVIE
VfEnod18T--GSPLIPLELKEAGVMKQYGVQTDVEVIDLLEIAATQKEVSVVAKLYW
Mj0577 LLGVAGLNKSVEEFENELKNKLTEEAKNKMENIKKELEDVGFKVKDIIVV
EcUspA LY--TGL---IDVNLGDMQKRISEETHHALTELSTNA---GYPITETLSG
HiUspA LY--TGL---IDVNMSSMQDRISTETQKALLDLAESV---DYPISEKLSG
Consistency10002210011145434462334444435544645542301115444853
.........160.........170.........180.........190.........200
SlRd -GDAGKVICKEAERLKPSAVVMGTRGRGIIQSVLQGSVAEYCLHNCKIAP
NbRd -GDAGKVICKEAERLKPAAVVMGTRGRSLIKSVLQGSVSEHCFHQCKTAP
AtRD2 -GDAGKVICKEAEKVKPAAVIVGTRGRSLVRSVLQGSVSEYCFHNCKSAP
LeER6 -GDPKEKICDAVEEMNADLLVMGSRAFGPIKRMFLGSVSNYCTNH-AQCP
OsUSP1 -GEPRYVLCNAVEKHSAGLLVVGSHGYGAIKRAFLGSVSDYCAHH-AHCS
VfEnod18-GDARQKLMDSIEDLKLDALVLGSRGLSTIKRILLGSVSNFVMVH-SPCP
Mj0577 -GIPHEEIVKIAEDEGVDIIIMGSHGKTNLKEILLGSVTENVIKK-SNKP
EcUspA SGDLGQVLVDAIKKYDMDLVVCGHH-QDFWSKLM--SSARQLINT-VHVD
HiUspA SGDLGQVLSDAIEQYDVDLLVTGHH-QDFWSKLM--SSTRQVMNT-IKID
Consistency0*74455855569544456795*5644535656735*7754544404346
.........210.........220......
SlRd VIIVPGKEAGEVSVI-----------
NbRd IIIVPGKEAGEESVI-----------
AtRD2 VIIVPGKEAGDESIVDWTRSEDPKPS
LeER6 VIIV--KATP----------------
OsUSP1 VMIV--KQPKAKRSRAETA-------
VfEnod18VTIV--KDYSSSSSD-----------
Mj0577 VLVVKRKNS-----------------
EcUspA MLIVPLRDEEES--------------
HiUspA MLVVPLRDE-----------------
Consistency879*3185422121100000000000
10/07/2020 02:50:12 PM
Results colour-coded for amino acid conservation 1
ATP binding
dimeriza=on
Clustal
Praline
Aplicaciones del MSA
Bloque I: Alineamiento de secuencia II

El programa PRALINE
Alineamiento AMS
Bloque I: Alineamiento de secuencia II

Métodoprogresivo:
1.Añadesecuencuenciasadicionales
relacionadasfilogené;camenteconla
informaciónintroducida(Psi-BLAST)
2.Puedeincorporarinformaciónsobre
estructurassecundariaspredichapor
diferentesprogramas
Bloque I: Alineamiento de secuencia II
PRALINE busca homólogos e incorpora información estructural

Praline: opciones

Perfiles
Perfiles HMM
Motivos (patrones)
Patrones difusos
Dominios
Reglas
Huellas dactilares
Bloques
Motivos
locales
conservados
Motivos
únicos
Alineamientos
completos
Motivos
múltiples
Identificar de motivos conservados en un AMS
Bloque I: Alineamiento de secuencia II

Motivos (bloques, segmentos, características)
Bloque I: Alineamiento de secuencia II
Los residuos conservados son idén=cos

Varios motivos conservados en un AMS
Bloque I: Alineamiento de secuencia II

Bloque I: Alineamiento de secuencia II

Bloque I: Alineamiento de secuencia II

Supplemental Data. Ramon et al. (2019). Plant Cell 10.1105/tpc.18.00500.


Supplemental Figure 1. SnRK1 heterotrimeric complex and SnRK1α1 catalytic α subunit domain structure and composition (Supports Figure 1). (A) Cartoons of 3D homology models of the SnRK1α1β2βγ heterotrimeric complex, the full-length (FL, 512 aa) SnRK1α1 subunit, and truncated (404, 333, and 290 aa) SnRK1α1 proteins. The regulatory α C-terminal domain (αCTD), α linker, and ubiquitin associated (UBA) domain are indicated in addition to the N-lobe, C-lobe and catalytic cleft of the catalytic domain. (B) Schematic overview of SnRK1α1 catalytic and regulatory domain composition and progressive truncation of the catalytic domain to 404 aa (- αCTD), 333 aa (-α linker) and 290 aa (- UBA domain). The phosphorylated T-loop T175 residue is indicated in the C-lobe.
!!!!!!!



Lo que se sabe
Bloque I: Alineamiento de secuencia II

Bloque I: Alineamiento de secuencia II

Ejercicio aplicando conocimientos previos
>protein_X
MTTGRPNNILALKISTRSSSLTVGEQFCAVFIPFFAIIDVLVSSVGQCFDCRSTSPRTCQ
HADLERLARESQFSVNEVEALYELFKKLSCSIIDDGLIHKEELRLALFQAPYGENLFLDR
VFDLFDEKKNGVIEFEEFIHALSVFHPYASIQEKTDFAFRLYDLRQTGFIEREEVQQMVS
AILLESDMMLSDELLTMIIDKTFADADSDKDGKISKDEWNVYVHKHPSLLKNMTLPYLKD
VTTAFPSFIFNTEVED
Pasos a seguir:
1.BLAST (ncbi) => le ponemos nombre y especie
2.BLAST en DB del organismos => iden;ficamos si existen proteínas similares
3.(Uniprot => seleccionamos secuencias para hacer el alineamiento)
4.ClustalW => iden;ficamos las regiones conservadas
5.Análisis por Jalview (edición del alineamiento)
6.PROSITES => iden;ficamos los dominios
Bloque I: Alineamiento de secuencia II

1
Bloque I: Alineamiento de secuencia II

2
tair
uniprot
Bloque I: Alineamiento de secuencia II

3
Coger el mayor número posible de secuencias
homologas y de diferentes organismos
Bloque I: Alineamiento de secuencia II

3
Bloque I: Alineamiento de secuencia II

3
Bloque I: Alineamiento de secuencia II

4
Bloque I: Alineamiento de secuencia II
Arbol guía

5
Bloque I: Alineamiento de secuencia II

6
Bloque I: Alineamiento de secuencia II

Actividad 2: aplicando alineamiento de secuencia
Aplicando conocimientos previos:
1.Determinar especie e iden;dad de la secuencia problema
2.Realizar alineamiento múl;ple usando para ello las TRES secuencias ortólogas
(Clustal Omega y Jalview). Incluye árbol guia
3.Determinar las estructuras secundarias
4.Iden;ficar mo;vos funcionales (dominios)
>protein_X
MNTNRGRYPPGVGTGRGAPPNPDYHQSYRQQQPPQDQQYVQRGYSQNPQQMQLQQQHQQQQQQQQWSRRPQLPGNASNANEVVQQTTQPEASSDANGQ
DWKATLRLPPPDTRYQTADVTA TKGNEFEDYFLKRDLLKGIYEKGFEKPSPIQEESIPIALTGSDILARAKNGTGKTGAFCI
PVLEKIDPNNNVIQAMILVPTRELALQTSQVCKELSKYLNIQVMVTTGGTSLRDDIMRLH
QPVHLLVGTPGRILDLTKKGVCVLKDCAMLVMDEADKLLSAEFQPSLEELIQFLPQNRQF
LMFSATFPVTVKAFKDRHLRKPYVINLMDQLTLMGVTQYYAFVEERQKVHCLNTLFSKLQ
INQSIIFCNSVNRVELLAKKITELGYSCFYIHAKMVQDHRNRVFHEFRNGACRNLVCTDL
FTRGIDIQAVNVVINFDFPRTSESYLHRVGRSGRFGHLGLAVNLVTYEDRFKMYQTEQEL GTEIKPIPSNIDQAIYCQ
Importante:
- Formato pdf
- Apellidos nombre_Ac;vidad 2
Bloque I: Alineamiento de secuencia II