Story Transcript
UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE VETERINARIA
Departamento de Producción Animal
ANÁLISIS DE LA VARIABILIDAD GENÉTICA EN LA RAZA BOVINA DE LIDIA UTILIZANDO INFORMACIÓN MOLECULAR MEMORIA PRESENTADA PARA OPTAR AL GRADO DE DOCTOR POR:
Oscar Cortés Gardyn
Bajo la dirección del doctor: D. Javier Cañón Ferreras y Dña. Susana Dunner Boxberger Madrid 2008
UNIVERSIDAD COMPLUTENSE DE MADRID Facultad de Veterinaria
ANÁLISIS DE LA VARIABILIDAD GENÉTICA EN LA RAZA BOVINA DE LIDIA UTILIZANDO INFORMACIÓN MOLECULAR
Tesis Doctoral
Oscar Cortés Gardyn Madrid 2008
UNIVERSIDAD COMPLUTENSE DE MADRID
Facultad de Veterinaria
ANÁLISIS DE LA VARIABILIDAD GENÉTICA EN LA RAZA BOVINA DE LIDIA UTILIZANDO INFORMACIÓN MOLECULAR
Memoria presentada por Oscar Cortés Gardyn para optar al grado de Doctor, realizada en el Departamento de Producción Animal de la Facultad de Veterinaria de la Universidad Complutense de Madrid y dirigida por los Dres. Javier Cañón Ferreras y Susana Dunner Boxberger.
1.ÍNDICE DE CONTENIDOS
Índice
1. INDICE
5
2. INDICE DE FIGURAS Y TABLAS
7
3. ABREVIATURAS
17
I. RESUMEN/ABSTRACT
21
II. INTRODUCCIÓN
27
II.1. Origen de los bovinos
29
II.2. El toro de lidia en la Península Ibérica
32
II.3. Biodiversidad 38 II.3.1 Diversidad Genética 41 II.3.1.1 Marcadores de Diversidad Genética 41 II.3.1.1.1 Caracteres Morfológicos 41 II.3.1.1.2 Polimorfismos de Naturaleza Proteica 43 II.3.1.1.3 Marcadores Moleculares de ADN 43 II.3.1.1.3.1 Polimorfismo de un solo nucleótido (Single Nucleotide Polymorphism o SNPs). 45 II.3.1.1.3.2. Elementos repetidos 57 II.3.1.1.3.2.1 ADN Satélite 48 II.3.1.1.3.2.2 Minisatélites 48 II.3.1.1.3.3.3. Microsatélites 49 II.3.1.1.4 Diversidad Genética en el Cromosoma Y 54 II.3.1.1.5 ADN Mitocondrial 57 II.3.1.1.5.1 Organización del ADN mitocondrial 57 II.3.1.1.5.2 La Región de Control o D‐loop 58 II.3.1.1.5.3 Evolución en el género Bos a partir del estudio del ADN mitocondrial 60 II.3.2 Mecanismos evolutivos que actúan sobre la poblaciones 64 II.3.2.1 Procesos Sistemáticos 64 II.3.2.1.1 Migración o Flujo Genético 64 II.3.2.1.2 Mutación 64 II.3.2.1.3 Selección 66 II.3.2.2 Procesos Dispersivos 67 II.3.2.2.1 Deriva Genética Dentro de Razas o Subpoblaciones: Endogamia 67 II.3.2.2.2 Deriva genética entre razas o subpoblaciones: Estadísticos F de Wright 68 II.3.3 Distancias Genéticas 69 II.3.3.1 Modelo Mutacional 70 II.3.3.2. Modelo de Deriva Genética 70 II.3.4 Árboles de Distancias 73
3
Índice
II.3.5 Representaciones Network II.3.6 Análisis Factorial de Correspondencia II.3.7 Análisis de la estructura de las poblaciones III OBJETIVOS IV MATERIAL Y METODOS IV.1. Recogida de muestras IV.2. Metodología laboratorial IV.2.1 Extracción de ADN IV.2.2 Medida de la Concentración del ADN y Visualización IV.2.3 Amplificación de los fragmentos de ADN IV.2.3.1 Amplificación de los microsatélites autosómicos IV.2.3.1.1 Electroforesis capilar IV.2.3.1.2 Genotipado de las muestras IV.2.3.2 Amplificación de microsatélites localizados en el cromosoma Y IV.2.3.2.1. Electroforesis en gel de poliacrilamida IV.2.3.2.2. Genotipado de las muestras IV.2.3.3 Secuenciación del ADN mitocondrial IV.2.3.3.1 PCR previa a la secuenciación IV.2.3.3.2 PCR de secuenciación IV.2.3.3.3 Alineamiento de secuencias IV.3. Análisis de los datos generados IV.3.1 Análisis de la secuencia de ADN mitocondrial IV.3.1.1 Número de sitios polimórficos (s) IV.3.1.2 Número de haplotipos IV.3.1.3 Diversidad haplotípica IV.3.1.4 Número de diferencias nucleotídicas IV.3.1.5 Diversidad nucleotídica IV.3.1.5.1 Diversidad media de la población (πT) IV.3.1.5.2 Distancia media dentro de poblaciones (πi) IV.3.1.5.3 Diversidad media entre poblaciones IV.3.2 Análisis de Microsatélites IV.3.2.1 Parámetros básicos de polimorfismo genético IV.3.2.1.1 Número de alelos por locus IV.3.2.1.2 Número efectivo de alelos IV.3.2.1.3 Heterocigosis observada (Ho) IV.3.2.1.4 Heterocigosis insesgada(Hj) IV.3.2.2 Contenido en Información Polimórfica (PIC) IV.3.2.3 Equilibrio Hardy‐Weinberg
4
74
75
76
79
83
85
85 85 88 89 89 91 92 94 95 97 97 97 98 100
100
100 100 101 101 101 102 102 102 103
103 103 103 103 104 104 105 105
Índice
IV.3.3 Análisis de la Estructura Genética de Poblaciones y sus relaciones IV.3.3.1 Cálculo de los estadísticos F de Wright IV.3.3.2 Análisis de la Varianza Molecular IV.3.4 Distancia FST IV.3.5 Representaciones gráficas IV.3.5.1 Representación mediante dendogramas IV.3.5.2 Representaciones Network IV.3.5.2.1 Median joining IV.3.7 Análisis Factorial de Correspondencia IV.3.8 Análisis de la estructura de la población V RESULTADOS V.1.‐ Microsatélites autosómicos V.1.1. Parámetros indicativos de la variabilidad genética V.1.1.1 Número de alelos y Número Efectivo de Alelos (NEA) V.1.1.1.1 Microsatélites V.1.1.1.1 Encastes V.1.1.2 Heterocigosis y Contenido en Información Polimórfica (PIC) V.1.1.2.1 Microsatélites V.1.1.1.1 Encastes V.1.2 Equilibrio Hardy‐Weinberg V.1.3 Diferenciación genética entre encastes V.1.3.1 Estadísticos F de Wright V.1.3.2 Partición de la Variabilidad Genética V.1.3.3 Distancias Genéticas V.1.3.3.1 Distancias FST V.1.3.3.2 Distancia Estándar de Nei V.1.3.4 Árboles de Distancias V.1.4 Análisis Factorial de Correspondencia V.1.5 Análisis de la Estructura de la Población V.1.5.1 Análisis en la raza de lidia V.1.5.2 Análisis en los encastes V.1.5.2.1 Origen Vistahermosa V.1.5.2.2 Cruces con Casta Vazqueña V.1.5.3 Agrupación de las ganaderías V.2. Microsatélites del cromosoma Y
5
106 106 107 108 109 109 110 110 111 112 115 117 117 117 117 118 120 120 121 122 123 123 125 126 126 129 130 131 135 135 139 139 145 146 148
Índice
V.2.1 Parámetros indicativos de la variabilidad genética 148 V.2.1.1 Diversidad Haplotípica 149 V.2.2 Diferenciación Genética entre Encastes 153 V.2.2.1 Análisis de Varianza 153 V.2.2.2 Distancias FST 153 V.2.2.3 Árbol de Distancias 156 V.2.3 Análisis Factorial de Correspondencia 158 V.3. ADN mitocondrial 160 V.3.1 Parámetros indicativos de la varibilidad genética 160 V.3.1.1 Diversidad nucleotídica 160 V.3.1.2 Diversidad haplotípica 167 V.3.2 Diferenciación genética entre encastes 170 V.3.2.1 Partición de la Variabilidad Genética 170 V.3.2.2 Distancias FST 177 V.3.2.3 Árbol de distancias 170 V.3.3 Representaciones Network 174 V.3.3.1 Raza de Lidia 174 V.3.3.2 Raza de Lidia y otras razas bovinas 176 V.3.3.3 Raza de Lidia y muestras arqueológicas del primitivo uro (Bos primigenius) 178 VI DISCUSIÓN 181 VI.1. Análisis de la variabilidad genética utilizando marcadores autosómicos 185 VI.2.‐ Análisis de la variabilidad genética utilizando marcadores ligados al sexo 180 VI.2.1 Marcadores localizados en el Cromosoma Y 180 VI.2.2 Análisis de la variabilidad genética del ADN mitocondrial 189 VI.2.2.1Matrilineas en la raza de lidia 190 VI.2.2.2 El uro y la raza de lidia 193 VI.3.‐ Análisis de la estructura de la población 194 VI.3.1 Posición relativa relativa de la raza de lidia con otras razas bovinas europeas 199 VI.3.2 Agrupación de las ganaderías 200 VI.4.‐ Dendogramas de las distancias genéticas 203 VII CONCLUSIONES 207 IX BIBLIOGRAFÍA 211 X ANEXOS 229
6
2. ÍNDICE DE FIGURAS Y TABLAS
Índice de Figuras y Tablas
FIGURAS INTRODUCCIÓN Figura 1: Representación del primitivo Uro (Bos primigenius). Figura 2: Localización geográfica de las castas fundacionales y su representación gráfica en tamaño proporcional. Figura 3: Ejemplar de origen Casta Morucha Castellana José Marzal con cruces con Vistahermosa. Figura 4: Historia genealógica de los principales encastes y ganaderías surgidos de la Casta Vistahermosa. Figura 5. Fiesta de toros. Siglo XVII. Figura 6: Ejemplar de la ganadería de Juan Pedro Domecq de origen Casta Vistahermosa. Figura 7: Ejemplar de la ganadería de Pablo Romero de origen Gallardo. Figura 8: Ejemplar de la ganadería Barcial de origen Vazqueño con cruces de Vistahermosa. Figura 9: Deslizamiento de la polimerasa durante la replicación generando una nueva repetición o su desaparición en la cadena de nueva síntesis (en cursiva). Figura 10: Imagen de un microsatélite obtenida en un secuenciador automático de un individuo heterocigoto. En rojo aparece el tamaño en pares de bases de los alelos y en negro las bandas sombra o stutter bands que corresponden a una, dos o tres repeticiones menos que el verdadero alelo. Figura 11: Representación del ADN mitocondrial bovino. Figura 12: Distribución de los principales halpotipos descritos en el ganado vacuno europeo (T1-T2-T3-T4). Las líneas continuas indican los movimientos de expansión humanos a partir de los orígenes de domesticación y las discontinuas señalan los límites de influencia del ganado africano. El tamaño de los círculos es proporcional a los animales muestreados en cada zona geográfica y la división de cada círculo es proporcional a la frecuencia de cada haplotipo. Imagen tomada del artículo Beja-Pereira y col. 2006.
MATERIAL Y MÉTODOS Figura 13: Imagen de las bandas sombra y adición de la adenina final. Los picios negros uniformes correspoden a los dos alelos que porta la muestra analizada y los no coloreados son las bandas sombra. El pico azul más alto corresponde al alelo que porta el individuo y el más bajo a la adición de las adenina final. Figura 14: Secuencia completa del d-loop de Bos taurus (15792..16338,1..363). Los nucleótidos subrayados identifican al fragmento secuenciado (16019-201). En azul se muestra el fragmento 1, en rojo el 2 y en verde la zona solapante de ambos fragmentos.
9
Índice de Figuras y Tablas
RESULTADOS Figura 15: Rango alélico en pares de bases de los 24 microsatélites autosómicos analizados. Figura 16: Representación gráfica de la matriz de distancias FST y el modelo de agrupamiento NeighbourJoining. Los distintos colores representan las castas de procedencia de los encastes. Figura 17. Representación bidimensional del Análisis Factorial de Correspondencia, realizado sobre los ejes 1 y 2. Con colores se representan a los encastes. Figura 18. Representación bidimensional del Análisis Factorial de Correspondencia, realizado sobre los ejes 1 y 3. Con colores se representan a los encastes. Figura 19. Representación tridimensional del Análisis Factorial de Correspondencia considerando los tres ejes que presentan mayor contribución relativa. Figura 20: Valores de la probabilidad obtenida para cada número de grupos genéticos definidos. Figura 21: Dendograma de las ganaderías obtenida con la distancia Ds (Capuccio y col. 2006). Figura 22: Dendograma obtenido con la distancia Ds (Capuccio y col. 2006) sustituyendo el nombre de la ganaderías por el encaste al que pertenece. Cada color representa un encaste, excepto el color negro que representa aquellos encastes formados por una sola ganadería. Figura 23: Influencia de 2, 3 y 4 poblaciones ancestrales en los encastes definidos a priori. En la parte inferior de la imagen se muestra el árbol de distancias FST. Cada rectángulo corresponde a un encaste. Figura 24: Representación gráfica del Análisis Factorial de Correspondencia correspondiente a los factores 1 y 2. Figura 25: Representación gráfica del Análisis Factorial de Correspondencia correspondiente a los factores 1 y 3. Figura 27: Distribución de las mutaciones en el fragmento secuenciado, agrupando la secuencia en bloques de 20 nucleótidos. Figura 28: Número de haplotipos por encaste. Figura 29: Dendrograma obtenido a partir de la distancia FST entre los diferentes encastes utilizando el método de agrupamiento Neighbour-Joining. Los colores se corresponden con las distintas casta o vacadas fundacionales. Figura 30: Distribución de los haplotipos identificados en el toro de lidia. El color rojo corresponde a los haplotipos T3; amarillo T1; Azul T y verde oscuro T2. Los nuevos haplotipos identificados se representa con diferentes colores, marrón, azul claro, naranja, negro, verde y blanco. Figura 31: Representación network de los haplotipos de lidia (amarillo), razas criollas (gris), europeas (verde), africanas (negras) y españolas (rojo). El borde de la circunferencia indica a qué haplotipo corresponde, rojo T3, amarillo T1, azul T y verde T2.
10
Índice de Figuras y Tablas
Figura 32: Representación tipo network de los haplotipos de lidia y de muestras arqueológicas localizados en el Reino Unido (marrón oscuro), Italia (negro), territorio peninsular y Alemania (gris). Los haplotipos de lidia presentan diferentes colores en función del haplotipo, rojo (T3), azul (T), verde (T2) y amarillo (T1).
DISCUSIÓN Figura 33: Distribución geográfica de los haplotipos T, T1, T2 y T3. (Anderung y col. 2005). Figura 34: Representación gráfica del análisis multivariante de correspondencia. Las flechas indican la posición de la raza de lidia y de las tres razas autóctonas españolas consideradas.
11
Índice de Figuras y Tablas
TABLAS INTRODUCCIÓN Tabla 1: Descripción de las castas fundacionales. Tabla 2: Número de razas domésticas de las principales especies animales. Tabla 3: Diferencias nucleotídicas de los principales haplotipos descritos en el ADN mitocondrial bovino.
MATERIAL Y MÉTODOS Tabla 4: Descripción del muestreo realizado y de las muestras analizadas para cada marcador molecular utilizado. Tabla 5 : Referencias de los microsatélites amplificados Tabla 6: Condiciones de las múltiplex realizadas para la amplificación de los microsatélites. Tabla 7: Condiciones de las múltiplex realizadas para la amplificación de los microsatélites. Tabla 8: Fluorocromos y rangos alélicos de los microsatélites en las dos múltiplex. Tabla 9: Referencias bibliográficas de los microsatélites del cromosoma Y. Tabla 10: Condiciones de amplificación de los microsatélites del cromosoma Y. Tabla 11: Secuencias de los cebadores utilizados en la amplificación del ADN mitocondrial, posición donde se sitúan tomando como referencia la secuencia del Genbank NC_006853 y tamaño del fragmento amplificado. Tabla 12: Condiciones de la PCR utilizada en la amplificación del ADN mitocondrial. Tabla 13: Estructura de la población utilizada en el análisis de varianza molecular.
RESULTADOS Tabla 14: Número efectivo de alelos (NEA) y Nº de alelos por microsatélite. En rojo aparecen los valores más altos y en azul los más bajos Tabla 15: Número efectivo de alelos (NEA) por encaste y número medio de alelos por encaste y en la raza de lidia en conjunto igualando el tamaño muestral en los encastes a 15. Tabla 16: Valores del contenido en información polimórfica (PIC), heterocigosis insesgada (He) y observada (Ho) por microsatélite. En rojo se resaltan los valores superiores y en azul los inferiores. Tabla 17: Valores del contenido en información polimórfica (PIC), Heterocigosis insesgada (He) y observada (Ho) por encaste, valores promedio y considerando la población en su conjunto. En azul se resaltan los valores inferiores y en rojo los superiores.
12
Índice de Figuras y Tablas
Tabla 18: Desviaciones respecto al equilibrio Hardy-Weinberg (indicados con un X) de los encastes por microsatélite y total calculado con el método de cadenas de Markov y con un nivel de significación de P0,05. Tabla 24: Distancias promedio por encaste obtenidas con las distancias de Nei y FST con los microsatélites autosómicos. Tabla 25: Valores de la correlación de Pearson entre las diferentes distancias calculadas a partir de las frecuencias alélicas. Tabla 26: Contribución a la inercia de los factores en el análisis de correspondencia respecto a los encastes e individuos. Tabla 27: Valores de los tres factores en los 29 encastes. Entre paréntesis se indica el número de referencia de cada encaste que aparece en las gráficas. Tabla 28: Agrupación de las ganaderías analizadas en los 31 grupos que mayor verosimilitud dan a los datos analizados. Cada ganadería se asigna al grupo que mayor influencia tiene, en promedio, sobre los individuos que la integran. La columna de los encastes hace referencia a la agrupación propuesta por los técnicos de la U.C.T.L. y los grupos en gris muestran las coincidencias entre ambas agrupaciones. Tabla 29: Distribución de los alelos de los microsatélites del cromosoma Y. Tabla 30: Valores de la heterocigosis esperada obtenida por encaste con los microsatélites del cromosoma Y y el valor global de la raza. Tabla 31: Descripción de los haplotipos identificados con los resultados de los microsatélites localizados en el cromosoma Y. El signo de interrogación indica alelo no genotipado.Tabla 32: Frecuencias alélicas de los microsatélites localizados en el cromosoma Y en los encastes. Tabla 32: Frecuencias alélicas de los microsatélites localizados en el cromosoma Y en los encastes. Tabla 33: Frecuencias de los haplotipos en los diferentes encastes expresados en porcentaje.
13
Índice de Figuras y Tablas
Tabla 34: Análisis Molecular de Varianza realizado a partir frecuencias alélicas de microsatélites localizados en el cromosoma Y. Tabla 35: Distancias FST promedio entre encastes calculados a partir de las distancias FST del cromosoma Y. Tabla 36: Matriz de distancias FST entre encastes a partir de los microsatélites del cromosoma Y. Tabla37: Contribución a la inercia de los factores en el análisis de correspondencia respecto a las ganaderías e individuos de los microsatélites del cromosoma Y. Tabla 38: Valores de los tres factores en los 29 encastes. Entre paréntesis se indica el número de referencia de cada encaste que aparece en las gráficas. Tabla 39: Descripción de los polimorfismos identificados en las secuencias. Tabla 40: Descripción de las 73 mutaciones identificadas, posición refereida a la secuencia de referencia (Genbank Nº), entre paréntesis se aparece el número de mutación nombradas de manera consecutiva, tipo de mutación y nº de individuos que la presentan. Tabla 41: Número de individuos, de cada encaste, en donde se ha identificado cada una de las mutaciones. Tabla 42: Número de mutaciones identificadas por encaste, ajustando el tamaño muestral a 50. Tabla 43: Número de lugares polimórficos, diversidad nucleotídica y haplotípica, diferencias nucleotídicas entre y dentro de encastes. Los valores entre paréntesis indican la desviación típica. En rojo se resaltan los valores más altos y en azul los menores. Tabla 44: Matriz de las diferencias nucleotídicas entre encastes (por encima de la diagonal) y dentro de encastes (en la diagonal). En rojo se presentan los valores más bajos y en azul los más altos. Debajo de la diagonal se muestran los valores de diversidad nucleotídica entre encastes expresada en porcentaje. Tabla 45: Descripción de los nuevos haplotipos identificados en la raza de lidia (1 a 6) y los ya descritos. T, T1, T2, T3, T4 y el T1* (haplotipo criollo). Tabla 46: Distribución de los haplotipos en los diferentes encastes. Tabla 47: Distribución y frecuencias de los nuevos haplotipos identificados, encaste en el que se han identificado y entre paréntesis el número de individuos que lo muestran. Tabla48: Análisis de la varianza molecular basadas en las secuencias de ADN mitocondrial. Tabla 49: Distancias FST entre encastes expresadas en porcentaje. La distancia en azul corresponde a la más alta. Tabla 50: Distancias FST promedio entre encastes calculados a partir del ADN mitocondrial. Tabla 51: Número de secuencias de las razas analizadas conjuntamente con el toro de lidia en el análisis network. Tabla 52: Descripción de las muestras arqueológicas incluidas en el análisis Network.
14
Índice de Figuras y Tablas
DISCUSIÓN Tabla 53: Descripción de las posiciones nucleotídicas que identifican los diferentes haplotipos. Tabla 54: Distancia FST promedio de cada encaste con el resto de encaste considerando tres fuentes de información, micro satélites autosómicos, localizados en el cromosoma y ADN mitocondrial.
15
3. ABREVIATURAS
Abreviaturas
A – Adenina
PCR – Polymerase Chain ReactionPIC –
ATP – Adenina Tri Fosfato
Contenido en información Polimórfica
a de C. – Antes de Cristo
POP – Performance Optimized Polymer
ADN – Ácido Dexosirribonucleico
RAPDs – Random Amplified Polimorphic DNA
AFLPs – Amplified Fragment Length
RFLPs – Restriction Fragment Length
Polymorphism
Polymorphism
ARN – Ácido Ribonucleico
RPM – Revoluciones Por Minuto
ARNm – Ácido Ribonucleico Mensajero
SINEs – Short Interpersed Nuclear Elements
BOE – Boletín Oficial del Estado
SNPs – Single Nucleotide Polymorphism
C – Citosina
T – Timina
d. de C. – Después de Cristo
TPM – Two Phase Model
ESTs – Expressed Séquense Tags
UCTL – Unión de Criadores del Toro de Lidia
FAO – Organización para la Agricultura y la
µl – Microlitro
Alimentación
µg – Microgramo
G – Guanina
UPGMA – Unweighted Pair Group Method
G – ges
Arithmetic
He – Heterocigosis esperada Hj – Heterocigosis Insesgada ALB ANT ARA ATA BAL BRA CAR COL CON COR CRM CUA DOM FEL GAM HID MAN MIU MON MUR PAB PED SAL SIE TOR URC VEG VER VIL
HMC – Complejo Mayor de Histocompatibilidad Ho – Heterocigosis observada IAM – Infinite Allele Model IBISS – Interactive Bovine In Silico SNP Database Kb – Kilobase kV - Kilovoltios LINEs – Long Interpersed Nuclear Elements M – Molar ME – Minimum Evolution ml – Mililitro mM – Milimolar NCBI – National Center for Biotechnology Information NEA – Número Efectivo de Alelos ng - Nanogramos NJ – Neighbour Joining OTUs – Operative Taxonomic Unit pb – Pares de Bases
19
Abreviaturas de los encastes Marqués de Albaserrada Antonio Pérez Araúz de Robles Atanasio Fernández Baltasr Ibán Braganza Carlos Núñez Santa Coloma Contreras Conde de la Corte José Marzal Cuadri Juan Pedro Domecq Félix Gómez Gamero Cívico Hidalgo Barquero Manuel Arranz Miura María Montalvo Murube Pablo Romero Pedrajas Saltillo Concha y Sierra Torrestrella Urcola Vega Villar Veragua Marqués de Villamarta
I RESUMEN/ABSTRACT
Resumen/Abstract
La raza de lidia (Bos taurus hispanicus) presenta una serie de particularidades que la alejan de la mayoría de las actuales razas bovinas. Se explota en un régimen extensivo de casi absoluta libertad en las dehesas de Salamanca, Extremadura y en Andalucía Oriental fundamentalmente. Es la única raza bovina doméstica cuyo objetivo de selección se basa en caracteres de comportamiento. Además, debido a los distintos tipos de festejos taurinos y las diferentes maneras de entender la agresividad en la lidia, se ha dividido en líneas llamadas encastes que en su conjunto otorgan una elevada variabilidad fenotípica a la raza de lidia. Su origen se sitúa alrededor de las grandes cuencas fluviales donde se localizaban las vacadas o castas fundacionales (Siglos XVI‐XVIII), a partir de las cuales se originaron los actuales encastes. Con el objetivo de estudiar las características genéticas de la raza de lidia, se han analizado 74 ganaderías que, de acuerdo con el criterio de los técnicos de la U.C.T.L. podrían agruparse en 29 encastes. Para el estudio se han utilizado marcadores de tipo microsatélite unos localizados en cromosomas autosómicos y otros en el cromosoma Y, además de un fragmento del origen de replicación del ADN mitocondrial. Los parámetros de diversidad genética obtenidos con los microsatélites autosómicos mostraron valores bajos dentro de los encastes, mientras que al considerar la raza en su conjunto aumentaron significativamente hasta situarse dentro del rango de la mayoría de las razas bovinas. El análisis de la variabilidad genética evidenció marcadas diferencias entre encastes, el valor medio del estadístico FST fue de 0,18, así como entre las ganaderías que los integran, el valor medio del estadístico FIS fue de 0,11. indicando una clara falta de aleatoriedad en el apareamiento de los individuos de cada encaste y /o ganadería. Un análisis que agrupó a los animales en función de su genotipo, estimó en 31 el número de grupos genéticos, valor muy próximo al de la hipótesis de partida propuesto por los técnicos de la Unión de Criadores del Toro de Lidia (U.C.T.L.). En la
23
Resumen/Abstract
mayoría de las ganaderías un porcentaje importante del genoma de sus íntegrantes se asignó a un único grupo genético. La variabilidad genética detectada mediante el ADN mitocondrial resultó elevada. La distribución de los principales haplotipos descritos en la raza de lidia fue similar a la encontrada en otras razas bovinas Mediterráneas, con dos matrilíneas fundamentales, la europea y africana, lo que corrobora la información histórica que mencionaban la posible influencia del ganado africano en la raza de lidia. Existen marcadas diferencias entre los encastes en la frecuencia del haplotipo africano. Así, mientras que en algunos no se ha detectado, en otros como es el caso de Miura, el haplotipo de origen africano es mayoritario. La diversidad genética mostrada por los microsatélites localizados en el cromosoma Y fue escasa, similar en todo caso a la obtenida en otras razas bovinas, como se desprende del hecho de que el porcentaje de uno de los haplotipos descritos es superior al 75%. Los resultados obtenidos muestran una clara división de la raza en diferentes grupos genéticos, que en gran medida coinciden con los tradicionalmente denominados encastes, aislados reproductivamente entre sí, hecho que puede hacerse extensible en algunos encastes a las ganaderías que lo integran.
24
Resumen/Abstract
The Lidia breed has a number of peculiarities that make it one of the most successful of domestic breeds in Spain. It geographic distribution in Spain correspond to the Mediterranean forest ecosystem, traditionally called La Dehesa, mainly in Salamanca, Extremadura and Andalucía. It is the only bovine population selected for behavioural traits, like aggressiveness, and due to the different types of traditional spectacles that’s demand different types of behaviour and to the different ways to understand the aggressiveness the fighting bull breed has fragmented into small lineages, traditionally called encastes, and has a high level of phenotypic variability. The actual encastes were originated from the Vacadas or Fundationals Castas located in areas surrounding main rivers. A total of 79 farms corresponding to 29 encastes, defined by the U.C.T.L. (Unión de Criadores del Toro de Lidia) have been analysed aiming to asses the genetic variability of the fighting bull breed. Three different information sources have been taken into account, autosomic and Y chromosome microsatellites and a fragment of the mitochondrial DNA d‐loop. The genetic diversity parameters showed low values per encaste but they increase significatively when the lidia breed is considered as a whole and it is similar to the majority of the bovine breeds. The analysis of the genetic variability distribution found high genetic differences between encastes, with a mean FST of 18, and among herds within encastes as showed the high FIS value obtained (FIS=0,11). These results evidence a loss of aleatority in the matings of the animals. An analysis cluster gauged 31 genetics groups. This value was similar to the U.C.T.L. hypothesis. In the majority of the herds, an important percentage of the genome of its animals was assigned to one group. The mitochondrial DNA diversity was high. The haplotype distribution was similar to that seen for other Mediterranean breeds. Two main matrilinegaes was achieved the European and the African ones, corroborated the african bovine influenced in the lidia breed, as mentioned historical information. The African
25
Resumen/Abstract
haplotype frequencies was different between encastes, form 0 to more than 50% in Miura. The Y chromosome microsatellites showed low genetic variability values, as evidenced that the frequency of one haplotype was 75%, and similar to the majority of the bovine breeds. The results evidence a clear fragmentation of the lidia breed in different genetics groups, that mostly match with the units traditionally known as encastes, characterized by a high level of reproductive isolation. The same situation can be achieve to the herds of some encastes.
26
II. INTRODUCCIÓN
Introducción
II.1. ORIGEN DE LOS BOVINOS La clasificación taxonómica del toro de lidia es la siguiente: Tipo: Chordata Subtipo: Vertebrata Clase: Mammalia Subclase: Buteria‐Euteria Orden: Ungulata Suborden: Artiodactilae Familia: Bovidae Subfamilia: Bovinae Género: Bos Especie: Bos taurus Subespecie: Bos taurus hispanicus El antecesor del toro de lidia, raza que pertenece a la especie Bos taurus, es el primitivo Uro (Bos primigenius) (Zeuner, 1963; Grigson, 1978; 1980; Epstein y Mason, 1984; Payne, 1991). En la actualidad se reconocen tres subespecies de Bos primigenius según su localización geográfica, Bos primigenius primigenius en el noroeste de Eurasia, Bos primigenius namadicus en el sureste de Asia y Bos primigenius opisthonomus en África (Payne, 1970; Epstein y Mason, 1984), que son los antecesores de las razas bovinas actuales. Aunque algunos autores postularon que el Bos taurus es una forma modificada del Bos primigenius namadicus, actualmente se reconoce que del Bos primigenius primigenius se originaron los actuales taurinos (Epstein, 1971; Epstein y Mason, 1984), pertenecientes a la especie Bos taurus y del Bos primigenius namadicus los cebuinos, Bos indicus, esta bifurcación se produjo hace unos 100.000 años, mucho antes de que se produjera la domesticación (Bradley y col., 1996; Ronan, 1994). Las primeras evidencias de la domesticación de los bovinos datan de hace 8.400 años y fueron encontradas en un yacimiento del Neolítico en Anatolia (Turquía). Otros autores sitúan el origen de la domesticación hace 8000‐10000 años en el sudeste de los
29
Introducción
Balcanes, basándose en las representaciones artísticas encontradas en restos de cerámica (Reed, 1977; Loftus y col., 1994). El estudio de restos arqueológicos y posteriores análisis de información molecular fechan la bifurcación del Bos indicus y del Bos taurus hace unos 100.000 años (Manwell y Baker, 1980; Baker y Manwell, 1991; Bradley y col., 1994; 1996; Loftus y col., 1994), además de evidenciar un doble origen de domesticación de las dos ramas bovinas, los actuales taurinos en Oriente Próximo y los cebuinos en el Sureste de Pakistán. Posteriores análisis en razas bovinas de África, Europa y Asia evidenciaron una clara separación entre los taurinos y cebuinos, proporcionando mayor veracidad a la teoría del doble origen de la domesticación (MacHugh y col., 1997). A partir de la domesticación los movimientos humanos fueron acompañados de movimientos de los animales influyendo estos procesos migratorios en la actual distribución de las razas bovinas. Los cebúes se extendieron rápidamente por la India favorecidos por su adaptación fisiológica a terrenos áridos (Payne, 1991; Payne, 1970; Epstein y Mason, 1984), además se introdujeron en África por el Istmo de Suez, procedentes de Arabia hacia Somalia y Etiopía. En África ya existía una especie de Uro indígena (Bos primigenius opisthonomus), del que se ha discutido si era una forma africana o se originó a raíz de las primeras poblaciones que llegaron al continente (Epstein, 1971; Epstein, 1984; Payne, 1991), incluso se plantea un tercer origen de domesticación independiente del ganado africano que explicaría las diferencias genéticas entre los taurinos africanos y europeos. (Bradley y col., 1996; Troy y col., 2001). Los taurinos a partir del origen de domesticación rápidamente se extienden a zonas cercanas existiendo evidencias en Chipre alrededor del 8200 a de C. La llegada al continente europeo se produce por las planicies de Tesalia al sur de la Península de los Balcanes en el 7800 a. de C. A partir de aquí los movimientos siguen dos grandes rutas, por un lado la ruta del Danubio que se dirige al norte, a lo largo de los ríos de los Balcanes, llegando a Europa Central y continuando hacia el norte, aprovechando las zonas más apropiadas para la agricultura y ganadería. Y la segunda ruta, llamada la ruta del Mediterráneo, que sigue la costa mediterránea, atravesando el mar hacia las
30
Introducción
islas, los primeros asentamientos se sitúan en los Balcanes y el sur de Italia, llegando hasta Córcega alrededor del año 7900 A.C. y al sureste de Francia (Languedoc) en torno al 7800 a. de C. (Bogucki, 1996; Gkliasta y col., 2003).
Figura 1: Representación del primitivo Uro (Bos primigenius).
La llegada de los bóvidos a la Península, fechada en el año 7700 a. de C. en la costa oriental, se produce por dos vías, la primera desde Europa atravesando los Pirineos y la segunda a partir de las poblaciones originarias de Asia que atraviesan el istmo de Suez entrando en Egipto y expandiéndose hacia el norte, este y oeste de África hasta fusionarse con los cebuinos y por otro lado entran en la Península Ibérica a través del estrecho de Gibraltar, encontrándose con los taurinos que entraron por lo Pirineos (Cymbron y col., 1999; Beja‐Pereira y col., 2003). En un principio la influencia africana en las razas bovinas peninsulares se asociaba a la llegada de los bereberes y la cultura musulmana, no obstante recientemente se han encontrado restos arqueológicos bovinos de origen africano fechados en la edad de bronce (1780 a de C.) lo que fecha dicha influencia en un etapa muy anterior (Anderung y col., 2005). Se han encontrado diferentes formas fósiles derivadas del primitivo Uro que ha originado las actuales razas europeas, en el caso del toro de lidia las más influyentes fueron Bos taurus braquicero, en sus variantes europea y africana, y Bos taurus estrepsiceros (Aparicio, 1944; Sánchez, 1978; Sotillo y col., 1985.)
31
Introducción
II.2. EL TORO DE LIDIA EN LA PENÍNSULA La presencia del toro en la Península se documenta desde el Paleolítico inferior mediante una rica representación de pinturas como las de Altamira en Cantabria, Peña Cándamo en Asturias, Albarracín en la provincia de Teruel o el Barranco de la Gasulla en Castellón.
Es a partir de la Edad Media cuando mejor se documenta nuestra relación con lo que ya podemos denominar el toro de lidia, seleccionándose aquellos animales más rebeldes y agresivos al manejo para la lidia. Esa tendencia del hombre peninsular a enfrentarse con el toro es lo que nos ha diferenciado de otras culturas también muy relacionadas con el ganado bovino. Este tipo de ganado se localizaba fundamentalmente en las grandes extensiones adehesadas de las dos Castillas, Navarra, Aragón y Andalucía donde pastaban numerosas toradas, de las cuales se extraían entre 5 y 30 toros para seleccionar los más bravos y que dieran mayor juego en la lidia. En el siglo XVIII surgen las ganaderías bravas propiamente dichas aunque existen pruebas documentales anteriores de su existencia, como la Real Vacada de Aranjuez. Los ganaderos se empiezan a dar cuenta del interés que despierta la bravura en el ganado y al interés comercial, por su lidia, se une el renombre que obtenían aquellos cuyas reses daban mejor juego en la lidia, por lo que a partir de este momento dedican mayor esfuerzo al fomento y la selección de caracteres relacionados con la bravura del toro y sus caracteres externos es decir ejemplares de hermosa estampa, bravos y poderosos. Las vacadas de estas ganaderías especializadas en la cría del ganado de lidia posteriormente se clasificaron en las castas fundacionales en función de sus diferencias de origen geográfico, morfológico y de comportamiento. Las comarcas con mayor número de ganado destinado a la lidia estaban en Navarra, Castilla y Andalucía y en menor proporción en Extremadura, Aragón y Portugal, existiendo una relación absoluta entre las zonas de cría y las primitivas castas fundacionales originadas
32
Introducción
alrededor de las grandes cuencas fluviales (Figura 2), siendo estas de origen Navarro, Castellano y Andaluz.
Figura 2: Localización geográfica de las castas fundacionales y su representación gráfica en tamaño proporcional.
En el origen de las castas andaluzas, Cabrera, Gallardo, Vazqueña y Vistahermosa influyó considerablemente el ganado frailero (procedente de los diezmos con que los ganaderos pagaban a las congregaciones religiosas), siendo éste de muy diversa procedencia. En el siglo XVIII los conventos y las familias principales realizaban la cría del ganado bravo hasta la desamortización donde el ganado frailero pasa a particulares. Con la casta Navarra existe una marcada influencia del ganado traído por los celtas que se desarrolló en manadas salvajes adquiriendo su condición de bravo. Esta casta constituye una unidad independiente respecto al resto de castas dotándole de una idiosincrasia especial. De la casta morucha castellana no existen muchos datos de interés a pesar de asentarse en una de las zonas con mayor tradición ganadera como es Salamanca.
33
Introducción
Figura 3: Ejemplar de origen Casta Morucha Castellana José Marzal con cruces con Vistahermosa.
Finalmente la casta Jijona, influida por la Real Vacada de Aranjuez en su origen, y Toros de la Tierra que no constituye una casta propia pero tiene un origen común a la casta Jijona situándose en las dehesas del Jarama al pasar por la comarca madrileña. Las actuales ganaderías de lidia proceden de estas siete castas fundacionales: Morucha Castellana, Navarra, Jijona y Toros de la Tierra, Cabrera, Vazqueña, Vistahermosa y Gallardo, cuyas diferencias además de geográficas también hacen referencia a aspectos morfológicos y de comportamiento (Tabla 1). A partir de estas castas fundacionales ya es posible establecer un seguimiento de sucesión de hierros y vacadas algunas de las cuales se han perdido en pureza. La acción de diferentes fuerzas genéticas y de sistemas de manejo basados en el aislamiento reproductivo entre poblaciones de origen común permite agrupar las ganaderías en encastes. Para que una población se considere un encaste, la/s ganaderías que lo formen deben tener un origen genético conocido y aislado del resto de encastes por un período mínimo de 30 años además de caracteres de comportamiento o morfológicos propios (B.O.E. 13 de Febrero del 2001). En el B.O.E. del 13 de febrero del 2001 queda definido el prototipo racial del toro de lidia como el de los diferentes encastes reconocidos.
34
Introducción
Figura 4: Historia genealógica de los principales encastes y ganaderías surgidos de la Casta Vistahermosa.
El proceso de cría y selección del ganado vacuno con el fin de la lidia ha ido conformando a la raza con el paso del tiempo, en el cual también ha influido el desarrollo del toreo y los cambios que ha ido sufriendo a lo largo de los años. Los primeros testimonios de festejos taurinos son de la época de Alfonso X El Sabio (siglo XIII), donde la lidia se realizaba a pié, por los llamados “matatoros” de una manera un tanto anárquica y los festejos se organizaban fundamentalmente en Navarra, Aragón y Pirineos. El toreo a caballo se desarrolla durante lo siglos XVI y XVII destacando el papel de las maestranzas, que lo realizaban como un ejercicio práctico para mejorar las habilidades del jinete y acostumbrarlo a él y al caballo a situaciones de peligro. Aunque durante un tiempo coexisten ambos toreos, a pie y caballo, es en el siglo XVII donde se regulariza todo este proceso finalizando en una lidia metódica dominada por el toreo a
35
Introducción
pié dejando al caballo como una ayuda y apareciendo los banderilleros, picadores y matadores.
Figura 5: Fiesta de toros. Siglo XVII.
Actualmente la cuadrilla está formada por el matador, tres banderilleros y dos picadores, donde destaca el peón de confianza o primer banderillero y la corrida de toros se estructura de la siguiente manera: 1.‐ Paseíllo: Encabezada por los alguacilillos y seguidos por los tres matadores en hilera, los banderilleros, picadores, monosabios y por último el tiro de mulas. 2.‐ Tercio de varas: Se recibe al toro con el capote y se empieza a probar sus cualidades. Posteriormente recibe el castigo de varas. 3.‐ Tercio de Banderillas: Su objetivo es enardecer al toro tras la suerte de varas y deben colocarse por ambos pitones . 4.‐ Tercio de muleta: Aquí se determina el triunfo o el fracaso del torero. Finaliza con la llamada suerte suprema del toreo que es la entrada a matar.
36
Introducción
CASTA
TAMAÑO
FORMATO
CAPAS
ASTAS
NAVARRA
Pequeño
Sin trapío
Colorada la más común, castaña o retinta
MORUCHA
Grandullón
Feo. Rústico. Resistente al frío y a los cambios de temperatura.
Negro, listón, bragada clara.
Cornicortos, veletos Cornivuelto. Cabeza descarnada y estrecha
JIJONA
Gran alzada y peso
Bastos de gran poder y fuerza en los remos
Colorado encendido, castaño y retinto
Buena cornamenta
Ágiles, duros, bravos y codiciosos en el primer tercio, se crecen al castigo, inciertos, reservones y de sentido en el último tercio.
Gran Alzada
Cuello largo, fuerte de patas, poca papada
Negros, bermejos, berrendos, listones, carinegros y coliblancos
Gruesos y desarrollados
Arreciaban su bravura y dureza ante el castigo.
TOROS DE LA TIERRA
COMPORTAMIENTO EN LA LIDIA Bravo, ágil, nervioso, resabiado y de sentido Bravo y con pies de salida, pero blandos
Negros, cárdenos, Bravo, fuerte, poderoso, con facultades, receloso colorados. Ojo de CABRERA Buena alzada Largo, galgueño Bien encornados perdiz, berredo, sardos y de sentido si se lidia mal. y menos jaboneros Negros, cárdenos, Tamaño medio Duros, querenciosos de poder y resistentes; de berrendos en negro VAZQUEÑA Medio Gran trapío entre Cabrera y sentido si se lidiaban mal. Aplomados. De salida castaños. Sardos y Vistahermosa espectaculares jaboneros. Alzada Proporciones correctas, fino en Negros, cárdenos, algún Cornicorto, cabeza Bravura y nobleza en toda la lidia. Es el VISTAHERMOSA moderada, media todo, fuerte colorado en melocotón pequeña prototipo actual Negros, berrendos y GALLARDO Gran alzada Buen trapío castaños. Cárdenos los Bien encornados Bravura y poder hasta el final de la lida de Pablo‐Romero Tabla 1: Descripción de las castas fundacionales.
37
Introducción
II.3. BIODIVERSIDAD En los últimos años se ha producido un interés cada vez mayor en la conservación de la biodiversidad, entendida como la variabilidad de organismos vivos de cualquier fuente. De manera genérica se estima en 10 millones el número de especies de organismos vivos, aunque el rango varía de 2 a 100 millones, de estas un 0,5% son aves y mamíferos de los cuales una cuarentena aproximadamente corresponden a especies de animales domésticos (F.A.O., 1995). En la Península Ibérica, según datos de la F.A.O. (Organización para la Agricultura y la Alimentación) se detallan 198 razas de 12 especies domésticas (Tabla 2) (http://dad.fao.org/) ESPECIES
Nº de Razas
Asno
6
Caballo
14
Cabra
24
Cerdo
20
Conejo
1
Gallina
22
Ganso (doméstico)
2
Oveja
49
Paloma
10
Pato (doméstico)
1
Pavo
2
Vaca
47
Tabla 2: Número de razas domésticas de las principales especies animales.
Algunas de estas razas autóctonas se encuentran en peligro de extinción a pesar de que existen importantes razones para su protección y desarrollo: 1.‐ Razones económicas al ser animales rústicos muy adaptados al medio e idóneos para una ganadería sostenible que aproveche los recursos naturales.
38
Introducción
2.‐ Razones genéticas al ser reservorios de genes que pueden ser de gran utilidad en un futuro. 3.‐ Razones ecológicas y culturales al favorecer el desarrollo demográfico de zonas desfavorecidas. La F.A.O. es el principal organismo internacional encargado de la conservación de los recursos genéticos animales que a su vez es uno de los principales componentes en los programas de conservación de la biodiversidad cuyos objetivos son la conservación de la diversidad biológica, el uso sostenible de sus componentes y el reparto justo y equitativo de los beneficios que genere. Una de las herramientas utilizadas en la consecución de estos objetivos y del mantenimiento de los recursos genéticos es la clasificación de las diferentes razas en categorías para establecer prioridades en función de su estado: Desaparecida, crítica, en peligro, crítica‐ mantenida, en peligro‐mantenida, no en peligro y desconocido. La clasificación está basada en el tamaño de la población en el tamaño total de la población, el número de hembras reproductoras y la tendencia del tamaño de la población (estable, creciente, decreciente). La raza bovina de lidia se encuentra en la categoría de “no en peligro” y presenta una serie de particularidades únicas comparada con el resto de las razas bovinas. En su actual distribución y características han influido los procesos de domesticación y los posteriores movimientos humanos, la situación geográfica de la Península Ibérica al ser el nexo entre el continente europeo y africano, el objetivo de selección basado fundamentalmente en caracteres de comportamiento, el sistema de cría... por citar algunos de los más destacados que han hecho que la raza de lidia presente unas características particulares respecto a otras razas bovinas domésticas. El sistema de explotación es extensivo convirtiéndola en una raza de gran rusticidad capaz de adaptarse a diferentes ambientes, desde provincias frías como Segovia a zonas más templadas como Sevilla y Córdoba. En la actualidad es en Salamanca, dehesas extremeñas y la zona centro oriental de Andalucía donde mayor
39
Introducción
número de ganaderías se ubican, mientras que fuera de la Península Ibérica es en el sur de Francia y Sudamérica. Figura 6: Ejemplar de la ganadería de Juan Pedro Domecq de origen Casta Vistahermosa.
La selección del ganado de lidia además de tener en cuenta aspectos genealógicos y morfológicos, se realiza valorando caracteres de comportamiento como la agresividad, lo que ha marcado su especificidad respecto a otras razas donde dicho comportamiento es un carácter no deseado. Los distintos tipos de festejos que requieren diferentes comportamientos unido a las diferentes maneras de entender la agresividad en la lidia, han favorecido la formación de encastes en la raza de lidia, originados a partir de las castas o “vacadas fundacionales”, que se han mantenido aislados reproductivamente en las diferentes ganaderías o por lo menos en las más destacadas (Sagredo, 1991; http://www.toroslidia.com/) En la actualidad se tienen datos de compra venta de ganado entre ganaderías desde el siglo XIX, lo que permite establecer su “genealogía” y las influencias que han tenido en su formación y evolución. No obstante, de algunas de las vacadas fundacionales se han perdido los descendientes en pureza y algunos de los encastes están representados por una ganadería, como es el caso de Miura o Pablo Romero, o pocas (http://www.toroslidia.com/).
40
Introducción
Figura 7: Ejemplar de la ganadería de Pablo Romero de origen Gallardo.
II.3.1 Diversidad Genética En el estudio de la biodiversidad se pueden considerar tres componentes, diversidad taxonómica, ecológica y genética. La F.A.O. define la diversidad genética como la variedad genética en los distintos recursos génicos animales, por ejemplo, las razas de una especie (Henson, 1992), que a nivel molecular se define como la relación existente entre la diversidad y la cantidad de alelos conservados (Crossa y col., 1993; Smith, 1984). Los análisis de la variación génica pueden proporcionar información de la estructura génica y de la historia evolutiva de las poblaciones.
II.3.1.1 Marcadores de Diversidad Genética II.3.1.1.1 Caracteres Morfológicos El estudio de las diferencias morfológicas en una población se ha utilizado tradicionalmente para la clasificación de las especies, considerando especies distintas a aquellas que mostraban caracteres morfológicos diferenciables entre otras particularidades.
41
Introducción
Los caracteres morfológicos pueden ser agrupados (Sánchez Belda, 1984): 1.‐ Caracteres étnicos generales: Hacen referencia al perfil, tamaño, proporciones, masa y hueso, y las medidas corporales basadas en características del tamaño y proporciones. 2.‐ Caracteres étnicos regionales: Estudia las particularidades regionales del individuo, como son : Cabeza, cuello, tronco y extremidades. Figura 8: Ejemplar de la ganadería Barcial de origen Vazqueño con cruces de Vistahermosa.
En el caso del toro de lidia resulta de especial interés el estudio de determinadas características morfológicas que en otras especies son secundarias, como las astas, además de la coloración de las capas dada la gran variedad de coloraciones aceptadas en el prototipo racial, mientras que en la mayoría de las razas bovinas son restringidas. La combinación de estos caracteres regionales y generales establece el morfotipo y prototipo racial. La problemática principal en el uso de estos caracteres radica en que el morfotipo expresa dos tipos de rasgos, unos más definidos, claros y constantes, que son los étnicos, y otros convencionales, comunes y colectivos a todos los individuos, y por tanto, compartidos con otras razas. Estas descripciones están sometidas a una carga subjetiva importante, que puede llegar a hacer asociaciones filéticas erróneas y en su manifestación además del componente genético existe uno ambiental.
42
Introducción
II.3.1.1.2 Polimorfismos de Naturaleza Proteica A mediados del siglo XX se produjo un gran avance en el desarrollo de técnicas laboratoriales moleculares que facilitaban la identificación de las diferencias bioquímicas de las especies animales. Estas se dividen en dos grupos: a) Grupos Sanguíneos Los grupos sanguíneos son una manifestación directa del genotipo, no están sujetos a influencias ambientales, se heredan de manera mendeliana, son codominantes y se expresan durante todo la vida del animal. b) Polimorfismo bioquímicos Comprenden principalmente las proteínas del plasma sanguíneo, eritrocitos y leucocitos. Las diferentes formas alélicas de la proteínas se evidenciaban mediante técnicas electroforéticas (Harris, 1966; Lewontin y Hubby, 1966).
Aunque en su momento fueron ampliamente utilizados, su declive se inició con la llegada de los marcadores moleculares de ADN debido a las desventajas que presentaban frente a estos, como mayores necesidades de infraestructura laboratorial, complejidad de las técnicas o el escaso polimorfismo que son capaces de identificar.
II.3.1.1.3 Marcadores Moleculares de ADN El desarrollo de la biotecnología durante los 30 últimos años y su aplicación al estudio del ADN ha permitido un gran avance en la identificación de polimorfismos en los genomas de las principales especies domésticas y concretamente en la identificación de marcadores moleculares. Un marcador molecular de ADN es un fragmento de ADN cuya transmisión de una generación a otra es posible seguir (Griffiths, 2007). Se caracterizan por tener una localización cromosómica fija y poder presentar diferentes variantes o alelos que
43
Introducción
determina su elevado polimorfismo, además se deben identificar de una manera sencilla, rápida y económica. Se han convertido en la herramienta más utilizada para estudios filogenéticos, análisis de variabilidad genética en poblaciones, establecimiento de mapas genómicos, así como para el diagnóstico de determinadas enfermedades hereditarias (William Klug, 2005). En mamíferos, aproximadamente el 30% de su ADN corresponde a genes o secuencias relacionadas con ellos, siendo la parte codificante la que se encuentra en menor proporción frente a la no codificante (promotores, intensificadores, pseudogenes,...) (William Klug, 2005). A partir de estimaciones realizadas de los resultados obtenidos con el proyecto genoma humano, el número de genes en mamíferos variaría entre 35.000‐40.000 (Roest y col., 2000; Genome International Sequencing Consortium, 2001; Venter y col., 2001). El 70% restante del ADN es extragénico o no codificante y está representado por secuencias repetidas de manera moderada o alta y por ADN de copia única. Es en este ADN donde se acumula la mayor parte de la variabilidad genética ya que el hecho de presentar un alelo u otro no beneficia ni perjudica al individuo y por tanto no están sometidas a ningún tipo de presión de selección. Son numerosos los marcadores moleculares descritos como los RFLPs (Restriction Fragment Lenght Polymorphisms o Fragmentos de Restricción de Longitud Variable) (Quinn y White, 1987), RAPDs (Random Amplified Polymorphic DNA o Polimorfismos de ADN amplificados de forma aleatoria) (Welsh y McClelland, 1990; Williams y col., 1990) o AFLPs (Amplified Fragment Length Polymorphisms) (Vos y col., 1995), todos ellos caracterizados por no precisar conocimientos previos del genoma a analizar. En estudios poblacionales los marcadores más utilizados son los microsatélites, por sus características, y de más reciente aparición los polimorfismos de un solo nucleótido (Single Nucleotide Polymorphism o SNPs) (Vignal y col., 2002). Los marcadores moleculares se pueden clasificar de diferentes formas en función del criterio que se utilice (Vignal y col., 2002):
44
Introducción
a) Según su localización: TIPO I: Se localizan en zonas codificantes. Muy utilizados para conectar mapas homólogos de diferentes especies o regiones de elevada homología. TIPO II: Localizados en zonas no codificantes b) Según el tipo de variación de la secuencia de ADN: Polimorfismos de un solo nucleótido o SNPs (Single Nucleotide Polymorphism) Inserciones o deleciones que pueden afectar a una o varias bases. Elementos repetidos: Son motivos de ADN que se repiten y varían el número de repeticiones o el motivo de la repetición. c) Según el tipo de acción génica: Dominantes: No son capaces de diferenciar al homocigoto del heterocigoto (RAPD´s). Generalmente son bialélicos Codominates: Diferencian al homocigoto del heterocigoto (microsatélites). d) Según el número de variantes Bialélicos: Presenta dos alelos (RFLP´s y SNPs) Multialélicos: Presentan un número variable de alelos: Microsatélites, minisatélites.
II.3.1.1.3.1 Polimorfismo de un solo nucleótido (Single Nucleotide Polymorphism o SNPs). El polimorfismo de un solo nucleótido se define como el cambio de una base en una posición concreta de un fragmento de ADN. Las diferentes posibilidades determinarán los distintos alelos siempre y cuando la frecuencia del alelo menos frecuente sea igual o superior al 1% (Benjamín Lewin, 2003). Aunque a nivel teórico podemos encontrar cuatro alelos por SNP, correspondientes a los cuatro nucleótidos, la
45
Introducción
baja tasa de sustitución nucleotídica por nucleótido y año en una posición neutra (1 x 10‐9 – 5 x 10‐9) hace que la gran mayoría de los marcadores tipo SNPs sean bialélicos. Representan la variación más común, en el genoma humano se estima que existen 1,42 millones de SNPs (Sachidanandam y col., 2001), con una distribución no homogénea a lo largo del genoma, siendo mayor la frecuencia en aquellas zonas que contienen genes, donde se ha estimado que es de un SNP cada 0,5‐1,2 Kb. (Kruglyak, 1997; Nickerson y col., 1998; Cargill y col., 1999; Halushka y col., 1999; The International SNP Map Working Group, 2001). La mayor parte de los SNPs descritos en bovino provienen del estudio de las secuencias de determinados genes aislados cuyo número está aumentando considerablemente gracias a la secuenciación del genoma de la especie bovina (Taylor y col 2006; Morsci y col. 2006; Liu y col., 2007; Moon y col., 2007; Allan y col 2007;) En un reciente trabajo de identificación de SNPs bovinos a partir de secuencias ESTs (Expressed Sequence Tags) y ARNm (328.550 secuencias) presentes en base de datos públicas (NCBI) se identificaron un total de 523.448 SNPs de los cuales 285.408 los consideran de baja calidad al localizarse dentro de una ventana de 10 pares de bases donde aparecen 3 o más SNPs y por tanto pueden deberse a una baja calidad de la secuencia (Rachel y col. 2004). De los 238.040 restantes un total de 58.747 producían un cambio aminoacídico. Excluyendo los de baja calidad y aquellos que solo aparecían en una ocasión, la frecuencia de transiciones fue de 0,670 y la de transversiones de 0,330 lo que está en concordancia con los datos obtenidos en genes humanos en ese mismo artículo. Los SNPs han sido propuestos en lugar de los microsatélites para la identificación genética y/o controles de paternidad (Fries y col., 2001; Heaton y col., 2002; Werner y col., 2004). Werner y col. a partir de un de screening de 91,13 kb. Encontraron 531 SNPs sobre los que se realizó una selección, junto con 43 previamente identificados, utilizando el siguiente criterio: a) El alelo más raro debía tener una frecuencia superior a 0,1.
46
Introducción
b) Los SNPs no debían de estar ligados. Como resultado se obtuvieron un total de 37 SNPs, uno específico de género, con una probabilidad de compartir el mismo genotipo entre dos individuos de 10‐13 y una potencia de exclusión en controles de paternidad superior al 99,99 %. Su utilidad para realizar mapas genéticos ha quedado reflejado en el cálculo de que 1.000 SNPs bien espaciados con la menor frecuencia alélica superior a 0,2 pueden producir el mismo poder de ligamiento que un mapa de 300 marcadores de tipo microsatélite (Kruglyak, 1999; Brookes y col., 2001), con la ventaja, frente a otros marcadores, de que cubren todo el genoma. Una de las grandes ventajas de los SNPs radica en la posibilidad de automatizar su identificación mediante técnicas de elevado rendimiento y bajo coste, destacando entre otras técnicas los microarrays (Lindroos y col., 2003), la pirosecuenciación (Ronaghi y col., 1996; Wasson y col., 2002), las sondas marcadas con fluorocromos (Tyagi y Kramer, 1996; Marras y col., 2003), sondas Taqman (Livak, 1999; Ranade y col., 2001) o la técnica Primer‐extension o minisecuenciación (Ronaghi 2001). La tendencia es que en un futuro próximo sustituyan a los microsatélites en el análisis de diversidad genética de poblaciones, de compatibilidad genealógica, etc., y un ejemplo es que ya se han propuesto conjuntos estandarizados de SNPs como huellas genéticas para la identificación animal (Fries y col., 2001).
II.3.1.1.3.2. Elementos repetidos La mayor parte del ADN genómico es no codificante y está compuesto por copias únicas o repetidas. Dentro de estas últimas podemos encontrar distintos tipos en función del tipo de repetición, así tenemos aquellas que se repiten de manera dispersa, como los elementos nucleares cortos o largos dispersos (LINES y SINES) o aquellas que se repiten en tándem a partir de un bloque de secuencia simple o moderadamente compleja pudiendo alcanzar grandes longitudes como en el caso del ADN satélite o
47
Introducción
más cortas como los minisatélites y microsatélites. Dada la variedad que se puede identificar en el número de repeticiones entre los diferentes individuos, los elemento repetidos se han utilizado como marcadores moleculares, siendo los microsatélites los más utilizados.
II.3.1.1.3.2.1 ADN Satélite Se denomina así porque tras una centrifugación en gradientes de cloruro de cesio forma una banda “satélite” separada del resto de ADN. Se localiza en el centrómero formando parte de la heterocromatina y en los telómeros (Griffiths, 2002). En el genoma bovino se han descrito varios ADN satélites que en su totalidad comprenden el 12% del genoma bovino. Jobse y col. (1995) describen 7, algunos de los cuales comparten subestructuras como una subunidad de repetición de 31 nucleótidos que se cree fue originada a partir de otra subunidad de 23 nucleótidos. Su configuración actual se origina a través de procesos de recombinación que ha afectado a subunidades de repetición, a SINES (Short Interpersed Nuclear Elements) e incluso microsatélites. El estudio de la evolución de estos elemento ha sido utilizado en trabajos de filogenia en especies próximas de bovinos.
II.3.1.1.3.2.2 Minisatélites Los minisatélites son secuencias de entre 10 y 250 pares de bases repetidas en tándem, que alcanzan una longitud de hasta 20 kb., presentan una elevada tasa de mutación (10‐2 por generación) que depende del número de repeticiones y se localizan en las regiones teloméricas y subteloméricas (Griffiths, 2007). El primer minisatélite descrito fue un monómero repetido de 33 nucleótidos localizado en un intrón del gen de la mioglobina humana (Weller y col., 1984), que permitió la detección de múltiples loci polimórficos cuando fue utilizado como sonda (Jeffreys y col., 1985).
48
Introducción
Se han utilizado para crear el “DNA fingerprinting” o “la huella de ADN”, aunque actualmente se emplean otros marcadores para dicho fin. Su análisis se realiza por técnicas de transferencia, Southern blotting (Southern, 1975), permitiendo el análisis de varios loci simultáneamente. Presenta una serie de dificultades técnicas al ser laboriosa, precisar de una gran cantidad de ADN y ser costosa, lo que unido a la alta tasa de mutación que dificulta la interpretación, standarización y la repetibilidad de los resultados, no favorece la transferencia de información entre laboratorios y plantea problemas en las evaluaciones estadísticas cuando se realiza el estudio de poblaciones (Lewontin y Hartl, 1991).
II.3.1.1.3.3.3. Microsatélites Son repeticiones en tándem de bloques de secuencia de 1 a 6 nucleótidos, la variación en el número de repeticiones da lugar a los diferentes alelos. Se encuentran ampliamente distribuidos por todo el cromosoma excepto en las regiones teloméricas, constituyendo un 0,3% del genoma nuclear. (Tautz, 1989) En función de la secuencia de repetición se diferencian tres tipos: 1.‐ Perfecta: La secuencia repetida no sufre ninguna interrupción, constituyen la mayor parte de los microsatélites (70‐80%) (Weber, 1990; Winterö y col., 1992; Fredholm y Winterö, 1995). 2.‐ Imperfectas: Presentan una interrupción que puede variar de uno a tres nucleótidos, constituyendo el 20 ‐ 30% de los microsatélites. 3.‐ Compuestas: La secuencia repetida en tándem se encuentra interrumpida por otras secuencias repetidas de distinto tamaño, subdividiéndose a su vez esta clase en perfectas e imperfectas. Su porcentaje es minoritario respecto a las otras dos. Las repeticiones de tipo (dC‐dA)n o (dG‐dT)n constituyen la mayoría de las repeticiones dinucleotídicas del genoma de los mamíferos, estimándose que hay de 35.000 a 50.000 distribuidas uniformemente cada 100 Kb. (Hamada y col., 1982; Tautz y
49
Introducción
Renz, 1984; Tautz, 1989; Weber, 1990; Weissenbach y col., 1992). Existe un elevado grado de conservación de microsatélites entre especies próximas, por lo que se pueden utilizar cebadores heterólogos para su amplificación en grupos taxonómicos cercanos (Moore y col., 1991; Stallings y col., 1991). Entre vacuno y ovino pueden utilizarse más de un 60% de cebadores heterólogos (Moore y col., 1991), mientras que en el caso de rata y ratón sólo un 12 ‐ 16% (Kondo y col., 1993). a) Origen del polimorfismo de los microsatélites Existen dos teorías que explican los cambios en el número de repeticiones y por tanto la aparición de nuevos alelos: ‐ Sobrecruzamiento desigual entre cromátidas hermanas en la meiosis. Afecta sobre todo a individuos heterocigotos con tamaños alélicos muy diferentes (Valdes y col., 1993). Provoca una mayor homogeneidad del tamaño entre ambos alelos (Smith, 1976; Harding y col., 1992; Jeffreys y col., 1994) sin cambiar el tamaño medio de los alelos. ‐ Deslizamiento de la polimerasa durante la replicación (Figura 9). Es la teoría más aceptada y se debe al apareamiento incorrecto de las hebras de ADN durante la replicación provocando el deslizamiento o “slippage” de la polimerasa (Levinson y Gutman, 1987a; Levinson y Gutman, 1987b; Henderson y Petes, 1992). En más de un 85% de los deslizamientos se produce la ganancia o pérdida de una unidad de repetición (Weber y Wong, 1993), y en menor proporción afectan a más de un unidad de repetición.
50
Introducción
Figura 9: Deslizamiento de la polimerasa durante la replicación generando una nueva repetición o su desaparición en la cadena de nueva síntesis (en cursiva).
b) Propiedades de los microsatélites Presentan una serie de características que les confieren un grado de preferencia frente a otros marcadores: ‐ Se encuentran ampliamente distribuidas por todo el genoma y de manera más o menos homogénea, uno cada 10 ó 20 Kb. (Edwards y col., 1992; Bowcock y col., 1994; Forbes y Johnson, 1995) ‐ La mayoría tienen un efecto neutro frente a la selección, es decir el hecho de poseer un alelo u otro ni beneficia ni perjudica al individuo. ‐ Su identificación se puede automatizar de manera relativamente sencilla, lo que permite procesar un gran número de muestras en poco tiempo y con bajo coste. Además los resultados se pueden estandarizar y así comparar o intercambiar entre diferentes laboratorios . ‐ Poseen un elevado polimorfismo como consecuencia de una alta tasa de mutación, 10‐3 a 10‐5 (Edwards y col., 1992; Bowcock y col., 1994; Forbes y Johnson, 1995). Esta característica les hace especialmente deseables en el caso de poblaciones donde el nivel de endogamia es alto, o para diferenciar poblaciones estrechamente relacionadas.
51
Introducción
‐ Son marcadores codominantes, de manera que un alelo no enmascara al otro y se pueden identificar simultáneamente en el caso de los individuos heterocigotos. Todas estas ventajas han determinado que actualmente sea el marcador de elección para numerosos estudios genéticos, mapeo genético (Weissenbach y col., 1992, Holmberg y col., 2007; Guziewicz y col., 2007), análisis de ligamiento (Bailey y col., 1997; Sherman y col., 2004; Leonard y col., 2005; Thévenon y col., 2007), análisis de filiación (Edwards y col., 1992; Bicalho y col., 2006), análisis genético de poblaciones (Bruford y Wayne, 1993; Cañón y col., 2001; Beja Pereira y col. 2003; Marletta y col. 2006), etc.
c) Problemática del análisis de los microsatélites En el trabajo laboratorial con los microsatélites es necesario tener en cuenta una serie de aspectos con el fin de evitar errores .
C.1. Presencia de alelos nulos La zona de hibridación de los cebadores puede sufrir variaciones provocando la pérdida de homología con los cebadores impidiendo su unión (Callen y col., 1993; Koorey y col., 1993). Esto produce errores en el genotipado de los individuos al considerar individuos heterocigotos como homocigotos, lo que altera los análisis posteriores que se realicen (Callen y col., 1993; Paetkau y Strobeck 1995; Pemberton y col., 1995). El diseño de una nueva pareja de cebadores evitando la zona alterada soluciona el inconveniente.
C.2. Adición de Adenina a las cadenas amplificadas durante la PCR La polimerasa añade una adenina terminal al final de cada fragmento amplificado durante la PCR, este proceso es imperfecto ya que no se produce en todos los fragmentos por lo que un mismo alelo puede presentarse de dos maneras, es decir con un nucleótido más o menos, lo que complica el análisis (Ginot y col., 1996; Gill y col., 1997). Esta situación se puede solventar aumentado el tiempo final de extensión de la PCR con el fin de que en todos los fragmentos se adicione la adenina final.
52
Introducción
C.3. Productos fantasma o ʹstutterʹ Durante la extensión del motivo repetido del microsatélite en la PCR se producen deslizamientos de la polimerasa generando fragmentos de diferentes tamaños al amplificar distinto número repeticiones, generalmente de 1 a 4 veces más cortos. La imagen que genera este deslizamiento es una escalera de bandas fantasmas o tartamudas o ʹstutterʹ (Murray y col., 1993; Walsh y col., 1996), que puede complicar la determinación de alelos de tamaños parecidos (figura 10). En general la presencia de bandas fantasmas sigue ciertas reglas genéricas como ser más comunes en microsatélites cuya repetición es un dinucleótido, aunque esto puede variar si las repeticiones no son perfectas (Walsh y col., 1996) o ser más intensas al aumentar el número de repeticiones, es decir según se incrementa la longitud del alelo (Murray y col., 1993).
Figura 10: Imagen de un microsatélite obtenida en un secuenciador automático de un individuo heterocigoto. En rojo aparece el tamaño en pares de bases de los alelos y en negro las bandas sombra o stutter bands que corresponden a una, dos o tres repeticiones menos que el verdadero alelo.
C.4. Mutaciones Son la fuente principal de variación y provocan la aparición de nuevos alelos de diferente longitud. Hay una gran variación en las estimas de la tasa de mutación de microsatélites, de 10‐2 eventos por locus y por replicación en sistemas in vivo de Escherichia coli (Levinson y Gutman, 1987b), 10‐4 ‐ 10‐5 en levaduras (Henderson y Petes,
53
Introducción
1992; Strand y col., 1993), a 6 x 10‐6 en Drosophila (Schug y col., 1997), de 10‐3 a 10‐5 en humanos (Dallas, 1992; Edwars, 1992; Hearne y col., 1992; Mahtani y Willard, 1993; Weber y Wong, 1993; Krugliak y col., 1998; Xu y col., 2000; Zhivotovsky y col., 2003), en cualquier caso muy elevada si se compara con la tasa de mutaciones puntuales en genes codificantes.
II.3.1.1.4 Diversidad Genética en el Cromosoma Y En los mamíferos el sexo masculino es heterogamético (XY) respecto al femenino que es homogamético (XX). El cromosoma Y se considera haploide y en él reside la información para la diferenciación testicular y determina la masculinidad mediante un efecto dominante, a través de la acción de un único gen, el SRY (Cai y col., 2006). En ambos cromosomas sexuales, a pesar de sus diferencias, se identifica una región homóloga denominada pesudoautosómica que posibilita el alineamiento de los cromosomas sexuales durante la meiosis (Ellis y Goodfellow, 1989; Rappold, 1993) y por tanto los procesos de recombinación, el resto del cromosoma constituye la región no recombinante. Esta región que en los bovinos representa aproximadamente un 95% del cromosoma (Liu y col. 2003) es de herencia paterna y se transmite en bloque formando un haplotipo que no varía excepto por la acumulación de mutaciones (Cai y col., 2006). Se estima que un 40% del cromosoma Y bovino está compuesto por secuencias repetidas (Mathews y col. 1992). Desde la descripción de los primeros polimorfismos en el cromosoma Y humano (Casanova y col., 1985; Seielstad y col., 1994) se ha producido un enorme incremento de su número, clasificándose en función de sus características de mecanismo mutacional y/o del número de alelos que presentan (Jobling y Tyler‐Smith, 1997; Hurles y Jobling, 2001): 1.‐ Marcadores de evento único de mutación o marcadores bialélicos o polimorfismos binarios: Son los polimorfismos de un solo nucleótido o SNPs y los eventos de inserción/deleción, como los elementos Alu (YAP) (Hammer, 1994). Presentan baja tasa
54
Introducción
de mutación, de 5 × 10‐7 a 2 x 10‐8 por sitio y por generación (Hammer, 1994; Thomson y col., 2000), por lo que se considera que son debidos a eventos únicos o casi únicos en la evolución. Las combinaciones de marcadores bialélicos se llaman haplogrupos y definen líneas estables monofiléticas de cromosomas Y. En el ganado bovino están descritos diversos SNPs en el cromosoma Y. En la base de datos IBISS (Interactive Bovine In Silico SNP Database), se clasifican según su frecuencia de aparición en un total de 23 secuencias analizadas. Incluso se han descrito SNPs específicos de género (Werner y col., 2004) y un polimorfismo en la secuencia del gen SRY que diferencia Bos taurus de Bos indicus (Tanaka y col., 2000) 2.‐ Marcadores multialélicos (Jobling y Tyler‐Smith, 1997): Presentan una tasa de mutación más alta y un mayor número de alelos que los marcadores binarios, y entre estos están los minisatélites y microsatélites. La combinación de la información de marcadores polimórficos a lo largo de una hebra no recombinante constituye un haplotipo. En el ganado bovino se han descrito diferentes microsatélites con distintos grados de polimorfismo (Liu y col. 2003), destacando que aquellos situados en la región pseudoautosómica son más polimórficos (35,3%) que los situados en la región específica del cromosoma Y (19,6%) (Liu y col., 2002; Liu y col., 2003). Desde la década de los 90 en que se iniciaron los estudios del cromosoma Y hasta la actualidad, han sido numerosos los trabajos realizados en poblaciones vacunas (Bradley y col., 1994; Kemp y col., 1994; Hanotte y col., 2000; Verkaar y col., 2004a; Anderung y col., 2007). Muchos de ellos se han desarrollado con el fin de esclarecer la filogenia de los bovinos (Verkaar y col., 2004a, Verkaar y col., 2004b, Nijman y col., 2003,). Estos trabajos están basados principalmente en la identificación de SNPs en secuencias del cromosoma Y, ya que los microsatélites nos pueden ayudar en el estudio del origen de las especies si existen alelos especie‐específicos fijados y esto no siempre sucede. (Edwards y col., 2000., Vila y col., 2003; Verkaar, 2003).
55
Introducción
También se han utilizado para detectar mezcla entre poblaciones, ya que diferentes poblaciones tienden a presentar distribuciones de haplotipos o haplogrupos muy diferentes (Hanotte y col. 2000, Verkaar y col. 2003, ). El análisis de marcadores de tipo microsatélite localizados en el cromosoma Y permite obtener una perspectiva diferente del uso de marcadores autosómicos o del ADN mitocondrial. El estudio de su polimorfismo revela las influencias paternas que ha tenido una raza o población y las frecuencias de los diferentes haplotipos permite analizar las diferencias con otras poblaciones o entre las subpoblaciones que pueden subyacer en una raza. En el estudio del proceso de difusión de los bovinos a través del continente europeo a partir de las poblaciones domesticadas originalmente, se han identificado a través del análisis de secuencias no codificantes del cromosoma Y dos haplotipos que muestran una clara distribución racial y geográfica (Gotherstrom y col., 2005). En las razas del norte del continente se identifica uno de los haplotipos, denominado Y1, y en las del sur el haplotipo Y2. Entre las diversas hipótesis que podrían explicar esta distribución, la más pausible señala que el haplotipo Y1 era el predominante entre los bovinos europeos mientras que los bovinos que llegan al continente desde los orígenes de domesticación portaban el haplotipo Y2. En el norte se produce una introgresión del haplotipo Y1 al cruzarse machos locales con las hembras domésticas, mientras que en el sur no se da esa impronta permaneciendo como mayoriatrio el haplotipo Y2. El estudio de restos arqueológicos han confirmado la presencia del haplotipo Y1 en el continente europeo de manera mayoritaria aunque, para confirmar la hipótesis, sería necesario comprobar su ausencia o baja frecuencia en los orígenes de domesticación (Oriente Próximo) pero el pobre estado de conservación de las muestras arqueológicas allí encontradas no lo ha permitido hasta el momento.
56
Introducción
II.3.1.1.5 ADN Mitocondrial II.3.1.1.5.1 Organización del ADN mitocondrial Las mitocondrias son organelas intracelulares presentes en el citoplasma celular en número variable en cuyo interior presentan una doble hélice circular de ADN. Según la teoría endosimbionte se originaron a partir de bacterias aerobias que se adaptaron a vivir en simbiosis en el citoplasma de un primitivo fagocito, hace 1500 años millones de años, integrándose por tanto en la célula hospedadora y produciéndose una transferencia de genes hacia el genoma nuclear (Strachan y Read, 1996).
Figura 11: Representación del ADN mitocondrial bovino.
El ADN circular de doble cadena de las mitocondrias presenta una serie de particularidades respecto al ADN nuclear, sus genes no poseen intrones, las dos cadenas de ADN se denominan Ligera (L) y pesada (H) siendo una rica en purinas y la otra en pirimidinas y su herencia es exclusivamente vía materna. En los bovinos, como en el resto de mamíferos, contiene 32 genes que codifican para los 22 ARN transferentes, dos para los ARN ribosómicos 12 y 16S, y 13 para enzimas implicadas en la cadena de transporte de electrones, fosforilación oxidativa y producción de ATP (Anderson y col., 1982).
57
Introducción
La secuencia primaria del genoma mitocondrial presenta un bajo número de nucleótidos, lo que se piensa que es el resultado de una fuerte presión para la economía del tamaño del genoma, en el caso del ganado vacuno es de ∼16.338 nucleótidos (Anderson y col. 1982).
II.3.1.1.5.2 La Región de Control o D-loop Es la única región no codificante del ADN mitocondrial y su nombre lo recibe de la estructura que forma durante la replicación el ADN mitocondrial. De los distintos elementos que lo componen destacan dos promotores principales de la transcripción, el origen de replicación de la cadena pesada (OH), dos estructuras en forma de trébol termodinámicamente estables, cajas de secuencias conservadas (CSB) y secuencias conservadas de terminación (TAS) (Chang y Clayton, 1985; Chang y col., 1985; Mignotte y col., 1990). La tasa de evolución de esta región es constante y se estima que en en vacuno es de 1,5 x 10‐7 por posición nucleotídica y año (Bradley y col. 1996; Kim y col, 2003), mientras que en otras especies como en los lobos es de 5 x 10‐8 ‐ 7,1 x 10‐8 (Vilà y col., 1999; Savolainen y col., 2002) y en humanos las estimas la han cifrado entre 1,7 x 10‐8 a 33 x 10‐8 por sitio y por año (Stoneking y col., 1992; Tamura y Nei, 1993; Ingman y col., 2000). Según la secuencia bovina de referencia, la región de control o d‐loop mide aproximadamente ∼909 pb de longitud y se extiende entre las posiciones 15.792 a 16.338 y 1 a 363 (Anderson y col., 1982). Presenta zonas altamente variables entre individuos, presumiblemente debido a la existencia de una menor fuerza selectiva sobre esta región. Se pueden distinguir tres regiones en la región de control o d‐loop (Steinborn y col., 1998): 1. El dominio izquierdo que abarca del nucleótido 15792 al 16158.
58
Introducción
Contiene la región 3´ de la estructura en forma de trébol (15958 a 16086), la secuencia asociada a terminación TAS‐A (16094‐16108) y las zonas de unión de proteínas llamadas mt 5 (16023‐16043) y mt 6 (15996‐16013). Es en el último tercio del dominio izquierdo, iniciándose en el final del motivo mt5, donde reside la mayor parte de la variabilidad observada en este dominio. 2. La región central comprende del nucleótido16159 al 59. Dentro de sus 269 bases podemos identificar de la caja B a la F con un nivel de polimorfismo medio excepto en las cajas B y D. Destaca la presencia de un bloque de secuencias conservadas que comprende del nucleótido 9 al 36, idéntica a la encontrada en cerdos. 3. El dominio derecho se inicia en el nucleótido 60 y finaliza en el 363. Podemos encontrar la zona donde se sitúan los promotores de la cadena pesada y ligera (HSP y LSP), el origen de replicación de la cadena pesada OH que se sitúa dentro de la región 5´ de la estructura en forma de hoja de trébol. Además se identifica una nueva región de unión de proteínas llamada mt4 y dos secuencias diana para el factor A de transcripción mitocondrial. Cabe destacar la presencia del Bloque 1 y del Bloque 2+3 que corresponden a bloques de secuencias conservadas. El bloque 1 corresponde a una zona de unión de proteínas bastante conservado. El boque 2+3, el cual en determinados mamíferos aparece separado y en los artiodáctilos aparece unido, está implicado en la formación de híbridos ADN‐ARN y en el procesamiento del ARN mitocondrial. Los primeros estudios del ADN mitocondrial se realizaron mediante RFLP´s (Avise y col., 1979; Avise y col., 1979a; Brown y Wright, 1979), sentando la base de posteriores estudios que utilizaron el ADN mitocondrial como una herramienta molecular. El paso al análisis de las secuencias del ADN mitocondrial se realizó cuando Kocher y col. en 1989 diseñaron una pareja de cebadores muy conservados en diferentes taxones. La ausencia de recombinación, la herencia exclusivamente materna y la facilidad que ya existía para amplificar el ADN mitocondrial mediante una PCR
59
Introducción
(Reacción en Cadena de la Polimerasa), provocó el desarrollo de una gran número de trabajos como demuestra las gran cantidad de secuencias remitidas a GenBank durante la década de los 90. Debido al hecho de poseer múltiples copias de ADN mitocondrial en la célula su uso se extendió a casos forenses al tratarse de situaciones donde las muestras están muy degradas y en pequeñas cantidades. Se emplea de manera rutinaria tanto en humanos como en animales (Bär y col., 2000; Savolainen y col., 1997; Schneider y col., 1999; Savolainen y col., 2000).
II.3.1.1.5.3 Evolución en el género Bos a partir del estudio del ADN mitocondrial El ADN mitocondrial ha permitido confirmar las evidencias mostradas por los restos arqueológicos en el origen y evolución del género Bos y particularmente de dos de sus ramas, los cebuinos (Bos indicus) y taurinos (Bos taurus) fechando su bifurcación hace unos 100.000 años y su domesticación independiente hace 10.000 años, en Oriente Próximo los taurinos y en el sureste de Pakistán los cebuinos (Loftus y col. 1994; Bradely y col. 1996; Troy y col.2001). En ambos casos un reducido número de haplotipos identificados en los orígenes de domesticación nos permite clarificar las influencias maternas de las actuales razas vacunas (Figura 12). En las razas europeas se han identificado cuatro haplotipos principales (Tabla 3) siendo uno el mayoritario (T3) y otros dos minoritarios (T y T2). Un cuarto haplotipo (T1) se describió por primera vez en razas africanas y aparece con una frecuencia muy baja en las europeas, hecho que ha sido utilizado para plantear un tercer origen de domesticación que se situaría en África (Cymbron y col. 1999; Troy y col. 2001). En las razas de la Península Ibérica dicho haplotipo aparece con una frecuencia mayor, explicado por la proximidad geográfica entre la Península y África y la expansión de los musulmanes por la Península en el siglo VIII, no obstante estudios recientes han identificado dicho haplotipo en restos arqueológicos encontrados en Atapuerca y fechados en el año 1880 antes de Cristo, por lo que se cree que la influencia africana en las razas bovinas peninsulares fue anterior a la expansión musulmana (Anderung y col., 2005; Beja‐Pereira y col., 2006). Recientemente a este grupo de 4 haplotipos se ha unido otros dos, uno correspondería al aparecido mayoritariamente en las razas criollas (T1‐16053C‐16122C‐
60
Introducción
16139T‐16196 o T1*) (Miretti y col., 2002, 2004; Carvajal‐Carmona y col., 2003; Lirón y col.,
2006) originado a partir del africano y que también ha sido descrito en razas españolas y el denominado T4 descrito en razas del Noreste de Asia ( Mongolia, Norte de China, Corea y Japón) (Mannen y col. 2004).
Figura 12: Distribución de los principales halpotipos descritos en el ganado vacuno europeo (T1-T2-T3-T4). Las líneas continuas indican los movimientos de expansión humanos a partir de los orígenes de domesticación y las discontinuas señalan los límites de influencia del ganado africano. El tamaño de los círculos es proporcional a los animales muestreados en cada zona geográfica y la división de cada círculo es proporcional a la frecuencia de cada haplotipo. Imagen tomada del artículo de Beja-Pereira y col. 2006.
El escaso número de líneas maternas observadas al agruparse en 6 haplotipos principales es congruente con el hecho de que el proceso de domesticación ocurriera en un limitado número de regiones. No obstante recientes trabajos utilizando el complejo mayor de histocompatibilidad, de herencia no exclusivamente vía materna como sucede en el caso del ADN mitocondrial, concluyen mediante simulaciones que si la domesticación fue un hecho aislado en pocas regiones, la única manera de justificar la elevada variabilidad del Complejo Mayor de Histocompatibilidad en las razas vacunas (HMC) sería que en los procesos de domesticación estuvieran involucrados un elevado número de animales, lo que resultaría imposible de manejar para la época. Mientras que si la domesticación surgió de manera simultánea en diversos orígenes el número de animales involucrados sería menor y además el hecho de cohabitar con animales
61
Introducción
salvajes facilitaría los cruces entre ambos, domésticos‐salvajes, incrementando la diversidad y explicando de una manera más lógica la elevada variabilidad encontrada en el HMC (Vilá y col. 2005).
POSICIÓN NUCLEOTÍDICA
16042 16050 16053 16057 16093 16113 16122 16139 16185 16196 16255 16302
T3
T
C
T
G
G
T
T
C
G
G
T
G
T
C
T1
T
C
C
T2
C
A
C
T4
C
A
A
T1*
T
C
C
C
T
A
C
Tabla 3: Diferencias nucleotídicas de los principales haplotipos descritos en el ADN mitocondrial bovino.
El estudio del ADN de muestras fósiles pertenecientes al Uro conjuntamente con razas bovinas actuales de toda Europa, África y Oriente Próximo ha mostrado resultados contradictorios respecto al proceso de domesticación. Los primeros análisis con 4 muestras de uro (≅13.000 A. de C.) localizadas en Reino Unido mostraron una nítida separación respecto a las razas bovinas europeas indicando una escasa influencia del Uro, que sería congruente con la idea de que las actuales razas bovinas proceden de la expansión de los bovinos domésticos a partir de un único origen y que en este proceso no se produjo una introgresión con el Uro de la zona. Posteriormente los haplotipos identificados en muestras de la Península Ibérica fechadas en la Edad de Bronce mostraron un mayor parecido con la distribución de los haplotipos de las razas bovinas actuales excepto una, que mostró un gran parecido con las del Uro británico, mostrando una más que posible influencia del Uro local en el ganado doméstico. No obstante los restos arqueológicos no han permitido clasificar de una manera fiable a dicha muestra como animal doméstico o salvaje (Troy y col., 2001; Anderung y col., 2005).
62
Introducción
Recientemente nuevas muestras de Uro localizadas en Italia (Beja‐Pereira y col., 2006), 5 en total, han mostrado una nítida diferencia respecto a las de Uro británico y un mayor parecido a la distribución de los haplotipos de las razas bovinas actuales, lo que haría más pausible la hipótesis de que el proceso de domesticación se produjo simultáneamente en diversos puntos además de producirse la introgresión del uro de la zona con los rebaños domésticos. Además se plantea la posibilidad de que las muestras de Uro británicas no son representativas del primitivo Uro. No obstante cabe destacar que si la influencia del Uro se produjo a través de los machos, al cruzarse con hembras domésticas el macho no dejaría huella genética mitocondrial y su análisis no sería válido para estudiar la introgresión de estas poblaciones (Beja‐Pereira y col., 2006).
63
Introducción
II.3.2 Mecanismos evolutivos que actúan sobre la poblaciones El estudio de un conjunto de marcadores moleculares nos permite, a partir del cálculo de las frecuencias alélicas, caracterizar genéticamente a una población, estudiar su diversidad genética y su parecido a otras poblaciones. Estas características pueden variar con el tiempo por la acción de diferentes procesos que pueden actuar de forma sistemática permitiendo predecir el cambio de las frecuencias en dirección y cantidad, o de forma aletaoria predecibles en cantidad pero no en dirección.
II.3.2.1 Procesos Sistemáticos II.3.2.1.1 Migración o Flujo Genético La migración consiste en el movimiento de individuos de una población a otra distinta provocando una alteración de las frecuencias alélicas que tiende a homogeneizar a las poblaciones afectadas (Eding y Laval, 1999). El grado de variación dependerá de la proporción de migrantes en la población receptora y de las diferencias de las frecuencias alélicas entre ambas poblaciones. El efecto sobre la frecuencia de un alelo (q1) se calcula a partir de la frecuencia de inmigrantes por generación (m) y de los nativos (1‐m), y las frecuencias alélicas de los individuos inmigrantes (qm) y nativos (q0) mediante la siguiente fórmula (Falconer y Mackay, 1996):
q1 = mqm + (1 − m)q 0
II.3.2.1.2 Mutación Las mutaciones se definen como cambios heredables en el material genético. De una manera muy general podemos definir dos tipos de mutación (Griffiths, 2007): a) Cromosómicas: Afectan al número de cromosomas, a su estructura o configuración. b) Génicas: Consiste en la alteración de la secuencia de nucleótidos. Existen diversos tipos como sustituciones, deleciones, inserciones y traslocaciones. Las
64
Introducción
mutaciones nuevas tienen mayor probabilidad de ser perjudiciales que beneficiosas para los organismos, y esto se debe a que son eventos aleatorios con respecto a la adaptación, es decir, el que ocurra o no una mutación particular es independiente de las consecuencias que puedan tener en sus portadores. El efecto de la mutación sobre las propiedades genéticas de una población difiere en función de que el evento mutacional sea único o recurrente. En el primer caso la probabilidad de supervivencia en una población grande es muy baja y por tanto no producirá un cambio permanente en las frecuencias de la población. En el segundo caso el fenómeno causante de la mutación es repetitivo (mutación recurrente) y por tanto los cambios producidos no desaparecerán modificando las frecuencias génicas (Falconer y Mackay, 1996), por lo que la mutación puede constituir una fuerza causante de diferenciación génica entre poblaciones (Eding y Laval, 1999). La tasa normal de mutación en los microsatelites y la región de control del ADN mitocondrial se encuentra entre 10‐2 y 10‐5 por lo que el efecto de las mutaciones sólo será apreciable tras grandes periodos de tiempo (Falconer y Mackay, 1996). El cambio que produce en las frecuencias alélicas en una generación se calcula mediante la fórmula (Falconer y Mackay, 1996):
Δq = μp 0 − νq 0 Siendo μ la frecuencia de mutación de un alelo, ν la frecuencia de mutación contraria y p0 y q0 las frecuencias respectivas de ambos alelos. Se han propuesto varios modelos para explicar las mutaciones neutras: 1. El modelo de alelos infinitos (IAM, Infinite Allele Model), propuesto por Kimura y Crow (1964) y desarrollado posteriormente por Kimura (1968) y Ewens (1972). Un alelo puede mutar a un número infinito de posibles alelos no existentes previamente, con la misma probabilidad, por lo que cada alelo originado por una mutación será
65
Introducción
único. Basándose en este marco Kimura desarrolló la teoría neutral de la Evolución Molecular (Kimura, 1983). 2. El modelo de mutación por pasos (SMM, Stepwise Mutation Model) desarrollado por Ohta y Kimura (1973) y Wehrhahn (1975) y redefinido por Kimura y Ohta (1978). Las mutaciones se producen paso a paso y por tanto un alelo sólo puede mutar a dos estados adyacentes. Cuanta mayor divergencia encontremos entre los alelos mayor número de mutaciones habrán sucedido. 3. El Modelo de dos fases (TPM, Two Phases Model) se basa en la teoría de coalescencia, el cual estudia la varianza en el número de repeticiones debido a diferentes modelos mutacionales e historias demográficas (Di Rienzo y col., 1994), por tanto permite ambos modelos mutacionales, de un solo paso (IAM) o de varios pasos (SMM). 4. Modelo de K alelos: Este modelo define K posible alelos, cada alelo tiene una probabilidad de mutar a otro alelo dependiente de la tasa de mutación y del número de posibles alelos según la fórmula μ/(K‐1) (Crow y Kimura, 1970).
II.3.2.1.3 Selección Sobre las poblaciones pueden actuar dos tipos de selección: la natural que ocurre sin intervención del hombre y favorece a los individuos mejor adaptados al medio y la artificial en la que el hombre selecciona a los individuos que serán los futuros reproductores (Falconer y Mackay, 1996). En cualquiera de las dos situaciones no todos los individuos van a dejar descendencia a la siguiente generación y de los que lo hacen no todos los dejan en la misma proporción, ya que existen diferencias en la viabilidad y fertilidad de los individuos. La selección provoca un cambio en las frecuencias génicas que dependerá de la intensidad de selección y de la frecuencia génica inicial de las poblaciones.
66
Introducción
II.3.2.2 Procesos Dispersivos En poblaciones finitas estructuradas en subpoblaciones, donde no actúan los procesos sistemáticos las frecuencias génicas fluctúan erráticamente de generación en generación, en un proceso denominado deriva genética (Falconer y Mackay, 1996). Las consecuencias de este proceso dispersivo son el aumento de los homocigotos y por tanto una homogeneidad cada vez mayor de los individuos pertenecientes a la subpoblación, además de una diferenciación paulatina de las subpoblaciones. Con el paso del tiempo y debido al aumento de la endogamia la frecuencia de los alelos deletéreos cada vez es mayor provocando una menor adaptación al medio de sus portadores y una disminución de la fertilidad y viabilidad.
II.3.2.2.1 Deriva Genética Dentro de Razas o Subpoblaciones: Endogamia El proceso de deriva genética dentro de las poblaciones tras largos períodos de tiempo provoca un aumento de la endogamia, de tal manera que los individuos de una misma raza o subpoblación cada vez se parecerán más al aumentar los homocigotos y disminuir los heterocigotos. Considerando el mismo número de machos y hembras en la población el aumento de la endogamia dependerá del tamaño de la población y del número de generaciones (Eding, 1996), su cálculo se realiza mediante la fórmula:
1 ⎞ ⎛ Ft = 1 − ⎜1 − ⎟ ⎝ 2N ⎠
t
donde Ft es la endogamia de una raza en la generación t, siendo t el número de generaciones y N el tamaño de la población (Falconer y Mackay, 1996). En genética poblacional resulta de mayor interés estudiar el aumento de endogamia de generación en generación, que viene determinado por la fórmula:
ΔF = 1 2N
67
Introducción
Siendo N el tamaño de la población. En las poblaciones el número de machos y hembras no siempre es igual y no todos contribuyen de la misma manera a la siguiente generación. En esa situación en vez de utilizar el término tamaño de una población, que no tiene en cuenta dicha diferencia, se utiliza tamaño efectivo de una población que depende del número de machos y hembras y los descendientes que dejan a la siguiente generación (Kimura y Crow, 1964; Wright, 1969):
1 1⎛ 1 1 ⎞ ⎟ = ⎜⎜ + Ne 4⎝ Nmachos Nhembras⎟⎠ Por tanto el aumento de la endogamia de generación en generación calculado a partir del tamaño efectivo de una población viene dada por la expresión :
1 1 ΔF = 1 = + 2 Ne 8 Nmachos 8 Nhembras Como consecuencia de este aumento de la endogamia se produce una depresión consanguínea, definida como la disminución en la media fenotípica de un carácter debido a la endogamia, siendo aquellos caracteres relacionados con la eficacia biológica (viabilidad, fertilidad) los primeros en verse afectados.
II.3.2.2.2 Deriva genética entre razas o subpoblaciones: Estadísticos F de Wright Las fluctuaciones de las frecuencias génicas conllevan la pérdida o fijación de alelos diferentes en cada una de las razas o subpoblaciones, provocando una disminución de la diversidad genética entre razas y un aumento entre ellas. Wright en 1965 desarrolló la teoría de los índices de fijación o estadísticos F de Wright, que mide mediante el cálculo de tres parámetros FIS, FIT y FST la pérdida de heterocigosis como consecuencia de la estructura de la población en subpoblaciones y por tanto es una
68
Introducción
medida de la diversidad genética entre subpoblaciones, utilizando la siguiente expresión:
(1 − FIT ) = (1 − FIS ) − (1 − FST ) Donde FIT es la variabilidad genética total, FST es la variabilidad genética debida a diferencias entre subpoblaciones y FIT representa la variabilidad genética debida a diferencias dentro de las subpoblaciones (Wright, 1969).
II.3.3 Distancias Genéticas La caracterización genética de las poblaciones o de los individuos o de manera genérica de los OTUs o Unidades Taxonómicas Operativas (OTUs, Sokal y Sneath, 1963) nos permite calcular la distancia genética entre ellos y representarla espacialmente mediante métodos de agrupamiento. Según Eding y Laval, (1999), es deseable que una distancia matemática cumpla alguna de las siguientes propiedades: a) La distancia entre una población y ella misma es necesariamente cero: d(X,X) = 0 b) La distancia entre dos poblaciones X e Y debe ser simétrica: d(X,Y) = d(Y,X). Si una distancia satisface ambas condiciones se denomina distancia semi‐métrica. c) Desigualdad triangular: la distancia entre dos poblaciones X, Y debe ser menor o igual a la distancia de la población X a Z más la distancia de la población Y a Z: d(X,Y)≤ ⎨d(X.Z)+d(Y,Z)⎬. Si una distancia cumple las tres propiedades se denomina distancia métrica (Katz, 1986). En los marcadores neutros, como son los microsatélites donde los diferentes alelos no benefician ni perjudican al individuo que los porta, los cambios en las
69
Introducción
frecuencias alélicas son debidos fundamentalmente a la deriva genética y la mutación, siendo las causas que diferencian las poblaciones o Unidades Taxonómicas Operativas (OTUs, Sokal y Sneath, 1963). En el estudio de las razas los tiempos de divergencia son relativamente cortos por lo que las variaciones de las frecuencias alélicas en las poblaciones se deben fundamentalmente a la deriva genética ya que a las mutaciones necesitan que pasen un mayor número de generaciones para alterarlas. Estos aspectos es necesario considerarlos en la elección de la distancia, utilizando la más apropiada en cada estudio en función de la fuente de variación que consideren.
II.3.3.1 Modelo Mutacional Asumiendo que las razas se encuentran en equilibrio, después de un elevado número de generaciones, el coeficiente de endogamia tendrá la siguiente expresión:
F∞ =
1 1 + 4 Nμ
donde N es el tamaño efectivo de la raza y μ la tasa de mutación, expresado como el número de mutaciones por individuo y por locus en cada generación. De esta expresión se deduce que para que la mutación produzca divergencias entre poblaciones debe transcurrir un gran número de generaciones.
II.3.3.2. Modelo de Deriva Genética El modelo de deriva genética, contrario al anteriormente expuesto de mutación, no tiene un coeficiente de endogamia fijo, siendo su valor después de t generaciones desde la coalescencia de:
1 ⎞ ⎛ Ft = 1 − ⎜1 − ⎟ ⎝ 2N ⎠
t
donde N es el tamaño efectivo de la raza y t el número de generaciones.
70
Introducción
Algunas de las distancias o índices de similitud que asumen que la deriva es la principal causa de diferenciación entre subpoblaciones, son las siguientes: ‐ La distancia mínima de Nei (DM) (Nei, 1973), cuya importancia radica en que la distancia genética esperada entre 2 poblaciones es una función de los respectivos coeficientes de endogamia (F1+F2) en estas. ‐ La distancia de Reynolds (DR) (Reynolds y col, 1983) es una medida basada en la distancia mínima de Nei (1973) normalizada por la estimación de la heterocigosis en la población fundadora, donde el valor de la distancia genética es función de (F1+F2)/2. ‐ La distancia FST (Wright, 1965), basada en el estadístico FST de Wright (Wright, 1951),
F = 1 − H = 1 − ∑ pi p j i≠ j
es una de las más utilizadas a la hora de estimar la diversidad genética. Nagylaki, (1998) expresó esta medida de variabilidad genética en términos de heterocigosis, según la expresión: donde pi y pj son las frecuencias alélicas de un locus en la raza estudiada. Este mismo autor comprobó que si cada una de las poblaciones era separada del resto, aumentaba la endogamia en cada una de ellas, así como la fijación de alelos. Estos alelos eran diferentes entre cada población, motivo por el cual aumentaba la diversidad genética entre poblaciones. En estos casos, propuso el cálculo del estadístico FST para el conjunto de las subpoblaciones mediante la expresión:
H ST = 1 − FST =
71
HS HT
Introducción
donde Hs es la media de heterocigotos esperados en una población y HT es la heterocigosis esperada en el total de las poblaciones, calculada a partir de todas las frecuencias poblacionales (Nagylaki, 1998). Eding y Laval (1999), tras analizar los parámetros en los que se basan las distancias más importantes para el análisis de poblaciones, propusieron una serie de opciones para elegir la medida de distancia genética más apropiada en cada caso: 1.‐ Cuando el análisis se realiza entre especies, cuyo tiempo de divergencia es largo (especiación), las principales causas de cambios genéticos son la deriva y la mutación, siendo más apropiado utilizar aquellas distancias que contemplen estos fenómenos, como ocurre con las distancias de Cavalli‐Sforza, distancia de Nei, distancia estándar de Nei y distancia de Goldstein. 2.‐ Si el material de trabajo son razas de distribución mundial, los tiempos de divergencia serán medios, siendo la mutación y la deriva las fuerzas genéticas causantes de la diversidad encontrada. En estos casos las distancias más apropiadas serán aquellas que ponderen estos fenómenos, coincidiendo con las indicadas en el apartado anterior. En el caso de poblaciones de un mismo tronco originario (objeto de nuestro estudio) o de ámbito de distribución geográfica próximo, los tiempos de divergencia son muy cortos, por lo que los fenómenos mutacionales no deberían ser tenidos en cuenta al no ser detectados. Las distancias más adecuadas para el estudio de estas razas serán aquellas que, ignorando los fenómenos mutacionales, consideren que la causa de la diferenciación genética es la deriva genética. La matriz de distancias y los algoritmos utilizados en la representación racial además del programa informático que los implementan, tiene una gran influencia en
72
Introducción
las topologías que se obtengan (Behara y col., 1998), por tanto es necesario seleccionar aquellas que mejor se adapten a las características de la población a analizar.
II.3.4 Árboles de Distancias Los árboles de distancia o dendrogramas son representaciones gráficas de la matriz de distancias entre OTUs que permiten realizar inferencias a cerca de las relaciones genéticas. Existen diferentes métodos de agrupamiento: 1.‐ Unweighted Pair Group Method Arithmetic (UPGMA) (Sneath y Sokal, 1973) Este método define la distancia entre grupos como la medida de todas las distancias por parejas para los miembros de los dos grupos asumiendo una tasa de evolución constante para las diferentes líneas comparadas y así genera unas representaciones gráficas que muestran la evaluación de la diversidad de una forma más clara. El proceder de este método es el siguiente: a partir de una matriz de distancias entre OTUs se eligen los dos entre los que existe menor distancia (A‐B) y se calcula la distancia que existe entre cada uno de estos dos con un tercero (en función de los valores de la matriz de distancias inicial). Este proceso se repite hasta completar los cálculos con la totalidad de los OTUs. La longitud de las ramas del árbol resultante es la suma de la distancia entre cada dos OTUs. 2.‐ Neighbour‐Joining (NJ) o método del vecino más próximo (Saitou y Nei, 1987). Este método asume que la evolución depende de diferentes factores, entre los que se encuentra el tamaño efectivo de cada OTU, puesto que cabe esperar que las fuerzas que actúan en una generación afecten a las generaciones siguientes (Nei, 1991). Las agrupaciones proporcionadas pueden ser aditivas cuando la distancia entre cada par de taxones sea la suma de la longitud de los brazos cercanos en los que se encuentran representados, siendo por tanto un método apto para la estimación de relaciones filogenéticas entre OTU´s.
73
Introducción
II.3.5 Representaciones Network El proceso evolutivo mediante la recombinación entre genes, hibridación entre líneas y homoplasia, genera relaciones entre las poblaciones que no representan los métodos tradicionales de filogenia basados en árboles bifurcados ya que, frecuentemente, las genealogías de poblaciones están multifurcadas, donde coexisten los genes descendientes con sus ancestros y los eventos de recombinación pueden producir relaciones reticuladas (Posada y Crandall, 2001). Para su representación gráfica se han desarrollado diversos análisis de redes o Network, que tienen en cuenta estos fenómenos a nivel de población y permiten estimar la filogenia y evolución intraespecífica. El método Network es una representación donde se conectan nodos que muestran la información de cada estado genético presente en la población, siendo el principal interés de sus aplicaciones. Así, se han empleado para determinar recombinaciones, delimitar especies, inferir modos de especiación, partición de la historia y estructura de la población y estudiar las asociaciones entre fenotipos y genotipos (Posada y Crandall, 2001). Estas representaciones pueden detectar la persistencia de haplotipos ancestrales en la población, ya que cuando un haplotipo muta no es probable que lo hagan todas las copias del haplotipo o se extingan rápidamente, por tanto un solo haplotipo ancestral da lugar a múltiples descendientes, lo que queda representado como un árbol de haplotipos con multifurcaciones. Así, la teoría de la genética de poblaciones predice que el haplotipo más antiguo está asociado con el mayor número de haplotipos descendientes. Además representan mucha de la información genealógica presente ya que se muestran nodos ancestrales persistentes, multifurcaciones y reticulaciones, teniendo en cuenta el fenómeno de poblaciones. Por ejemplo, la presencia de bucles en el gráfico puede indicar un fenómeno de recombinación, homoplasia y de forma precisa, la ocurrencia de mutaciones reversas o paralelas. En el ganado vacuno esta metodología se ha aplicado en numerosos trabajos cuyo objetivo se ha centrado en esclarecer la filogenia del género Bos y analizar la distribución de haplotipos de una raza o de un conjunto de razas de uno o varios continentes (Troy y col., 2001; Beja‐Pereira y col., 2006; Anderung y col., 2007).
74
Introducción
II.3.6 Análisis Factorial de Correspondencia Otro procedimiento alternativo para cuantificar la diversidad genética entre razas es la utilización de un análisis clásico multivariante como el Análisis de Factorial de Correspondencia (Lebart y col., 1984), que permite estudiar una variable cualitativa a explicar (raza) en función de otras variables explicativas (alelos), donde los diferentes loci se consideran no ligados (Lebart y col., 1995) y en el que el término de inercia puede ser asimilado al de diversidad. En este análisis, la distancia entre dos razas es la media cuadrática de las distancias obtenidas dentro del análisis de correspondencia efectuado para cada sistema alélico. Este método, también se denomina dentro de un contexto de discriminación, análisis discriminante baricéntrico (Lebart y col. 1995). La medida de la inercia de la variable (raza) puede ser equiparable a la diversidad que aporta al conjunto de razas analizadas (Lalöe y col., 1999). Como resultado se obtiene la relación entre razas y alelos, permitiendo localizar rápidamente aquellos más representativos dentro de una o varias razas, así como clasificar los sistemas genéticos en función de la importancia de su inercia. Su representación da lugar a la unión de las poblaciones mediante un sistema de puntos situados en un espacio euclidiano.
II.3.7 Análisis de la estructura de las poblaciones En el análisis de la diversidad genética de un conjunto de animales, generalmente se parte de una estructura predefinida formada por una o varias poblaciones integrada/s por un conjunto de individuos. La estima de las frecuencias alélicas de una muestra de la población nos permite analizar el grado de relación entre diferentes poblaciones y con las herramientas adecuadas, asignar individuos de origen desconocido a una u otra población. Los resultados obtenidos dependen de la
75
Introducción
estructura de las poblaciones inicialmente definida, lo que en ocasiones plantea ciertas dificultades ya que un individuo se incluye en una u otra población basándose en criterios geográficos, morfológicos,...que no tienen porque coincidir con criterios genéticos, pudiendo separar en poblaciones distintas individuos que en términos genéticos se incluirían en una misma población o viceversa. Utilizando la información molecular (microsatélites, RFLP´s o SNPs) Pritchard y col. (2000) desarrollaron un método no supervisado que estima el número de orígenes genéticos diferentes que mayor verosimilitud daría a los resultados obtenidos. Además permite calcular qué porcentaje de genoma de los individuos proviene de cada uno de los orígenes genéticos lo que permite agrupar a los animales en función de un origen común. Los resultados obtenidos se pueden representar gráficamente, de manera que cada animal corresponde a una barra vertical en la que el porcentaje de genoma que tiene de cada grupo ancestral aparece con un color distinto. Al representar a todos los individuos de la población se puede observar, cuántos grupos ancestrales han influido en la formación de la población y en qué proporción (Pritchard y col. 2000; http://www.cmb.usc.edu/~noahr/distruct.html). El porcentaje de genoma que cada población tiene de los grupos ancestrales es posible transformarlo en distancias que pueden ser representadas gráficamente con las metodologías antes descritas. Esta metodología ha sido ampliamente utilizada tanto para el análisis de mixtura de poblaciones, para el análisis de la diversidad genética de las poblaciones como en la asignación de individuos a poblaciones (Cañón y col., 2006; Handley y col. 2007, Peter y col., 2007).
76
III. OBJETIVOS
Objetivos
1.‐ Analizar la distribución de la variabilidad genética de la raza de lidia utilizando tres fuentes de información, microsatélites autosómicos, microsatélites localizados en el cromosoma Y y ADN mitocondrial. 2.‐ Establecer las relaciones genéticas entre las ganaderías y agruparlas en encastes. 3.‐ Análisis de las líneas maternas y paternas que han influido en el proceso de formación de la raza de lidia y sus frecuencias en las ganaderías analizadas.
79
IV. MATERIAL Y METODOS
Material y Métodos
IV.1. RECOGIDA DE MUESTRAS La recogida de muestras fue realizada por la Unión de Criadores del Toro de Lidia (U.C.T.L.) a través de sus veterinarios. La estructura de la población fue definida por los técnicos de la U.C.T.L. agrupando a las ganaderías en función de su origen y evolución en diferentes encastes que no coinciden estrictamente con la estructura publicada en el B.O.E. (Tabla4). En el diagrama de la siguiente página se representa el trabajo desarrollado.
IV.2. METODOLOGÍA LABORATORIAL IV.2.1 Extracción de ADN La extracción de ADN se realizó a partir de las muestras de sangre remitidas por los veterinarios de las diferentes ganaderías incluidas en el muestreo: a) Preparación del pellet: 1.‐ En un eppendorf añadir 1 mililitro (ml.) de sangre y 1 ml. de T10E10 (Tris‐HCl pH=7,5 10 mM; EDTA 10 mM). 2.‐ Centrifugar 5 minutos a 10.000 R.P.M. y descartar el sobrenadante. 3.‐ Realizar un nuevo lavado con T10E10. 4.‐ Añadir 1 ml. de T10E1 (Tris‐HCl pH=7,5 10mM; EDTA 1 mM) y agitar hasta disolver el pellet. 5.‐ Centrifugar 5 minutos a 10000 g. y descartar el sobrenadante. b) Digestión con proteinasa K: 6.‐ Añadir 250 microlitros (μl) de NDB (NaCl 3M; EDTA 0,1 M). Agitar hasta disolver el pellet. 7.‐ Añadir 12, 5 μl. de SDS al 10% y 10 μl. de proteinasa K (10 mg/ml) 8.‐ Mezclar suavemente por inversión e incubar a 37ºC dos horas. 9.‐ Añadir 10 μl. de proteinasa K e incubar a 37ºC toda la noche. c) Extracción orgánica 10.‐ Añadir 250 μl. de fenol y 250 de cloroformo‐ácido alcohol isoamílico (24:1). 11.‐ Agitar 30 segundos y centrifugar a 10000 r.p.m. durante 5 minutos. 13.‐ Recuperar la fase superior.
83
Material y Métodos
RECEPCIÓN DE LAS MUESTRAS 29 encastes – 76 Ganaderías 2580 animales
EXTRACCIÓN DE ADN
AMPLIFICACIÓN POR
ADN MITOCONDRIAL SECUENCIACIÓN 2 FRAGMENTOS (521 nt.)
517 animales
ENSAMBLADO DE LAS SECUENCIAS
P. C. R.
24 MICROSATÉLITES AUTOSÓMICOS 1683 animales
GENOTIPADO DE LAS MUESTRAS
ANÁLISIS DE LOS DATOS
RESULTADOS
DISCUSIÓN 84
5 MICROSATÉLITES CROMOSOMA Y 832 animales
GENOTIPADO DE LAS MUESTRAS
CASTA
ENCASTE
GANADERÍA/S
MUESTRAS
SECUENCIACIÓN
AUTOSÓMICOS
CROMOSOMA Y
CABRERA GALLARDO
Miura Pablo-Romero Línea Concha y Sierra Línea Veragua Braganza
51 67 50 32 25 30 30 30 30 30 30 30 12 26 30 27 27 30 30 33 30 22 42 38 32 31 32 23 30 30 23 31 30 32 30 30 50 30 30 30 30 30 30 51 30 29 51 35 33 38 30 30 30 30 30 31 63 21 29 31 30 30 61 52
14 10 16 14 7 4 6 4 5 4 4 4 3 4 4 8 4 7 4 4 4 3 4 3 4 5 5 2 4 4 10 11 9 4 8 8 14 4 4 4 4 7 8 13 8 8 16 4 4 4 4 4 3 3 4 2 15 7 8 7 7 8 15 15
47 50 49 32 25 15 19 6 15 18 16 16 11 8 16 15 16 30 30 12 12 12 16 16 15 20 20 16 16 16 23 26 16 15 25 24 31 15 15 15 15 26 13 51 26 25 50 12
Cuadri Araúz de Robles
UFT UGU UJJ UHQ UGW UHD UCM UGF UIO UHB UIM UAS UNQ UFY UFZ UFB UKA UFD ULX UDK UKP-UJV UET UHH UBB UNA ULB ULS UES UNN UEI UAC UIJ-UDA UBF UEM UBD UCK UBQ-UGL UJK UCC UEH UDB UCD ULI UGT-UKI UJQ UGD UAD-UGE UAE UHT UKD UCF UGI UEA UDI UDJ UBU-UCU UHG UED UFH UCN-UBG UAL UNG UCJ UFO
12 12 10 20 10 10 12 50 26 26 20 20 20 50 52
23 27 23 16 15 7 9 4 7 8 8 8 5 4 8 9 7 15 8 6 6 6 8 8 8 10 10 8 8 10 8 8 8 8 13 13 5 8 8 7 7 13 13 26 13 12 25 6 6 6 6 5 10 5 5 7 25 13 13 10 10 10 25 27
Línea José Marzal
UHP
50
15
50
25
UIT UAT UFP ULQ UGG UFC UIL UJM UFW UIP UIV
54 30 50 40 34 31 29 50 13 34 34
3 4 4 3 5 4 4 15 9 14 15
15 15 16 16 18 18 18 50 11 32 46
8 8 8 7 9 11 9 25 7 7 25
VAZQUEÑA
Murube
Contreras
Saltillo
Santa Coloma
Marqués de Albaserrada Urcola Gamero-Cívico VISTAHERMOSA
Pedrajas Conde de la Corte
Juan Pedro Domecq
Atanasio Fernández
Carlos Nuñez
Antonio Pérez Baltasar Iban Marqués de Villamarta
CRUCES CON CASTA MORUCHA CASTELLANA
Hidalgo Barquero CRUCES DE CASTA VAZQUEÑA Vega-Villar
CRUCES CON CASTA JIJONA
Torrestrella Línea María Montalvo Línea Manuel Arranz Línea Félix Gómez
Tabla 4: Descripción del muestreo realizado y de las muestras analizadas para cada marcador molecular analizado.
85
Material y Métodos
14.‐ Repetir el lavado con fenol‐cloroformo/ácido alcohol isoamílico. 15.‐ Recuperar la fase superior y añadir 500 μl. de cloroformo/ácido alcohol isoamílico. 16.‐ Centrifugar 5 minutos a 10000 R.P.M. 17.‐ Recuperar la fase superior. c) Precipitación del ADN 18.‐ Añadir 40 μl. de NaCl 3M. (pH=5,2). 19.‐ Añadir etanol 100% (‐20ºC) . 20.‐ Mezclar suavemente por inversión. 21.‐ Incubar a –20ºC durante 1 hora. 22.‐ Recoger el ovillo de ADN y hacer un lavado con etanol 70%. 23.‐ Disolver el ovillo de ADN en 500 μl. de TE 0,1X (Tris‐HCl pH=7,5 10mM; EDTA 1 mM).
IV.2.2 Medida de la Concentración del ADN y Visualización Una vez resuspendido el ADN se realizó una medición de la densidad óptica de una alícuota de la extracción a una longitud de onda de 260 nm. en un espectrofotómetro. Una unidad de densidad óptica corresponde a una concentración de ADN de 50 μg/ml. La concentración del ADN extraído se calculó mediante la siguiente fórmula:
[ADN]= A260 x 50/d A260 = Absorbancia a 260 nm. d = Dilución Una alícuota de la extracción se visualizó mediante una electroforesis horizontal en un gel de agarosa (MB Agarosa, Biotools, España) al 1%, sumergido en TBE (Tris‐ HCl 90mM; Ac. Bórico 90 mM; EDTA 2mM pH=8). Previamente a la carga en el gel se añadió tampón de carga a las diferentes muestras (40% de sacarosa; 0,25% de azul de bromofenol) (Sambrook y col., 1989). La electroforesis se realizó a una corriente constante de 80 V. Para la visualización del ADN se añadió bromuro de etidio (0,4 μg/ml) al gel y tras la electroforesis se expuso a la luz ultravioleta.
86
Material y Métodos
Una vez realizado todo el proceso de extracción y visualización del ADN, se preparó una alícuota de 100 μl. a una concentración de 10 ng/μl y el resto se conservó a –20ºC.
IV.2.3 Amplificación de los fragmentos de ADN La Reacción en Cadena de la Polimerasa (PCR; Polymerase Chain Reaction) (Saiki y col. 1985; Mullis y Faloona, 1985) permite la amplificación in vitro un fragmento de ADN diana a partir de una muestra de ADN genómico. Las condiciones de la reacción variaron en la amplififcación del ADN mitocondrial, de los microsatélites autosómicos y del cromosoma Y.
IV.2.3.1 Amplificación de los microsatélites autosómicos La elección de los microsatélites autosómicos se realizó entre los disponibles en el laboratorio y los seleccionados por la bibliografía según su localización cromosómica y polimorfismo (Tabla 5). LOCUS BM1824 BM2113 INRA23 RM188 ETH10 BM143 ILSTS006 HEL9 ETH225 INRA37
CROMOSOMA 1 2 3 4 5 6 7 8 9 10
BMS2057
12
REFERENCIA Bishop y col., 1994 Beever y col., 1994 Vaiman y col.,1994 Barendese y col., 1994 Solinas y col., 1993 Bishop y col., 1994 Bishop y col., 1994 Bishop y col., 1994 Steffen y col., 1993 Vaiman y col.,1994 Stone y col., 1997
AGLA32 13 Georges y col., 1993 CSSM066 14 Barendese y col., 1994 HEL1 15 Bishop y col., 1994 INRA35 16 Vaiman y col.,1994 TGLA53 16 Georges y col., 1993 ETH185 17 Barendese y col., 1994 TGLA227 18 Georges y col., 1993 ETH3 19 Solinas y col., 1993 TGLA126 20 Georges y col., 1993 HEL5 21 Barendese y col., 1994 TGLA122 21 Barendese y col., 1994 HAUT24 22 Barendese y col., 1994 DRB 23 Andersson y col., 1988 Tabla 5 : Referencias de los microsatélites amplificados.
87
Material y Métodos
En total se seleccionaron 24 microsatélites repartidos por los diferentes cromosomas. En el caso de que en un mismo cromosoma coincidieran 2 ó más marcadores se intentó que estuviesen lo más alejados posible. La amplificación por PCR de los microsatélites se realizó mediante una multiplex que permite amplificar en una PCR más de un fragmento, en este caso microsatélite. Previamente es necesario optimizar la combinación de los microsatélites en cada reacción. Los 24 microsatélites se combinaron en 7 múltiplex (Tabla 6 y 7).
Múltiplex 1
ADN ADN Polimerasa
Cebadores
dNTPs MgCl2 Buffer
Múltiplex 2
10 ng 0,4 U 3,5 pMol CSSM066 8 pMol ILSTS006 7 pMol HEL9 3 pMol BM143 4 pMol INRA35 200 μM 2 mM 1 x
10 ng 0,4 U 2,5 pMol BM1824 2 pMol ETH185 3 pMol TGLA122 4 pMol INRA37
Múltiplex 3
Múltipex 4
10 ng 0,4 U
10 ng 0,4 U
4 pMol TGLA53 4 pMol BMS2057 4 pMol HAUT24 4 pMol RM188 2 pMol TGLA126 2 pMol BM2113
200 μM 2 mM 1 x
200 μM 2 mM 1 x
200 μM 2 mM 1 x
Volumen final 10 μl 10 μl 10 μl Tabla 6: Condiciones de las múltiplex realizadas para la amplificación de los microsatélites.
ADN ADN Polimerasa
Cebadores(1)
dNTPs MgCl2 Buffer
Múltiplex 5 10 ng 0,4 U 5 pMol HEL1 2 pMol AGLA232 1 pMol HEL5 200 μM 2 mM 1 x
Múltiplex 6 10 ng 0,4 U 3 pMol DRB 3 pMol TGLA227 2 pMol INRA23 2 pMol ETH10 2 pMol ETH225 200 μM 2 mM 1 x
10 μl
PCR 7 10 ng 0,4 U
5 pMol ETH3
200 μM 2 mM 1 x
Volumen final 10 μl 10 μl 10 μl Tabla 7: Condiciones de las múltiplex realizadas para la amplificación de los microsatélites.
88
Material y Métodos
El programa de la PCR para las diferentes multiplex fue el siguiente: 94ºC 5 minutos 94ºC 40 segundos Tª hibridación 40 segundos 72ºC 40 segundos
Tª Hibridación
30 ciclos
72ºC 20 minutos 15ºC indefinido
Múltiplex 1 58ºC Múltiplex 2 58ºC Múltiplex 3 55ºC Múltiplex 4 55ºC Múltiplex 5 55ºC Múltiplex 6 58ºC PCR 7 65ºC
IV.2.3.1.1 Electroforesis capilar Una vez finalizadas las PCRs se realizó una electroforesis capilar en un secuenciador automático ABI Prism® 3100 Genetic Analyzer (Applied Biosystem, Estados Unidos). Para ello es necesario marcar con fluorocromos los productos PCR, en función del tamaño del fragmento amplificar de tal manera que la combinación de colores y tamaños permita en el menor número de carreras la electroforesis de todos los fragmentos. Dos carreras por individuo fueron suficientes para visualizar los 24 microsatélites amplificados. De cada PCR se alicuotaron para su electroforesis 2 μl. en 20 μl. de formamida doblemente desionizada (Hi‐Di) y 0,4 μl. del standard de tamaño GeneScanTM‐ Liz500TM Size Standard (Applied Biosystems, Estados Unidos). Las muestras preparadas se desnaturalizaron a 94ºC durante 5 minutos.. La electroforesis se realizó en un capilar de 36 centímetros a 15 kV durante 20 minutos. El medio de electroforesis fue el polímero Performance Optimized Polymer 4 (POP‐ 4) (Applied Biosystems, Estados Unidos) compuesto por dimetilacrilamida, urea 8 M, 2‐pirrolidinona al 5% y EDTA 1 mM, que establece un entorno altamente desnaturalizante para las muestras de ADN a la temperatura de 60°C a la que se realizó la electroforesis. Estas condiciones son importantes para mantener los frgamentos de ADN desnaturalizados uniformemente y obtener tamaños de alelos reproducibles de una inyección a otra. Permite detectar alelos que difieran en una sola
89
Material y Métodos
base, con una precisión de tamaños entre alelos de la misma longitud de menos de 0,15 nucleótidos de desviación estándar (Lazaruk y col., 1998; Wenz y col., 1998). Al final del capilar la exposición de los fragmentos a un láser provoca la emisión de fluorescencia que es captada por una cámara digital transformando la imagen en picos de fluorescencia. Se realizaron dos electroforesis por individuo:
Electroforesis
Marcador
Fluorocromo
Rango Alélico
1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2
AGLA232 INRA023 RM188 TGLA227 BM211 DRB HEL1 BMS2057 ETH10 ETH225 ETH3 HEL5 BM143 CSSM66 ETH185 HEL9 BM1824 INRA037 INRA35 TGLA126 TGLA53 HAUT24 ILSTS06 TGLA122
NED NED NED NED HEX HEX HEX 6‐FAM 6‐FAM 6‐FAM 6‐FAM 6‐FAM NED NED NED NED HEX HEX HEX HEX HEX 6‐FAM 6‐FAM 6‐FAM
153‐179 199‐217 116‐140 79‐99 124‐142 154‐202 103‐115 92‐108 211‐223 139‐159 109‐131 151‐169 87‐111 179‐199 220‐242 151‐171 179‐191 120‐134 94‐114 119‐129 151‐181 106‐126 287‐307 138‐170
Tabla 8: Fluorocromos y rangos alélicos de los microsatélites en las dos múltiplex.
IV.2.3.1.2 Genotipado de las muestras La identificación de los alelos para los diferentes microsatélites se realizó mediante el uso de los software GeneScan® Software V3.7 y Genotyper® Software V3.7 (Applied Biosystems, Estados Unidos). El software GeneScan® determina el tamaño de
90
Material y Métodos
los fragmentos generados en la PCR comparando los picos de fluorescencia generados con el standard de tamaño. El genotipado de todos los alelos de los microsatélites de cada una de las carreras electroforéticas se realiza simultáneamente. Los fragmentos amplificados en la PCR generan una imagen que presenta una serie de particularidades que pueden dificultar el genotipado: a) Bandas sombra: Durante la polimerización de los fragmentos en la PCR y motivado por la repetición en tándem de un motivo que varía entre 1 y 6 nucleótidos, como sucede con los microsatélites, se producen deslizamientos de la polimerasa que provocan la ganancia o pérdida de uno o varios motivos de repetición, generando una imagen con distintos fragmentos que varían en tamaño (figura 13).
Figura 13: Imagen de las bandas sombra y adición de la adenina final. Los picios negros uniformes correspoden a los dos alelos que porta la muestra analizada y los no coloreados son las bandas sombra. El pico azul más alto corresponde al alelo que porta el individuo y el más bajo a la adición de las adenina final.
b) Adición de la Adenina final: Al finalizar la polimerización de un fragmento la polimerasa añade una adenina, a medida que el número de fragmentos es mayor, como sucede en los últimos ciclos de la PCR, coexistirán dos tipos de fragmentos según tengan o no añadida la adenina final. Esta situación genera dos picos diferenciados en tamaño por una sola base. Para evitar la coexistencia de dos fragmentos correspondientes a un mismo alelo al final de los ciclos de la
91
Material y Métodos
PCR se incorpora un último paso de polimerización de 20 minutos con el objetivo de que la polimerasa añada dicha adenina en todos los fragmentos generados (figura 13). En la imagen los picos con fondo negro corresponden a los alelos de un individuo heterocigoto y se puede observar las bandas sombra generadas durante la PCR por deslizamiento de la polimerasa. Los picos azules corresponden a un mismo alelo representado por dos fragmentos que se diferencian en una base que corresponde a la adición de la adenina final.
IV.2.3.2 Amplificación de microsatélites localizados en el cromosoma Y La elección de los microsatélites se realizó entre aquellos localizados en la región diferencial del cromosoma Y tras una búsqueda bibliográfica. Posteriormente se seleccionaron individuos pertenecientes a diferentes encastes y ganaderías y se realizó una prueba para seleccionar los más polimórficos. Los microsatélites INRA124, INRA126, INRA8, BM861, UMN0311, UMN0406, UMN1113, UMN1201, UMN1307, UMN1605, UMN2706, UMN0705, UMN0920, UMN2102, UMN2404 se eliminaron porque sólo presentaron una alelo. En la tabla 9 se muestran los microsatélites seleccionados: LOCUS
REFERENCIA
INRA189 INRA062 BYM1 DYZ1 UMN2405
Vaiman y col., 1994 Vaiman y col., 1994 Ward y col., 2001 Perret y col., 1990 Liu y col., 2002
Tabla 9 : Referencias bibliográficas de los microsatélites del cromosoma Y.
92
Material y Métodos
Los cinco microsatélites se amplificaron de manera independiente utilizando las siguientes condiciones: ADN ADN Polimerasa Cebadores dNTPs MgCl2 Buffer
INRA189
INRA062
BYM1
DYZ1
UMN2405
10 ng 0,2 U 5 pMol 200 μM 1,5 mM 1 x
10 ng 0,2 U 5 pMol 200 μM 1,5 mM 1 x
10 ng 0,2 U 5 pMol 200 μM 1,5 mM 1 x
10 ng 0,2 U 5 pMol 200 μM 1,5 mM 1 x
10 ng 0,2 U 5 pMol 200 μM 1,5 mM 1 x
Volumen final
10 μl
10 μl
10 μl
10 μl
10 μl
Tª Hibridación
55 ºC
65 ºC
68ºC
66ºC
178‐194
358‐362
Rango alélico 152‐162 255‐257 132‐136 Tabla 10: Condiciones de amplificación de los microsatélites del cromosoma Y.
El programa de la PCR para los cinco microsatélites fue el mismo: 94ºC 5 minutos 94ºC 40 segundos Tª hibridación 40 segundos 72ºC 40 segundos
30 ciclos
72ºC 20 minutos 15ºC indefinido
IV.2.3.2.1. Electroforesis en gel de poliacrilamida La electroforesis de los fragmentos amplificados se realizó en geles de poliacrilamida excepto el microsatélite DYZ‐1 que se marcó con el fuorocromo 6‐fam y se realizó una electroforesis capilar en un en un secuenciador ABI Prism® 3100 Genetic Analyzer (Applied Biosystem, Estados Unidos), siguiendo el mismo protocolo que el descrito para los microsatélites autosómicos. Con el resto de los microsatélites se realizó una electroforesis vertical en gel de poliacrilamida de dimensiones 42 cm x 33 cm x 0,35 cm bajo condiciones desnaturalizantes. Cada gel estaba compuesto por 8% de acrilamida‐bis‐acrilamida (19:1), urea 7 M, tampón TBE 0,5x, 0,7% de persulfato amónico y 0,2% de TEMED (N,N,N’,N’ tetrametilen diamida).
93
Material y Métodos
Los productos PCR se diluyeron en un volumen de tampón de carga desnaturalizante (EDTA 5,5 mM, pH= 8; xilencianol al 0,05% y azul de bromofenol al 0,005%) en formamida desionizada. Se desnaturalizaron a 95 °C durante 5 minutos y se mantuvieron en hielo durante 2 minutos para evitar la renaturalización. 5 μl. de la mezcla se cargaron en el gel, sometiendo a las muestras a 2000 Voltios, 15 Watios y 90 miliAmperios. Con el objetivo de mantener la desnaturalización de la doble hélice de ADN, además de saturar el gel con urea, se mantuvo a temperatura constante de 60°C. La duración de la electroforesis varió de 1,5 a 2 horas dependiendo del tamaño nucleotídico de los fragmentos a visualizar. El gel de poliacrilamida se sometió a un proceso de tinción con nitrato de plata siguiendo el protocolo de Bassam y col. (1991) con ligeras modificaciones (Barroso y col., 1999), consiguiéndose visualizar las bandas de ADN. Los pasos que se siguieron fueron: 1. Introducción del gel en una solución de ácido acético al 10% durante 2 minutos y posterior lavado con agua ultrapura. 2. Tinción con agitación en una solución de nitrato de plata (AgNO3) al 0,1% y 1‰ de formaldehído al 37% en condiciones de oscuridad (para evitar la precipitación del nitrato de plata y la unión de este compuesto a los fragmentos de ADN). Lavado del gel con agua ultrapura. 3. Revelado mediante la adición de una solución de carbonato sódico (Na2CO3) 0,07 M; 1‰ de tiosulfato sódico (Na2S2O3x5H2O) al 10% y 1‰ de formaldehído al 37%. En el momento en que se visualizan las bandas correctamente, se realiza un lavado con agua ultrapura. 4. Paro del revelado, añadiendo una solución de ácido acético glacial al 10% a 4 °C durante 3 minutos, tras el que se realiza un lavado con agua ultrapura. 5. Conservación del gel, añadiendo una solución de glicerol al 20%.
94
Material y Métodos
IV.2.3.2.2. Genotipado de las muestras En el caso del microsatélite DYZ‐1 se siguió el mismo procedimiento descrito para los microsatélites autosómicos. En los microsatélites analizados mediante electroforesis en gel de poliacrilamida teñidos con nitrato de plata, la banda de mayor intensidad se utilizó para determinar el tamaño alélico mediante comparación con el marcador de tamaño en pares de bases PBR322 digerido con MspI, lo que permitió combinar los datos de diferentes geles.
IV.2.3.3 Secuenciación del ADN mitocondrial IV.2.3.3.1 PCR previa a la secuenciación Se amplificaron de manera independiente dos fragmentos solapantes del d‐loop del ADN mitocondrial bovino, los cebadores utilizados se describen en la tabla 11:
Cebadores
Posiciones
Tamaño del fragmento
16019 - 16280
262 bases
16203-201
338 bases
DLOOPF 5´-TATGCCCCATGCATATAAGC-3´
Fragmento 1 DLOOPR 5´-AAGAAAGAACCAGATGCCTG-3´
MITFOR 5´-ATCCCTCTTCTCGCTCCG-3´
Fragmento 2 MITREV 5´- TTATGTCCTGTGACCATTGACTG-3´
Tabla 11: Secuencias de los cebadores utilizados en la amplificación del ADN mitocondrial, posición donde se sitúan tomando como referencia la secuencia del Genbank NC_006853 y tamaño del fragmento amplificado.
El diseño de los cebadores en ambos fragmentos se realizó mediante el programa Primer 0,5 (GCG Software Package, Universidad de Wisconsin, Estados Unidos) tomando como referencia la secuencia depositada en Genbank NC_006853.
95
Material y Métodos
Las condiciones de la PCR fueron iguales para ambos fragmentos:
REACTIVO Búffer Cl2Mg 25 mM dntp´s 12, 5 mM Cebador 1 10pm/µl Cebador 2 1 10pm/µl Taq polimerasa ADN 10 ng/µl H20 Volumen Final
VOLUMEN 2,5 µl. 1,25 µl. 0,25 µl. 1 µl 1 µl 0,5 µl. 1 µl. 17,5 µl. 25 µl.
CONCENTRACIÓN 1X 1,25 mM 0,125 mM 10 uM 10 uM 0,5 Unidades 10 ng
Tabla 12: Condiciones de la PCR utilizada en la amplificación del ADN mitocondrial.
La PCR se realizó en un un termociclador programable automático modelo PTC‐ 200TM (MJ Research Inc., Estados Unidos). Previamente a introducir los tubos en el termociclador se añadió una gota de aceite para evitar la evaporación (Sigma® ) . El programa de amplificación fue idéntico para ambos fragmentos:
94ºC 5 minutos 94ºC 30 segundos 56ºC 30 segundos 30 Ciclos 72ºC 1 minuto 72ºC 5 minutos 15ºC indefinido
IV.2.3.3.2 PCR de secuenciación Una vez realizada la PCR se realizó una electroforesis de una alícuota en un gel de agagrosa al 0,8% para comprobar la presencia de producto amplificado y su tamaño por comparación con un marcador de pesos moleculares de concentración conocida Precision Molecular Mass Standard (Biorad, Estados Unidos). Las PCRs amplificadas se purificaron con el kit comercial ConcertTM Rapid PCR Purification Sysytem (Life
96
Material y Métodos
Technologies, Estados Unidos) siguiendo las instrucciones del fabricante. La calidad del producto amplificado se testó en un gel de agarosa al 0,8%. La PCR de secuenciación se realizó utilizando el kit Abi Prism® Big Dye Terminator Cycle Sequencing Ready Reaction Kits V2.0 (Applied Biosystems, Estados Unidos), siguiendo las instrucciones del fabricante. Los ciclos de amplificación de la PCR fueron los siguientes: 94ºC 3 minutos 94ºC 30 segundos 50ºC 10 segundos 30 Ciclos 60ºC 4 minuto 4ºC 3 minutos 15ºC indefenido La PCR de secuenciación se purificó utilizando el siguiente protocolo: 1.‐ Añadir 2 μl. de sodio acetato 3M pH=4,6 y 50 μl. de etanol al 95% a cada PCR 2.‐ Incubar a –20ºC durante 15 minutos. 3.‐ Centrifugar 20 minutos a máxima velocidad. 4.‐ Descartar el sobrenadante y añadir 250 μl. de etanol 70%. 5.‐ Incubar 10 minutos a –20ºC. 5.‐ Centrifugar 10 minutos a máxima velocidad y descartar el sobrenadante. 7.‐ Secado del tubo hasta la completa evaporación del etanol. Antes de la electroforesis las muestras se resuspendieron en 25 μl. de formamida doblemente desionizada (Hi‐Di), incubándolas 10 minutos a temperatura ambiente. Posteriormente se desnaturalizan en un bloque a 96ºC 5 minutos y se procedió a su secuenciación. La electroforesis de secuenciación se realizó en un secuenciador automático ABI PRISM 310 Genetic Analyzer (Applied Biosystems, Estados Unidos) utilizando un capilar de 36 centímetros de longitud y 50 μm. de diámetro con el polímero Performance Optimized Polymer 6 (Pop‐6) (Applied Biosystems, Estados Unidos). La muestra fue inyectada electrocinéticamente durante 5 segundos a 15 kV y luego migró a 15 kV durante 30 minutos a temperatura constante de 50 °C. Los resultados obtenidos se analizaron con el software Sequencing Analysis® v2.1 (Applied Biosystems, Estados Unidos).
97
Material y Métodos
IV.2.3.3.3 Alineamiento de secuencias Las dos secuencias de ADN se ensamblaron utilizando el programa disponible en la página web http://bioinfo.hku.hk/EMBOSS/ (European Molecular Biology Open Software Suite), obteniéndose un fragmento de 521 nucleótidos que abarca del 16019 al 201 (Figura 14). 15781 15841 15901 15961 16021 16081 16141 16201 16261 16321
actattccct atttatcaaa accactagct gtaatgtaca tgccccatgc tgactgtaca ttaccattag ggatccctct caggcatctg aataagacat
gaacactatt aatcccaata aacataacac taacattaat atataagcaa tagtacatta atcacgagct tctcgctccg gttctttctt ctcgatgg
aatatagttc actcaacaca gcccatacac gtaataaaga gtacatgacc tgtcaaattc taattaccat ggcccataaa cagggccatc
cataaataca gaatttgcac agaccacaga cataatatgt tctatagcag attcttgata gccgcgtgaa ccgtgggggt tcatctaaaa
aagagcctta cctaaccaaa atgaattacc atatagtaca tacataatac gtatatctat accagcaacc cgctatccaa cggtccattc
tcagtattaa tattacaaac tacgcaaggg ttaaattata atataattat tatatattcc cgctaggcag tgaattttac tttcctctta
1 61 121 181 241 301 361
actaatggct ttattttggg attgtagctg gtcaatggtc taaatatcta ctttcaatac cccgttgatg
aatcagccca ggatgcttgg gacttaactg acaggacata ccaccacttt tcaatttagc tagcttaacc
tgctcacaca actcagctat catcttgagc aattatatta taacagactt actccaaaca caaagcaagg
taactgtgct ggccgtcaaa accagcataa tatatccccc ttccctagat aagtcaatat cactgaaaat
gtcatacatt ggccctgacc tgataagcat cttcataaaa acttatttaa ataaacgcag gcctagatga
tggtattttt cggagcatct ggacattaca atttccccct atttttcacg gccccccccc gtctcccaac
Figura 14: Secuencia completa del d-loop de Bos taurus (15792..16338,1..363). Los nucleótidos subrayados identifican al fragmento secuenciado (16019-201). En azul se muestra el fragmento 1, en rojo el 2 y en verde la zona solapante de ambos fragmentos.
IV.3. ANÁLISIS DE LOS DATOS GENERADOS IV.3.1 Análisis de la secuencia de ADN mitocondrial El cálculo de los diferentes parámetros a partir de las secuencias de ADN mitocondrial se realizó con los programas MEGA 2.0 (Kumar y col., 2001) y ARLEQUIN 2.00 (Schneider y col., 1997).
IV.3.1.1 Número de sitios polimórficos (s) Se define como el número de posiciones nucleotídicas de la secuencia analizada que presenta más de una variante, se identifica con la letra S.
98
Material y Métodos
Se pueden clasificar en dos grupos: a) Transiciones: Cambio de bases púricas o pirimidínicas entre sí. b) Transversiones: Se produce un cambio de una base púrica por una pirimidínica o viceversa.
IV.3.1.2 Número de haplotipos Se define como el número de secuencias distintas identificadas en el total de los individuos analizados.
IV.3.1.3 Diversidad haplotípica Es la probabilidad de que dos haplotipos elegidos al azar sean idénticos (Nei, 1987). Corresponde con la heterocigosis esperada para datos diploides. Su valor se obtiene de la fórmula: ∧
H=
k n ⎛ ⎞ ⎜1 − ∑ p i2 ⎟ n −1⎝ i =1 ⎠
Y su varianza: ∧
V (H ) =
k k k ⎫ 2 ⎧ ⎡ k 3 2 2⎤ 2 2 ( n 2 ) p ( p ) p ( pi2 ) 2 ⎬ − − + − ⎨ ∑ ∑ ∑ ∑ i i i ⎢ ⎥ n( n − 1) ⎩ i= i =1 ⎣ i =1 ⎦ i =1 ⎭
Donde n es el número de copias génicas, k es el número de haplotipos y pi es la frecuencia del haplotipo i.
IV.3.1.4 Número de diferencias nucleotídicas Se define como la media del número de posiciones variables entre parejas de secuencias o haplotipos (Tajima, 1983; Tajima, 1993).
99
Material y Métodos
IV.3.1.5 Diversidad nucleotídica La diversidad nucleotídica nos permite calcular diferentes parámetros útiles en los estudios genéticos de poblaciones, como la diversidad nucleotídica media de la población, además de otros que tienen en cuenta la estructura en subpoblaciones como la diversidad media dentro y entre subpoblaciones.
IV.3.1.5.1 Diversidad media de la población (πT) Es la media aritmética de las distancias entre parejas de individuos entre diferentes poblaciones. Se calcula mediante la fórmula:
πT =
q i ∑ q − 1 q =1
j
∑x x d i
q =1
j
ij
donde Xi es la estima de la frecuencia media del alelo i en la población completa y q es el número de secuencias diferentes en el conjunto de la población.
IV.3.1.5.2 Distancia media dentro de poblaciones (πi) Se define como la media aritmética de la distancia entre parejas de individuos pertenecientes a una población, se calcula mediante la expresión (Kumar y col., 2001):
πi =
q i ∑ q − 1 q =1
j
∑x x d q =1
i
j
ij
donde Xi es la frecuencia de la secuencia i en la muestra de la población i, y q es el número de secuencias diferentes en esa población.
100
Material y Métodos
IV.3.1.5.3 Diversidad media entre poblaciones La estima de la diversidad nucleotídica media entre poblaciones (δST) viene dada por la expresión (Kumar y col., 2001):
δ ST = π T − π S
IV.3.2 Análisis de Microsatélites IV.3.2.1 Parámetros básicos de polimorfismo genético Con el programa ToolKit (Park, 2001) se calcularon los parámetros básicos de polimorfismo genético para los microsatélites autosómicos como para los localizados en el cromosoma Y.
IV.3.2.1.1 Número de alelos por locus El número medio de alelos por locus se calculó mediante la expresión:
r
A=
∑A j =1
j
r
Siendo r el número total de locus y Aj el número de alelos en el locus j.
IV.3.2.1.2 Número efectivo de alelos El número efectivo de alelos (NEA) (Kimura y Crow, 1964) se define como la probabilidad de que dos alelos de un locus elegido al azar en la población sean idénticos por descendencia y esta probabilidad es igual al inverso de la frecuencia esperada de individuos homocigotos en la población. Se calcula mediante la expresión matemática:
Ne =
1 n
∑p i =1
101
2 i
Material y Métodos
Se emplea como medida del número efectivo de alelos mantenidos en la población, y representa el número de alelos equiprobables que producirían la misma proporción de homocigotos que el observado, que en general es menor que el número de alelos.
IV.3.2.1.3 Heterocigosis observada (Ho) La heterocigosis observada (HO) para un locus j se calculó como el número de heterocigotos presente en la población divididos por el número de individuos analizados para el locus (n), mediante la expresión: n
Ho =
∑h i =1
obs j
n
IV.3.2.1.4 Heterocigosis insesgada(Hj) La heterocigosis insesgada (HJ) o diversidad génica es un índice de variabilidad genética que está altamente correlacionado con la heterocigosis observada y que se considera que es el mejor estimador de la variabilidad genética presente en la población (Nei y Roychoudhary, 1974; Nei, 1987). Fue calculada para cada locus j y cada encaste, bajo el supuesto de equilibrio de Hardy‐Weinberg, mediante el siguiente estimador: r ⎛ ⎞ 2n⎜1 − ∑ xij2 ⎟ i =1 ⎠ hj = ⎝ 2n − 1
siendo, Xij la frecuencia del genotipo AiAj y n, el número de individuos muestreados. Los valores medios de heterocigosis observada, e insesgada, se calcularon mediante la expresión:
102
Material y Métodos
r
HM =
∑h
o ,e , j
j =1
L
donde ho,e,j es el valor de heterocigosis observada o insesgada y L es igual al número de encastes (r) o locus (j), en función del cálculo que se quiera realizar. Para hallar los valores medios totales, L fue igual al producto del número de loci (j) por el número de encastes (r).
IV.3.2.2 Contenido en Información Polimórfica (PIC) Al igual que la heterocigosis mide la información que proporcionan los marcadores analizados teniendo en cuenta el número de alelos y su frecuencia en los microsatélites (Botstein y col., 1980). Indica lo informativo que es un marcador midiendo su capacidad para identificar que alelo se ha heredado de cada uno de los parentales. La expresión que se utiliza en su cálculo es: n
n
PIC = 1 − ∑ pi2 − ∑ i =1
i =1
n
∑2p
j =i +1
2 i
p 2j
IV.3.2.3 Equilibrio Hardy-Weinberg En una población infinita donde los cruzamientos se producen de manera aleatoria en ausencia de mutación, migración y selección, las frecuencias alélicas y genotípicas no varían de generación en generación. Las poblaciones que se encuentran en esa situación se dicen que están en equilibrio Hardy‐Weinberg (Hardy, 1908) y se logra en una sola generación en el momento que se cumplan los requisitos. La desviación con respecto al equilibrio Hardy‐Weinberg se realizó mediante el programa Arlequin 2.000 que utiliza el procedimiento desarrollado por Guo y Thompson (1992).
103
Material y Métodos
IV.3.3 Análisis de la Estructura Genética de Poblaciones y sus relaciones
IV.3.3.1 Cálculo de los estadísticos F de Wright La distribución de la variabilidad genética de una población se puede analizar mediante el cálculo de los estadísticos F de Wright (1965) que fue posteriormente revisado por otros autores (Chakraborty y Danker‐Hopfe, 1991). Existe una relación sencilla entre ellos:
(1 − FIT ) = (1 − FIS ) − (1 − FST ) El estadístico FIS mide el parecido entre los dos alelos de un gen de un individuo y es una medida del grado de endogamia en una población al interpretarse como la probabilidad de que lo dos alelos de un mismo gen sean idénticos. El parámetro FIT mide la desviación de las frecuencias esperadas de heterocigotos respecto de las observadas del conjunto de la población. Los parámetros FIS y FIT, toman valores positivos cuando hay un déficit de heterocigotos, y valores negativos cuando hay un exceso de heterocigotos. El estadístico FST mide el parecido entre los individuos de un encaste o de las diferencias entre encastes, explicando el porcentaje de la variabiliad genética que se debe a la existencia de una estructura en la población en forma de encastes. Asume que la deriva genética es la fuerza predominante en la diferenciación de poblaciones. La estimación de estos parámetros se llevó a cabo mediante el programa Genepop 3.33 (Raymond y Rousset, 1995) con el que se realizó una prueba de permutaciones aleatorias para contrastar las hipótesis nulas: FIS= 0, FIT= 0 y FST= 0. La desviación típica se obtuvo mediante el procedimiento de remuestreo bootstrap tras 1500 iteraciones (Weir, 1990). El nivel de significación de FST se calculó mediante el estadístico chi‐ cuadrado de Workman y Niswander (1970):
104
Material y Métodos
χ 2(r −1)(s −1) = 2nFST (r −1) donde n es el tamaño de la muestra, r es el número de alelos, s es el número de poblaciones y (r‐1)(s‐1) son los grados de libertad. La distribución nula del FST entre parejas bajo la hipótesis de no diferencia entre las poblaciones se obtiene permutando haplotipos entre poblaciones, donde el valor P del test es la proporción de permutaciones que dan valor FST igual o mayor al observado.
IV.3.3.2 Análisis de la Varianza Molecular El Análisis de Varianza Molecular se realizó utilizando el programa Arlequín (Excoffier y col., 1992). Un análisis jerárquico de varianza parte la varianza en diferentes componentes debidos a las diferencias entre grupos, entre poblaciones dentro de un mismo grupo y dentro de poblaciones, para ello es necesario definir la estructura de la población en grupos (encastes) y poblaciones (ganaderías). Los componentes de varianza (σi2) son utilizados para calcular los índices de fijación, análogos a los estadísticos F definidos originalmente por Wright (1965), llamados estadísticos Φ, que reflejan la correlación de la diversidad a diferentes niveles jerárquicos de división en términos de coeficientes de endogamia, o en términos de tiempos de coalescencia (Slatkin, 1991). La varianza molecμlar total (σ2) es la suma de los componentes de varianza debido a diferencias entre haplotipos dentro de una población (σc2), el componente de varianza debidos a diferencias entre entre haplotipos en diferentes poblaciones dentro de un grupo (σb2), y el componente de varianza debido a diferencias entre los haplotipos de los diferentes grupos(σa2).
105
Material y Métodos
La estructura del AMOVA usada fue la siguiente:
Fuente de variación
Entre encastes Entre ganaderías dentro de un encaste Entre individuos dentro de ganaderías dentro de encastes Total
Grados de
Suma de
libertad
cuadrados
G‐1
SSD(AG)
n´´σ2a + n´σ2b + σ2c
P‐G
SSD(AP/WG)
nσ2b + σ2c
N‐P
SSD(WP)
σ2c
N‐1
SSD(T)
σ2T
E(MSD)
Tabla 13: Estructura de la población utilizada en el análisis de varianza molecular.
Donde G Es el número de encastes, P es el número de ganaderías y N es el número total de individuos. SSD (AG) es la suma de cuadrados entre ganaderías de diferentes encastes. SSD (AP) es la suma de cuadrados entre ganaderías. SSD (AP/WG) es la suma de cuadrados entre ganaderías dentro de un encaste. SSD (WP) es la suma de cuadrados dentro de ganaderías. SSD (T) es la suma de cuadrados total. A partir de la matriz de distancias obtenida se calcμló los estadísticos Phi:
σ A2 FST ≅ φST = 2 σT
IV.3.4 Distancia FST Los valores FST entre parejas de poblaciones o individuos representan la endogamia relativa que existe dentro de una raza en relación con el resto de razas analizadas en el estudio, o bien con cada una de las razas o poblaciones por separado.
106
Material y Métodos
Proporcionan información de la variabilidad genética total, explicada por la variación encontrada entre razas, por lo que se utilizan como medidas de distancia genética. Esta medida de distancia entre poblaciones se calculó con el programa Genetix 4.03 (Belkhir y col., 2001) mediante la expresión:
FST =
HT − H S HT
donde HT es la heterocigosis esperada de un individuo tomado al azar dentro de una población, y HS es la heterocigosis media esperada en dicha población.
IV.3.5 Representaciones gráficas IV.3.5.1 Representación mediante dendogramas Las representaciones gráficas se obtienen a partir de los datos obtenidos anteriormente considerando en cada caso los OTUs (Unidad taxonómica operativa, Sokal y Sneath, 1963) correspondientes, como son los individuos, encastes y razas. Tanto en el caso de los microsatélites como del ADN mitocondrial se emplearon las distancias FST entre poblaciones. Para la construcción de los dendogramas se utilizaron los algoritmos UPGMA (Sneath y Sokal, 1973) y Neighbor‐Joining (Saitou y Nei, 1987). El método UPGMA asume que la tasa de evolución es constante, produciendo un árbol con raíz (aunque se puede eliminar la raíz para ciertos propósitos), en el que la longitud de las ramas para dos OTUs es el mismo después de su separación. Simulaciones por ordenador han demostrado que cuando la distancia evolutiva entre todos los pares de OTUs es grande, este método recoge el árbol correcto con una probabilidad elevada (Tateno y col, 1982; Sourdis y Krimbas, 1987). Si este método se
107
Material y Métodos
aplica a datos de distancias calculadas a partir de un elevado número de datos se espera que de un árbol de bondad razonablemente elevada (Kumar y col., 2001). El método Neighbor‐Joining (NJ) es una simplificación del método de evolución mínima (ME). La topología muestra el menor valor de la suma (S) de todas las ramas (2m‐3 ramas para un árbol bifurcado con m OTU´s), que es elegido como estima del árbol correcto. Rzhetsky y Nei (1993) han mostrado que cuando se utilizan estimas insesgadas de distancias evolutivas, la topología correcta del árbol siempre da el menor valor esperado de S. Se dibujaron tanto árboles con raíz, aquellos en que el estado ancestral se muestra en un lado como originario del árbol, que se va ramificando hasta que alcanza las ramas terminales en el otro extremo del árbol, como árboles de radiación, que representan el orden de las ramas pero no indican la raíz o localización del último ancestro común.
IV.3.5.2 Representaciones Network La mejor forma de expresar la multitud de los posibles árboles resultantes a la hora de reconstruir filogenias de datos intraespecíficos (como la variación en el ADN mitocondrial) es una red que muestre las posibles vías evolutivas en forma de ciclos (Bandelt y col., 1999).
IV.3.5.2.1 Median joining El Median‐Joining network (Bandelt y col., 1999) es un tipo de representación gráfica que construye redes de datos de poblaciones libres de recombinaciones mediante la conjunción de las características del algoritmo de Kruskal (1956) para encontrar ʹminimun spanning treesʹ combinando todos los haplotipos dentro de una sola red, a la que simultáneamente se añaden secuencias consenso de tres secuencias
108
Material y Métodos
mutuamente cercanas con un criterio de parsimonia, que constituyen los ‘vectores medios’ o puntos Steiner. Estos representan posiciones intermedias que biológicamente se pueden interpretar como secuencias existentes no muestreadas o como secuencias ancestrales extintas. Este método constituye una versión más eficiente del algoritmo precedente ʹReduced Median Networkʹ (Bandelt y col., 1995) pero presenta el inconveniente de que no resuelve nudos. Este análisis filogenético se realizó con ayuda del programa NETWORK 3.01 (Rohl, 1999). Las secuencias de la raza de lidia así como de las razas españolas (Morucha, Retinta, Sayaguesa, Avileña, Pirenaica y Tudanca) fueron generadas en el laboratorio siguiendo el protocolo descrito en material y métodos. El resto de secuencias de razas bovinas se obtuvieron de GenBank (Loftus y col. 1994). En el análisis tipo Network realizado con las secuencias de uros (Troy y col., 2001; Anderung y col., 2005; Beja‐Pereira y col., 2006), sólo se consideró la región solapante con las obtenidas en la raza de lidia, del nucleótido 16042 al 16280 (Anderson y col., 1982).
IV.3.7 Análisis Factorial de Correspondencia Las reconstrucciones filogenéticas y las distancias genéticas no tienen en cuenta los efectos de relación que existen entre distintas ramas de los árboles representados. Como alternativa, el Análisis Factorial de Correspondencia es un método multivariante factorial de reducción de la dimensión de una tabla de casos‐variables con datos cualitativos, con el fin de obtener un número reducido de factores. Su posterior interpretación permite un estudio más simple, que se basa en la distancia no euclídea del χ2. El proceso de hallar la distancia entre dos categorías de una variable se hace por medio de las diferencias cuadráticas relativas (Lebart, Morineau y Tabard, 1984). Se utiliza para valorar las relaciones genéticas entre poblaciones, pudiendo condensar la información de un gran número de variables cualitativas (alelos y loci) en un menor número de variables sintéticas. Se obtienen representaciones gráficas en un
109
Material y Métodos
espacio dimensional de pocas variables sintéticas o factores que condensan el máximo posible de información y por tanto pueden ser interpretados o nombrados, permitiendo visualizar globalmente las relaciones obtenidas donde se representan un conjunto de puntos, tantos como modalidades (alelos), sobre todas las variables (los distintos locus), cada uno caracterizado por unas coordenadas y una masa, que es la misma en todas las poblaciones. Representa la posición de los OTUs (individuos o poblaciones) con respecto a los valores de los ejes de coordenadas obtenidos. Los objetos analizados son las poblaciones representadas por el vector de sus frecuencias alélicas donde los valores de inercia de cada eje pueden ser asemejados a las combinaciones lineales de valores de FST de cada locus (Guinand, 1996).
IV.3.8 Análisis de la estructura de la población El programa STRUCTURE (Pritchard y col., 2000) nos permite analizar la estructura subaycente a la población analizada a partir de datos moleculares, estima el número de clusters o grupos genéticamente diferentes que mayor verosimilitud le da a los resultados obtenidos y además permite cuantificar la proporción de genoma que cada individuo tiene con origen en los diferentes clusters. Se trata de un modelo no supervisado y se asume una situación inicial de K clusters o grupos, donde K puede ser desconocido calculándose su valor mediante máxima verosimilitud. Posteriormente se calcula la proporción de genoma que cada muestra tiene de los clusters, comprobando si las muestras que a priori se agrupan en una subpoblación tienen idéntica composición respecto a los clusters o grupos geneticamente diferentes estimados (Pritchard y col., 2000). El modelo asume que los loci están en equilibrio Hardy‐Weinberg, que no están ligados y no es necesario definir el modelo mutacional. Presenta la ventaja de que se puede utilizar con diferentes marcadores moleculares como microsatélites, SNPs o RFLPs.
110
Material y Métodos
Formalmente, el método consiste en utilizar la información molecular de los individuos analizados, en forma de genotipos para los distintos marcadores, y denotada por X, para estimar los distintos parámetros de interés mediante un algoritmo de tipo Gibbs Sampler. Así, en el modelo más sencillo se trata de estimar la distribución de P y Z condicionada a la información muestral, P(Z,P|X), donde P son las frecuencias alélicas de los distintos marcadores en los K clusters y Z denota los clusters de origen de cada uno de los individuos. Si se permite en el modelo que los individuos puedan proceder de cruces entre diferentes clusters la distribución a estimar contiene una nueva variable, Q, que denota la proporción de genoma de cada individuo originada en cada uno de los clusters. Se estima, por tanto, la distribución posterior de Z, P y Q, P(Z,P,Q|X), donde Z representa ahora el cluster de origen de cada alelo de cada locus de cada individuo (al contrario que en el modelo simplificado, en el que Z es el cluster de origen de cada individuo contemplado de manera conjunta, al no admitir cruces entre clusters). En la ejecución del programa se utilizaron 150.00 burn in y 400.000 iteraciones normales.
Se espera que individuos de una misma raza o población tengan una composición similar de su genoma en cuanto a proporción de origen en los distintos clusters. El programa permite obtener una representación gráfica de estas composiciones, de forma que se puedan apreciar parecidos o diferencias entre individuos dentro de una misma población o entre distintas poblaciones. Asimismo, la relación de las distintas poblaciones en cuanto a la composición media de los genomas de sus individuos puede representarse gráficamente mediante un árbol jerárquico construido sobre una distancia genética definida a partir de estas composiciones medias como: K
d S (i, j ) := ∑ q k (i ) − q k ( j ) k =1
q k (i ) + q k ( j ) 2
Donde qk (i) representa la proporción de genoma de la población i originada del cluster k (Capuccio y col., 2006).
111
Material y Métodos
En un primer análisis con el programa implementado por Pritchard y col. (2000), se consideraron a todos los animales de la raza de lidia analizados y un segundo análisis se realizó de manera individual en aquellos encastes integrados por más de una ganadería.
112
V. RESULTADOS
113
114
Resultados
V.1.- MICROSATÉLITES AUTOSÓMICOS V.1.1. Parámetros indicativos de la variabilidad genética V.1.1.1 Número de alelos y Número Efectivo de Alelos (NEA) V.1.1.1.1 Microsatélites Los alelos caracterizados correspondientes a los 24 microsatélites autosómicos se nombraron en pares de bases utilizando un marcador estándar de tamaño, GeneScanTM‐Liz500TM Size Standard (Applied Biosystems, Estados Unidos). En la figura 15 se muestra el rango alélico de los microsatélites autosómicos analizados.
Rango alélico 300 250 200 150 100
Tg la 2 Bm 27 Bm 14 s2 3 05 In 7 ra 35 H e H l1 au t2 4 Et h R 3 m 1 Tg 88 la 12 In 6 ra Bm 37 21 Tg 13 la 1 Et 22 h2 25 H el 5 H el Tg 9 la Ag 53 la 23 2 D Bm rb 1 C 824 ss m 6 In 6 ra 2 Et 3 h1 Et 0 h1 Ils 85 ts 00 6
50
Figura 15: Rango alélico en pares de bases de los 24 microsatélites autosómicos analizados.
Los 235 alelos identificados se situaron en el rango de 87 a 307 pares de bases (Figura 15). Una vez establecido el genotipo de los individuos se procedió al cálculo de diferentes parámetros de diversidad genética, como el número de alelos y el número efectivo medio de alelos por microsatélite (NEA) (Tabla 14). El menor número de alelos identificado en un microsatélite fue de 6 y el mayor de 19. El número medio de alelos por microsatélite fue de 9,8 siendo este un valor relativamente elevado.
115
Resultados
El NEA tiene en cuenta tanto el número de alelos como su frecuencia en la población sendo indicativo de lo informativo que es un microsatélite. La diferencia entre los valores extremos es llamativa de 1,8 en el Inra 35 a 7,0 en el Tgla53. El valor medio es de 3,8 siendo relativamente bajo a pesar de que el número medio de alelos es elevado. Microsatélite
Nº Alelos
Tgla53 Tgla227 Drb Ilsts06 Bm2057 Rm188 Haut24 Tgla126 Agla232 Tgla122 Inra23 Cssm66 Eth3 Bm143 Hel1 Eth185 Eth225 Bm2113 Bm1824 Hel9 Hel5 Eth10 Inra37 Inra35 PROMEDIO
15 11 19 9 10 11 9 6 13 14 9 11 11 10 7 8 6 9 6 10 9 7 8 7 9,8
NEA 7,0 5,9 5,4 4,7 4,6 4,5 4,4 4,1 4,1 4,0 4,0 3,9 3,8 3,6 3,5 3,2 3,0 2,9 2,9 2,8 2,8 2,7 2,5 1,8 3,8
Tabla 14: Número efectivo de alelos (NEA) y Nº de alelos por microsatélite. En rojo aparecen los valores más altos y en azul los más bajos
Para ilustrar gráficamente la distribución de los alelos se han construido 24 histogramas correspondientes a las frecuencias de los 24 microsatélites (Anexo 1). Se han presentado diferentes patrones, desde unimodales con un alelo de mayor frecuencia y los alelos flanqueantes con menores frecuencias (Eth10), a patrones bimodales donde son dos alelos los de mayor frecuencia respecto al resto (Inra35) y, por último, patrones no ajustados a ninguna distribución teniendo los alelos diferentes frecuencias (Tgla227).
116
Resultados
En 14 microsatélites se han identificado alelos exclusivos de encastes, siendo su frecuencia inferior al 10% en 11 de ellos. En los tres restantes, uno presentó una frecuencia superior al 11% en el encaste Miura, el segundo se identificó en el encaste Concha y Sierra con una frecuencia del 22% (RM188) y por último destaca que en el encaste Pablo Romero el alelo exclusivo identificado en el microsatélite ILSTS006 presentó una frecuencia del 50%.
V.1.1.1.1 Encastes Encaste Contreras Santa Coloma Carlos Núñez Saltillo Concha y Sierra Maqrués de Villamarta José Marzal Vega Villar Hidalgo Barquero Juan Pedro Domecq Félix Gómez Veragua Torrestrella Murube Miura Baltasar Iban Pedrajas Gamero Cívico Araúz de Robles Pablo Romero Atanasio Fernández Antonio Pérez Manuel Arranz Marqués de Albaserrada Cuadri Conde de la Corte Urcola María Montalvo Braganza PROMEDIO DE LOS ENCASTES RAZA DE LIDIA
NEA 3,5 3,2 3,1 3,1 3,1 2,9 2,8 2,9 2,9 2,7 2,7 2,7 2,6 2,6 2,6 2,5 2,5 2,5 2,3 2,6 2,5 2,4 2,5 2,2 2,0 2,2 2,8 2,3 2,5 2,7 3,8
NMA 5,1 5 4,7 4,6 4,5 4,4 4,4 4,3 4,3 4,2 4,2 4,1 4,1 4,1 4 4 3,9 3,9 3,9 3,8 3,8 3,8 3,7 3,4 3,4 3,1
4,1 5,7
Tabla 15: Número efectivo de alelos (NEA) por encaste y número medio de alelos por encaste y en la raza de lidia en conjunto igualando el tamaño muestral en los encastes a 15.
El número medio de alelos es un parámetro indicativo de la variabilidad de una población y como está influido por el tamaño muestral, en su cálculo se hizo un
117
Resultados
remuestreo igualando el tamaño de todos los encastes. Los encastes María Montalvo, Braganza y Urcola fueron eliminados de este análisis al presentar un muy reducido número de muestras analizadas respecto al resto. En la tabla 15 se muestran los valores obtenidos para el número medio de alelos (NMA) y número efectivo de alelos (NEA) por encaste. Los valores de NEA variaron de 2 a 3,5 mientras que los del NMA lo hicieron de 3,1 a 5,1, siendo de 5,7 cuando se considera a toda la raza en su conjunto sin agrupar en encastes. En el encaste Contreras coincidieron los valores más altos de ambos parámetros.
V.1.1.2 Heterocigosis y Contenido en Información Polimórfica (PIC) V.1.1.2.1 Microsatélites Los valores de PIC, heterocigosis insesgada y observada obtenidos por microsatélite se muestran en la tabla 16. Los valores mayores y menores coincidieron respectivamente con los de NEA. Microsatélite Tgla53 Tgla227 Drb Ilsts06 Rm188 Haut24 Bm2057 Tgla126 Tgla122 Inra23 Agla232 Eth3 Cssm66 Bm143 Hel1 Eth185 Eth225 Bm2113 Bm1824 Hel9 Hel5 Eth10 Inra37 Inra35 PROMEDIO
He 0,86 0,83 0,82 0,79 0,78 0,78 0,78 0,76 0,75 0,75 0,75 0,74 0,74 0,72 0,71 0,69 0,67 0,65 0,65 0,64 0,64 0,63 0,60 0,43 0,72
Ho 0,54 0,64 0,59 0,60 0,60 0,60 0,60 0,59 0,55 0,60 0,53 0,45 0,56 0,55 0,51 0,48 0,52 0,50 0,47 0,53 0,48 0,42 0,42 0,23 0,52
PIC 0,85 0,81 0,82 0,76 0,75 0,74 0,75 0,72 0,71 0,74 0,74 0,70 0,72 0,68 0,67 0,64 0,62 0,60 0,60 0,61 0,60 0,59 0,58 0,39 0,68
Tabla 16: Valores del contenido en información polimórfica (PIC), heterocigosis insesgada (He) y observada (Ho) por microsatélite. En rojo se resaltan los valores superiores y en azul los inferiores.
118
Resultados
V.1.1.1.1 Encastes En la tabla 17 se muestran los valores de la heterocigosis observada (Ho) y esperada (He) por encaste, los valores medios y los obtenidos para la población en su conjunto. Los resultados obtenidos para los diferentes encastes muestran en el caso de la He un rango de variación de 0,46 a 0,68, mientras que en la Ho es de 0,43 y 0,6. Encaste
He 0,68 0,67 0,65 0,65 0,65 0,64 0,62 0,61 0,61 0,61 0,60 0,60 0,59 0,59 0,58 0,58 0,57 0,57 0,57 0,56 0,56 0,55 0,55 0,54 0,54 0,54 0,53 0,47 0,46 0,59 0,72
Contreras Santa Coloma Saltillo Concha y Sierra Carlos Núñez Urcola Vega Villar Marqués de Villamarta Hidalgo Barquero Félix Gómez Veragua José Marzal Miura Braganza Juan Pedro Domecq Baltasar Iban Torrestrella Pedrajas Pablo Romero Murube Antonio Pérez Manuel Arranz Atanasio Fernández María Montalvo Gamero Cívico Araúz de Robles Marqués de Albaserrada Conde de la Corte Cuadri PROMEDIO DE LOS ENCASTES RAZA DE LIDIA
Ho 0,59 0,55 0,51 0,60 0,57 0,59 0,45 0,52 0,51 0,58 0,58 0,59 0,52 0,58 0,49 0,53 0,57 0,49 0,54 0,46 0,54 0,56 0,51 0,55 0,43 0,53 0,48 0,47 0,43 0,53 0,52
PIC 0,64 0,63 0,60 0,60 0,60 0,58 0,57 0,56 0,57 0,56 0,55 0,56 0,54 0,51 0,53 0,52 0,53 0,51 0,52 0,50 0,51 0,49 0,50 0,48 0,49 0,49 0,46 0,41 0,42 0,53
Tabla 17: Valores del contenido en información polimórfica (PIC), Heterocigosis insesgada (He) y observada (Ho) por encaste, valores promedio y considerando la población en su conjunto. En azul se resaltan los valores inferiores y en rojo los superiores.
119
Resultados
Los encastes que presentaron valores más altos de PIC y NEA coinciden con los mayores valores de He. En los encastes Félix Gómez, Antonio Pérez, Veragua, Braganza, José Marzal, Araúz de Robles, Torrestrella, Conde de la Corte, María Montalvo y Manuel Arranz las diferencias entre la He y la Ho no resultaron significativamente distintas de 0. El encaste Vega Villar presentó las mayores diferencias entre la He y la Ho.
V.1.2 Equilibrio Hardy‐Weinberg
Drb
Bm2113
Hel1
Inra23
Agla232
Rm188
Tgla227
Eth10
Hel5
Eth225
Eth3
Bms2057
Bm1824
Tgla53
Inra37
Inra35
Eth185
Cssm66
Hel9
Tgla126
Bm143
Ilsts006
Haut 24
Tgla122
En la tabla 18 se muestran los análisis realizados para conocer la desviación con respecto a las condiciones del equilibrio Hardy‐Weinberg.
ALB X ANT X ARA ATA X X X X BAL BRA X CAR X X X COL X X X X X X X X X X X X X X X X CON X X COR X CRM CUA X DOM X X X X X X X X X X X FEL X GAM X X X X HID X X MAN MIU X X MON MUR X X X PAB X PED X X SAL X X X SIE X TOR URC VEG X X X X X X X X X X X VER VIL X X X X X X X Tabla 18: Desviaciones respecto al equilibrio Hardy-Weinberg (indicados con un X) de los encastes por microsatélite y total calculado con el método de cadenas de Markov y con un nivel de significación de P