Story Transcript
IX Congreso Galego de Estatística e Investigación de Operacións Ourense, 12–13–14 de novembro de 2009
LA RELACIÓN ENTRE EL DESARROLLO DE LA CUERNA DEL CORZO Y SU DENSIDAD ÓSEA SEGÚN LA EDAD, LA MORFOLOGÍA Y LA GENÉTICA Ramil Novo, L. A.1; Rigueira Rey, L.2; Gonzalo Orden, J. M.3 y Fidalgo Álvarez, L. E.4
1 Departamento de Estatística e Investigación Operativa. Facultade de Ciencias de Lugo. Universidade de Santiago de Compostela 2, 4 Departamento de Ciencias Clínicas Veterinarias. HUV Rof Codina. Facultade de Veterinaria. Universidade de Santiago de Compostela 3 Departamento de Medicina, Cirugía y Anatomía Veterinaria. Facultad de Veterinaria. Universidad de León RESUMEN Examinamos aquí la relación entre el CIC objetivo (índice reconocido del desarrollo de la cuerna) y varias determinaciones de la densidad ósea de la misma, L1 (en la vara de la cuerna), L2 (en la roseta), L3 (en el pivote) y L1L3 (entre el pivote y la vara de la cuerna). El análisis se centra en detectar las posibles diferencias entre grupos de corzos definidos por la edad, la morfología de la cuerna y el clado genético. En primer lugar se presentan las conclusiones de un análisis exploratorio preliminar basado en la comparación de rectas de regresión. A continuación se discuten las comparaciones de grupos llevadas a cabo mediante modelos de regresión múltiple basados en las variables originales y en transformaciones de las mismas. El estudio finaliza con la propuesta de modelos de regresión y de análisis de la covarianza para obtener ajustes de la relación entre el CIC objetivo y cada una de las densidades en cada grupo. Palabras y frases clave: capreolus; densidad ósea; desarrollo de la cuerna; regresión; F test; ANCOVA. 1. INTRODUCIÓN El corzo (Capreolus capreolus) es un mamífero de la familia de los cérvidos y se caracteriza, como el resto de la familia taxonómica, por la presencia, en los machos adultos, de unas pequeñas cuernas que mudan o renuevan anualmente. En épocas recientes se ha especulado mucho con la posibilidad de diferencias genéticas (de peso, medidas, etc.) entre las poblaciones corceras de diferentes lugares geográficos. Uno de los aspectos de mayor interés en la actualidad es el estudio de la relación de la genética con el desarrollo de la cuerna, sobre todo ante la expectativa de los gestores cinegéticos de poder conseguir y ofrecer a los cazadores corzos con “buenos trofeos” de forma rápida.
Pese a todo, son muy pocos los estudios realizados sobre el corzo en el marco peninsular y mucho menos los destinados al estudio de las causas que intervienen en el desarrollo de la cuerna. Con el presente trabajo pretendemos abordar el estudio de algunos de los factores que pueden tener relación con el desarrollo de la cuerna. Nos centramos, en particular, en el examen de la posible influencia de la edad, la morfología de la cuerna y la genética. Para reflejar de forma numérica el desarrollo de la cuerna decidimos adoptar los criterios empleados por las comisiones de homologación de trofeos y aceptados internacionalmente, siguiendo las normas del Conseil Internacional de la Chasse et de la Conservation du Gibier (CIC) (Notario 2002). Esta puntuación CIC se obtiene a partir de parámetros objetivos de la cuerna (como la longitud, el peso, etc.) y también algunos otros parámetros subjetivos como el color, el perlado etc. Los parámetros objetivos reflejan más del 80% de la puntuación final y en nuestra opinión son los que realmente reflejan el desarrollo de la cuerna. Por ello, en este estudio nos quedamos solamente con los aspectos cuantificables objetivamente, los cuales hemos recogido conjuntamente en un índice al que hemos denominado “CIC objetivo”. La influencia en el CIC objetivo de los factores de interés, la edad, la morfología de la cuerna y la genética, se estudia examinando la relación de aquel con las densidades óseas L1, L2, L3 y L1L3 en grupos definidos por los factores. La muestra de corzos estudiada la forman ejemplares de las provincias de Lugo (la mayoría) y A Coruña, pero por su composición se puede considerar que refleja bien la población corzuna del noroeste peninsular. Los corzos de la muestra inicial se clasificaron según los niveles de los tres factores mencionados: la edad (joven o adulto), la morfología de la cuerna (normal, atípica, deforme y en crecimiento) y el grupo genético (Oeste, Central I y Central II, véase Lorenzini y Lovari (2006)). En algunos ejemplares no se obtuvo la clasificación genética, y en los animales con cuerna en crecimiento no es posible hacer una valoración del CIC objetivo, por lo que estos casos fueron excluidos de la muestra, quedando finalmente un total de 87 corzos a considerar (véase la Figura 1). Un análisis exploratorio preliminar permitió observar (véase la Figura 2) que los corzos con una cuerna deforme tienen asignado un CIC objetivo claramente inferior y con menor variabilidad que las otras dos tipologías de cuerna. Por este motivo, dicha categoría será excluida de los análisis estadísticos subsiguientes ya que requieren la hipótesis de homocedasticidad (o de varianza constante). En lo sucesivo, se considera pues la muestra de n = 78 corzos resultante de eliminar los ejemplares de cuerna deforme en el colectivo representado en la Figura 1.
Figura 1. Composición de la muestra incluyendo los de cuerna deforme (n =87 corzos)
Figura 2. Gráfico de cajas para la muestra de los 95 corzos con CIC objetivo
2. ANÁLISIS DE LA INFLUENCIA DE CADA FACTOR EN LA RELACIÓN ENTRE EL CIC OBJETIVO Y CADA DENSIDAD ÓSEA Pretendemos en esta sección detectar diferencias entre grupos de corzos examinando la relación lineal entre el CIC y cada una de las densidades óseas L1, L2, L3 y L1L3. La comparación entre los grupos definidos por los niveles de un factor (la edad, la morfología o la genética), se hará examinando si existen diferencias significativas entre las rectas que describen la tendencia con la que cambia el CIC objetivo en función de cada una de las densidades óseas. En la Figura 3 se muestran, a modo de ejemplo, algunos ajustes de la relación CIC objetivo – densidad L1L3, identificando en los datos los grupos a comparar en cada caso. Con cada factor, la comparativa se llevó a cabo siguiendo el esquema de contrastes de hipótesis de la Figura 4, en el que se resumen los tres casos a los que puede conducir el proceso de comparación.
Para comparar los tres grupos genéticos se consideró el modelo de regresión, Y = β 0 + β1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 1 X 2 + β 5 X 1 X 3 + ε , en donde X 1 es el valor de la densidad ósea considerada , mientras que X 2 es una variable binaria que indica la pertenencia o no al grupo Central I, y
X 3 es la variable binaria indicadora de si el corzo es o no Central II. Dicho modelo se tomó como referencia en el contraste de igualdad de las tres rectas y en el contraste de paralelismo de las tres rectas (véase la Tabla 1, y los resultados de los tests asociados en la Tabla 2, columnas H 0( iii ) y H 0(iv ) ).
Figura 3. Rectas mínimo cuadráticas del CIC objetivo frente a L1L3. Arriba-izquierda, edad: adultos, círculos y trazo continuo; jóvenes, cuadrados y trazo discontinuo. Arriba-derecha, morfología de la cuerna: normal, círculos y trazo continuo; atípica, cuadrados y trazo discontinuo. Abajo, pares de grupos genéticos: Izquierda: Central I con círculos y trazo continuo; Oeste, cuadrados y trazo discontinuo a rayas. Derecha: Central II con círculos y trazo continuo; Oeste, cuadrados y trazo discontinuo a rayas. si se rechaza H0
ւ NO
H 0 : las rectas son idénticas
↓
NO
Caso 1 Ajustar las rectas mínimo cuadráticas de cada muestra
ցsi se acepta H0
Caso 3 Ajustar la recta mínimo cuadrática a la muestra conjunta
H 0∗ : las rectas son paralelas si se rechaza H∗0
SI
si se acepta H0
ց SI
Caso 2 Ajustar rectas paralelas mediante un análisis de la covarianza (ANCOVA)
Figura 4. Procedimiento utilizado para la comparación de rectas de regresión
La comparación de dos grupos genéticos, digamos A y B (se precisan en las hipótesis H 0( v ) , H 0( vi ) y
H 0( vii ) de la Tabla 1) se llevó a cabo con los datos de las muestras de ambos grupos y el modelo de regresión, Y = β 0 + β1 X 1 + β 2 X 2 + β3 X 1 X 2 + ε , en donde X 2 es una variable indicadora de si el corzo es del grupo A o del B, y X 1 es el valor de la densidad ósea considerada. Los resultados de los test basados en dicho modelo se presentan en la Tabla 2 en las columnas H 0( v ) , H 0( vi ) y H 0( vii ) . El modelo de regresión anterior se consideró también para la comparación de los dos grupos de edad (A=adulto y B=joven) y de los dos grupos definidos por la morfología de la cuerna (A=normal y B=atípica). Los resultados de los tests para contrastar las hipótesis de igualdad y paralelismo en el caso de la edad y de igualdad en el caso de la morfología de la cuerna (véase la Tabla 1), se recogen también en la Tabla 2. Para el contraste de cada una de las hipótesis nulas (frente a la hipótesis contraria respectiva) de la Tabla 1 se aplicó el correspondiente F test basado en la suma extra de cuadrados (véase Montgomery et al. (2002)). Dicho test compara el modelo de regresión reducido (el que resulta de asumir la hipótesis nula considerada) con el modelo de regresión completo mediante el cociente, 0 0 F = [ g /( g 0 − g )]( SSRe − SS ) / SS , en donde SS y SS son las sumas de cuadrados residuales, y s Re s Re s Re s Re s g0 y g son los grados de libertad, asociados al modelo reducido y al completo respectivamente. Tabla 1. Hipótesis nulas de los contrastes de comparación de rectas de regresión H 0( i ) : la recta del grupo joven es igual a la del grupo adulto H 0( ii ) : la recta del grupo joven es paralela a la del grupo adulto H 0( iii ) : las rectas de las tres variantes genéticas son iguales H 0(iv ) : las rectas de las tres variantes genéticas son paralelas H 0( v ) : las rectas del grupo Oeste y Central I son iguales H 0( vi ) : las rectas del grupo Oeste y Central II son iguales H 0( vii ) : las rectas del grupo Central I y Central II son iguales H 0( viii ) : la recta del grupo con cuerna normal es igual a la del grupo de cuerna deforme
Los F tests considerados se basan en modelos estadísticos en los que se asume que los errores experimentales son independientes (lo que está garantizado por la naturaleza de los datos), de varianza constante y siguen una distribución aproximadamente normal. La compatibilidad de los datos con estas dos últimas hipótesis se comprobó, en cada uno de los modelos de regresión utilizados, mediante el correspondiente análisis de los residuos, incluyendo el test de homocedasticidad de Levene (véase SPSS Inc (2007)). Por brevedad, no presentamos los resultados de dichas comprobaciones, si bien en los casos en los que se observaron incompatibilidades, describimos las transformaciones de los datos llevadas a cabo para evitarlas. Tabla 2. Niveles de significación críticos de los tests para las comparaciones de rectas de la Tabla 1 con las diferentes densidades óseas como covariable Respuesta Y Y Y Y Ln(Y)
Variable X 1
H 0( i )
H 0( ii )
L1 L2 L3 L1L3 L1
0,057 0,006 0,016 0,000027
0,957 0,378 0,333 0,021
H 0( iii )
H 0(iv )
H 0( v )
H 0( vi )
0,003 0,016 0,191 0,00037
0,766 0,624 0,463 0,436
0,002 0,004 0,059 0,0003
0,057 0,032 0,318 0,006
H 0( vii ) 0,376 0,374 0,046 0,019
H 0( viii ) 0,526 0,631 0,896 0,378
El análisis comparativo anterior basado en la relación del CIC objetivo con las densidades óseas pone de manifiesto lo siguiente. a) Los dos grupos de edad son claramente diferentes (resultados de la columna H 0(i ) ), y seleccionando como covariable L2, o L3 o L1L3, las rectas de ambas edades se pueden admitir paralelas (resultados de la columna H 0(ii ) ). En la comparación de edades basadas en L1 se apreció heterocedasticidad en los errores experimentales (p=0,044 en el test de Levene), lo que motivó la transformación ln(Y) para poder asumir la hipótesis de homocedasticidad. Se concluye que las rectas de los dos grupos de edad (de ln(Y) frente a L1) son distintas y no paralelas.
b) Los grupos genéticos no se pueden considerar homogéneos cuando se compara la relación del CIC con alguna de las densidades L1, L2 y L1L3 (véanse la columna H 0( iii ) ). Existen diferencias entre todos los pares de grupos genéticos en el caso de considerar L1L3 (véanse en la fila correspondiente, las columnas H 0( v ) , H 0( vi ) y H 0( vii ) ). Con L2 como X 1 resultan significativas las diferencias del grupo Oeste con los grupos Central I y Central II (véanse en la fila correspondiente, las columnas H 0( v ) y H 0( vi ) ). Considerando L1 como X 1 resultan significativas las diferencias entre los tres pares de grupos genéticos, si bien la comparación Central I−Central II requiere transformar la variable respuesta (se consideró el ln(Y)) para evitar la posible heterocedasticidad de los errores (p=0,056 en el test de Levene). Finalmente, con L3 de acuerdo con los resultados de la columna H 0( iii ) no se aprecian diferencias significativas entre los grupos genéticos (si bien en las comparaciones dos a dos se aprecian indicios de posibles diferencias entre Oeste y Central I –véase la columna H 0( v ) ). c) Las diferencias entre los dos tipos de morfología de la cuerna no son significativas (resultados de la columna H 0( viii ) ). 3. VISIÓN CONJUNTA DE LA RELACIÓN ENTRE EL CIC OBJETIVO Y LA DENSIDAD ÓSEA, LA EDAD Y EL GRUPO GENÉTICO Como hemos visto en la Sección 2, la edad y la genética son los factores que conducen a características diferenciales, y dado que la composición de la muestra por edades en cada grupo genético cambia (véase la Figura 1), nuestro objetivo ahora es buscar un modelo estadístico que nos permita examinar los dos factores a la vez en el estudio de la relación entre el CIC objetivo y las densidades. Como punto de partida se consideró el siguiente modelo de regresión: Y = β 0 + β1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 + β5 X 1 X 2 + β 6 X 1 X 3 + β 7 X 1 X 4 + ε (ML) en donde, X 1 es el valor de la densidad ósea considerada, X 2 es la variable binaria que indica la pertenencia al grupo Central I ( X 2 = 1 ), X 3 es la variable binaria indicadora del grupo Central II ( X 3 = 1 ), y X 4 es la variable binaria que indica si el corzo es joven ( X 4 = 1 ). El grupo Oeste queda caracterizado por X 2 = X 3 = 0 . La función de regresión del modelo ML se corresponde con una recta en cada uno de los seis grupos resultantes de combinar cada variante genética con cada edad. Los coeficientes que definen dichas rectas se recogen en la Tabla 3. Tabla 3. Rectas de regresión de los seis grupos definidos por la genética y la edad
Central I
jóvenes constante β0 + β 2 + β 4
pendiente β1 + β 5 + β 7
adultos constante β0 + β 2
pendiente β1 + β5
Central II
β 0 + β3 + β 4
β1 + β 6 + β 7
β0 + β3
β1 + β 6
β0 + β 4
β1 + β 7
β0
β1
Oeste
En el análisis de los residuos del modelo de regresión ML cualquiera que sea la densidad (L1, L2, L3 o L1L3) considerada como X 1 , se aprecia que en base al test de Levene es aceptable la hipótesis de varianza constante del error experimental, ya que en general el nivel crítico de dicho test es p ≥ 0,10. No obstante, en el gráfico de los residuos frente a los valores pronosticados se constata un ligero incremento de la dispersión con el valor medio si como X 1 se considera L1. Además en los gráficos de dispersión del CIC frente a algunas densidades óseas, en algunos grupos se observa la posibilidad de que la función de regresión tenga una ligera curvatura. En base a lo anterior, examinamos a continuación dos modelos de regresión alternativos orientados a corregir las posibles desviaciones de las condiciones clásicas sobre el error experimental que dan validez a los F tests: Y ∗ = β 0 + β1 X 1 + β 2 X 2 + β3 X 3 + β 4 X 4 + β5 X 1 X 2 + β 6 X 1 X 3 + β 7 X 1 X 4 + ε (ME) e Y ∗ = β 0 + β1 X 1∗ + β 2 X 2 + β 3 X 3 + β 4 X 4 + β 5 X 1∗ X 2 + β 6 X 1∗ X 3 + β 7 X 1∗ X 4 + ε (MP) en donde, Y ∗ = ln(Y ) y X 1∗ = ln( X 1 ) . Obsérvese que en cada grupo, de los seis grupos definidos por la edad y la genética, omitiendo el error experimental, se tiene que:
a) El modelo ME equivale a considerar un modelo de regresión de tipo exponencial para cada grupo ya que ln(Y ) = θ 0 + θ X 1 ⇔ Y = exp(θ 0 + θ X 1 ) en donde la constante θ 0 y la pendiente θ de cada grupo se obtienen como en la Tabla 3 (a partir de los βi del modelo ME). b) El modelo MP equivale a considerar un modelo de regresión de tipo potencial para cada grupo θ ya que ln(Y ) = ln(θ 0 ) + θ ln( X 1 ) ⇔ Y = θ 0 X 1 , en donde la constante ln(θ 0 ) y la pendiente θ de cada grupo se determinan de forma análoga (a partir de los βi del modelo MP). La Tabla 4 recoge los valores de los coeficientes de correlación de los tres modelos de regresión múltiple propuestos. Aunque los tres modelos resultan esencialmente válidos (si bien el test de Levene da indicios de heterocedasticidad con p = 0,076 en los modelos ME y MP basados en L2), con los modelos ME y MP el coeficiente de correlación es mayor, lo que justifica su estudio. Tabla 4. Coeficientes de correlación lineal de los modelos de regresión múltiple propuestos Coeficiente de correlación Modelo de regresión
R (n = 78 corzos) ML ME MP
L1 0,731 0,799 0,808
L2 0,827 0,852 0,852
L3 0,700 0,726 0,721
L1L3 0,848 0,863 0,867
La función de regresión de los tres modelos propuestos ML, ME y MP equivale a una recta en cada uno de los seis grupos definidos por la edad y la genética, si bien en el caso de los modelos ME y MP la recta se define en términos de las transformaciones de variables ya indicadas. La comparación de grupos que proponemos se basa en la comparación de las rectas correspondientes. Dicha comparación se llevará a cabo mediante los respectivos F tests para contrastar cada una de las hipótesis de la Tabla 5. Tabla 5. Hipótesis nulas de los contrastes de comparación de rectas de regresión H 0I : la recta del grupo joven es igual a la del grupo adulto en cada variante genética H 0II : la recta del grupo joven es paralela a la del grupo adulto en cada variante genética H 0III : las rectas de las tres variantes genéticas son iguales en cada grupo de edad H 0IV : las rectas de las tres variantes genéticas son paralelas en cada grupo de edad H 0V : las rectas del grupo Oeste y Central I son iguales en cada grupo de edad H 0VI : las rectas del grupo Oeste y Central II son iguales en cada grupo de edad H 0VII : las rectas del grupo Central I y Central II son iguales en cada grupo de edad
H 0I : β 4 = β 7 = 0 H 0II : β 7 = 0 H 0III : β 2 = β3 = β5 = β 6 = 0 H 0IV : β5 = β 6 = 0 H 0V : β 2 = β5 = 0 H 0VI : β3 = β 6 = 0 H 0VII : β 2 = β3 y β 5 = β 6
Con el modelo ML como referencia, los resultados de los F tests, para cada una de las densidades óseas como variable X 1 , se recogen en la Tabla 6. Los resultados sugieren que con el modelo ML, L1L3 es la única densidad ósea que permite detectar diferencias significativas tanto entre los dos grupos de edad (con p = 0,052) como entre cada par de grupos genéticos (se rechazan H 0V , H 0VI y H 0VII con p-valores inferiores a 0,05). Tabla 6. Niveles de significación críticos de los tests para las comparaciones de la Tabla 5 basadas en el modelo ML con las diferentes densidades óseas como covariable Respuesta Y Y Y Y
Variable X 1
H 0I
H 0II
H 0III
H 0IV
H 0V
H 0VI
H 0VII
L1 L2 L3 L1L3
0,012 0,157 0,006 0,052
0,944 0,961 0,901 0,328
0,026 0,040 0,180 0,001
0,865 0,595 0,146 0,181
0,005 0,010 0,048 0,000206
0,258 0,064 0,415 0,020
0,057 0,349 0,238 0,037
Al considerar como referencia, o bien el modelo ME, o bien el modelo MP se detectan diferencias entre grupos que no resultan significativas con el modelo ML. Basta para ello comparar las filas correspondientes a L1, L2 y L3 de la Tabla 6 con las correspondientes en las Tablas 7 y 8. Concretando más, los resultados de la Tabla 7 y 8 indican que tanto con el modelo ME como con el modelo MP, considerando como X 1 , o bien L1L3 o bien L1, se tiene que: a) Las diferencias entre los dos grupos de edad son significativas (se rechaza H 0I con p < 0,05). b) Las diferencias entre cada par de grupos genéticos son significativas. Se rechazan H 0V , H 0VI y
H 0VII ya que los p-valores son todos inferiores a 0,05 salvo en la comparación basada en L1 de Central ICentral II, en la que p=0,064 con el modelo ME y p=0,058 con el modelo MP, por lo que estas diferencias no son del todo concluyentes. Tabla 7. Niveles de significación críticos de los tests para las comparaciones de la Tabla 5 basadas en el modelo ME con las diferentes densidades óseas como covariable Respuesta
Variable X 1
H 0I
H 0II
H 0III
H 0IV
H 0V
H 0VI
H 0VII
Y * =ln(Y) Y * =ln(Y) Y * =ln(Y) Y * =ln(Y)
L1 L2 L3 L1L3
0,002 0,010 0,0005 0,008
0,283 0,170 0,112 0,250
0,004 0,001 0,016 0,0000309
0,329 0,091 0,021 0,022
0,001 0,00016 0,004 0,0000027
0,036 0,003 0,339 0,002
0,064 0,226 0,026 0,020
Tabla 8. Niveles de significación críticos de los tests para las comparaciones de la Tabla 5 basadas en el modelo MP con las diferentes densidades óseas como covariable Respuesta
Variable X 1
H 0I
H 0II
H 0III
H 0IV
H 0V
H 0VI
H 0VII
Y * =ln(Y)
X 1∗ = ln(L1)
*
Y =ln(Y)
0,004
0,302
0,004
0,405
0,001
0,044
0,058
∗ 1
0,029
0,311
0,001
0,111
0,000239
0,004
0,236
∗ 1
X = ln(L2)
*
X = ln(L3)
0,001
0,162
0,007
0,008
0,002
0,316
0,011
*
∗ 1
0,020
0,545
0,000009
0,004
0,00000073
0,001
0,014
Y =ln(Y) Y =ln(Y)
X = ln(L1L3)
4. AJUSTE DE MODELOS PARA LA COMPARACIÓN DE GRUPOS Examinamos aquí varios ajustes para la relación entre el CIC y cada densidad ósea en cada grupo definido por la edad y la genética. Los ajustes se derivan de los modelos ML, ME y MP, una vez simplificados en base al análisis comparativo de la Sección 3. Por brevedad mostramos sólo los resultados en aquellos casos en los que la variable X 1 seleccionada permite detectar diferencias significativas tanto entre grupos de edad (se rechaza H 0I ) como entre cada par de grupos genéticos (se rechazan H 0V , H 0VI y H 0VII ), y a la vez se aceptan las hipótesis de paralelismo de las rectas de los grupos de edad ( H 0II ) y de los tres grupos genéticos ( H 0IV ). Nos centramos así en los resultados de las filas Y-L1L3 de la Tabla 6, ln(Y)-L1 de la Tabla 7 y ln(Y)-ln(L1) de la Tabla 8. En estos casos, aceptar las hipótesis de paralelismo H 0II y H 0IV conduce a los modelos simplificados:
Y = β 0 + β1 X 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 + ε
(MLS)
con L1L3 como variable X 1 , e
Y ∗ = β 0 + β1 X 1 + β 2 X 2 + β3 X 3 + β 4 X 4 + ε ,
(MES)
Y ∗ = β 0 + β1 X 1∗ + β 2 X 2 + β 3 X 3 + β 4 X 4 + ε
(MPS)
∗
∗ 1
en donde Y = ln(Y ) , X 1 es la densidad L1, y X = ln( X 1 ) . Los modelos MLS, MES y MPS equivalen a considerar un modelo de análisis de la covarianza (ANCOVA), Yɶijk = µ + α i + βj + θ ⋅ Xɶ ijk + ε ijk , efecto del grupo de edad i
efecto del grupo genético j
pendiente covariable en el común individuo k del grupo (i,j)
en donde Yɶ es Y o ln(Y ) según corresponda, y Xɶ es la covariable correspondiente. De los ajustes de los modelos ANCOVA respectivos, se derivan los ajustes de la Tabla 9 para cada grupo definido por la
edad y la genética. A nivel ilustrativo, se muestran, para los grupos de edad de los clados Oeste y Central I, los ajustes correspondientes a los modelos MES y MPS en la Figura 5. Tabla 9. Coeficientes de las curvas de regresión de los grupos definidos por la edad y la genética modelo MLS Regresión Coeficiente θ Coeficiente θ0 Genética\Edad Central I Central II Oeste
X 1 = L1L3
Y = θ0 + θ X1
modelo MES
X 1 = L1
Y = exp(θ0 + θ X 1 )
modelo MPS
X 1 = L1 θ
Y = θ0 X 1
83,7056
1,45
1,8033
θ0 = µ + α i + β j
θ0 = µ + α i + β j
θ0 = exp( µ + α i + β j )
jóvenes -59,4674 -66,0591 -72,8931
adultos -54,3786 -60,9703 -67,8043
jóvenes 2,2536 2,0918 1,9577
adultos 2,4426 2,2808 2,1467
jóvenes 39,7059 33,9164 29,6333
adultos 47,3042 40,4069 35,3041
Finalizamos este trabajo observando que las variables Z LS = (Y − β 0 − β1 X 1 − β 4 X 4 ) / σ ε (con los
βi y σ ε del modelo MLS), Z ES = (ln(Y ) − β 0 − β1 X 1 − β 4 X 4 ) / σ ε (con los βi y σ ε del modelo MES) y Z PS = (ln(Y ) − β 0 − β1 ln( X 1 ) − β 4 X 4 ) / σ ε (con los βi y σ ε del modelo MPS) son de utilidad para identificar los grupos genéticos. Nótese que para cada Z , se tiene que el valor medio E[ Z ] vale 0, β 2 / σ ε o β3 / σ ε según el corzo sea del grupo Oeste, Central I o Central II respectivamente. Los valores aproximados de cada Z pueden obtenerse a partir de los ajustes de los modelos ANCOVA correspondientes.
Figura 5. Ajustes para los dos grupos de edad de los clados Central I (azul) y Oeste (negro), adultos: trazo continuo, ecuación a la derecha; jóvenes: trazo discontinuo, ecuación a la izquierda. Arriba: ajustes basados en el modelo MES, abajo: ajustes basados en el modelo MPS
Una discusión como la anterior, sin asumir la hipótesis de paralelismo de las rectas de los grupos genéticos, podría hacerse tomando como referencia los modelos ME y MP con L1L3 como X 1 (véanse las Tablas 7 y 8). 5. AGRADECIMIENTOS Este trabajo ha sido parcialmente subvencionado por medio del convenio entre la Xunta de Galicia y la Universidade de Santiago de Compostela con número de referencia 2003/CP508.
REFERENCIAS Lorenzini, R. y Lovari, S. (2006). Genetic diversity and phylogeography of the European roe deer: the refuge area theory revisited. Biological Journal of the Linnean Society 88 (1), 85–100. Montgomery, D.C.; Peck, E. A. y Vining, G.G. (2002). Introducción al análisis de regresión lineal. CECSA. Notario, R. (2002). 50 años de homologación de trofeos de caza mayor en España. Formularios y metodologías de valoración, los mejores ejemplares de cada especie y evolución de las capturas. Ed. WAVES. SPSS Inc. (2007). SPSS Statistics 17.0 Algorithms.