UNIVERSIDAD AGRARIA DE LA HABANA
“FRUCTUOSO RODRÍGUEZ PÉREZ”
Ponencia: El Modelo Lineal Generalizado (MLG) como alternativa
para el analisis de variables continuas. Una
aplicación en la especie bufalina.
1Instituto de Ciencia Animal. Carretera
Central, km. 47 ½. San José
de las Lajas. La Habana. Cuba.
2 Centro Universitario Municipal de Güines, La Habana
Resumen:
Se realizó un estudio en búfalas para conocer la influencia que
ejerce la edad al primer parto (EPP) sobre la duración de la lactancia
(DL), considerada esta última como variable binaria: en cada caso se
estudiaron las lactancias cortas y largas, considerando el 25 % y 50 % de todas
las lactancias. La EPP se analizó como
covariable categórica dividida en cuatro clases y como
covariable continua, se consideró en el modelo el grupo
contemporaneo (GC) como
efecto fijo (rebaño-año-época). Se utilizó el
Modelo Lineal Generalizado (MLG), para lo cual se emplearon 1690 lactancias de
356 búfalas de cuatro provincias del país en el período
1985 al 2008 y la función Logit, se consideró como función
de enlace, de acuerdo a criterios de laliteratura especializada. El
analisis de la EPP, considerada como covariable categórica
(CLEPP) alcanzó significación estadística, esto es, por
cada incremento unitario de la CLEPP, disminuyó la proporción de
lactancias cortas para el 25 % y 50 % respectivamente. Los valores predichos de
la DL obtenidos del
MLG, se ajustaron a una regresión polinomial de segundo grado, lo cual
se evidenció que la duración de lactancia de 25% fue la que
presentó un mejor ajuste. Al considerar la EPP como variable continua, los resultados fueron
similares al obtenido como
covariable en forma categórica.
Palabras clave: MLG, especie búbalina (Bubalus bubalis), duración
de lactancia, edad al primer parto.
Introducción
El analisis de variables continuas, especialmente las que tienden a
ajustarse a una distribución Normal,
ha tenido un progreso sostenido y rapido
durante el pasado y presente siglo. Por el contrario, ha sido
mucho mas reciente el desarrollo de otras metodologías
estadísticas para el analisis de variables categóricas o
binarias, las cuales son de gran interés en la investigaciones
zootécnicas (Verde, 2000). Es de señalar que las variables
continuas pueden ser convertidas en categóricas o binarias según
los objetivos que sepersigan en el estudio, en este
sentido diversos autores han recomendado el empleo del
Modelos Lineales Generalizados (MLG) como
alternativa de analisis con el objetivo de obtener mejores estimaciones
de los resultados.
El MLG fue propuesto por Nelder y Wedderburn (1972), quienes propusieron una
extensión del
Modelo Lineal General, unificando diferentes modelos pertenecientes a familias
de distribuciones exponenciales, los cuales analizan variables respuestas tanto
numéricas como
categóricas.
La producción de leche de búfala es una actividad de importancia
en Cuba
y en este sentido se han realizado diversas
investigaciones sobre esta tematica. Se ha evidenciado
la influencia que ejerce la edad al primer parto sobre la producción de
leche (Fraga et al., 2005), pero aun no se conoce con exactitud la influencia
que tiene esta característica sobre la duración de la lactancia.
Teniendo en cuenta los aspectos antes planteados el objetivo de este trabajo fue estudiar la influencia de la edad al primer
parto sobre la duración de la lactancia, considerada como
variable binaria en la especie bubalina (Bubalus bubalis), con empleo del Modelo Lineal
Generalizado.
Materiales y métodos
Se emplearon 1690 lactancias de 356 mestizas Bufalipso, pertenecientes a cuatro
provincias del
país (LaHabana, Matanzas,
Villa Clara y Granma). Las variables analizadas fueron: duración de
lactancia (DL) que fue convertida a variable binaria, como se puede observar en la tabla 1:
Tabla 1. Clasificación de la DL en días
Clasificación de la DL 25% de las observaciones 50% de las observaciones
0 ≤ 213 ≤ 248
1 > 213 > 248
La edad al primer parto se estudió como covariable continua (EPP) y
categórica (CLEPP) al clasificarla en 4 clases:
1: menor o igual de 36,4 meses
2: entre 36,4 y 45,5 meses
3: entre 45,5 y 76,7 meses
4: mayores de 76,7 meses
Se empleó el Modelo Lineal Generalizado (MLG) considerando la variable
DL como binaria. Se consideró dentro del modelo el efecto del
grupo contemporaneo (GC) (rebaño-año-época) como fijo. La
expresión del
modelo fue:
Yij = β0 + GCi + β1EPPj + eij
donde:
Yij: f(µ) valor esperado de la variable DL, atendiendo a la
función de enlace
especificada.
β0: intercepto.
GC i: efecto del grupo contemporaneo (i = 1, 2, ….62)
β1: parametro desconocido asociado a la EPP, considerada como
covariable categórica y
continua
eij: efecto del error aleatorio asociado a la j-ésima observación
(j = 1,2……1690)
La función de enlace correspondiente a la variable binaria fue Logit.
donde:
η : predictor lineal
P: proporción dela DL, para 25% y 50%.
Para el procesamiento de los datos se empleó el paquete
estadístico SAS (2007) versión 9.1.3 procedimiento GENMOD
(Generalized Linear Model) y PROC FREQ.
Para analizar el comportamiento de los valores predichos de la DL, a partir del
MLG, y la CLEPP, se obtuvo el mejor ajuste con el modelo de regresión
polinomial de segundo grado, empleando el software estadístico
STATGRAPHICS plus 5.1, (2001)
Resultados y discusión
En la tabla 2 se muestra el analisis de la DL para 25% y el 50% de las
observaciones y la EPP como covariable categórica (CLEPP). Se observa que la covariable alcanzó significación
estadística, por lo que existe una influencia de la CLEPP sobre la
proporción de la DL. Esto significa que por
cada aumento unitario de CLEPP, disminuye la proporción de lactancias
cortas.
Tabla 2. Analisis de los estimadores de los
parametros de la duración lactancia al 25% y
50%
Parametros GL Estimadores EE(±) Wald 95%
Límites de Confianza
X2
Pr > X2
PDL25%
Intercepto 1 0,40 0,13 0,14 0,66 9,16 0,0025
CLEPP 1 -0,26 0,05 -0,36 -0,17 28,81 < 0,0001
PDL50%
Intercepto 1 2,40 0,17 2,06 2,72 199,17 < 0,0001
CLEPP 1 -0,19 0,05 -0,29 -0,09 13,17 0,0003
El GC presentó diferencias de significativas (p