SciELO - Scientific Electronic Library Online

 
vol.29 número1Sistematización de procesos para estudios de aforo de pozos de agua subterránea en áreas sujetas a la adquisición de datos sísmicosFuentes alternas de fósforo en la alimentación de ovinos índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Interciencia

versión impresa ISSN 0378-1844

INCI v.29 n.1 Caracas ene. 2004

 

MANOVA BIPLOT PARA ARREGLOS DE TRATAMIENTOS CON DOS FACTORES BASADO EN MODELOS LINEALES GENERALES MULTIVARIANTES

Isidro Rafael Amaro, José Luis Vicente-Villardón y María Purificación Galindo-Villardón

Isidro Rafael Amaro. Doctor en Estadística, Universidad de Salamanca, España. Profesor, Facultad de Ingeniería, Núcleo de Cagua, Universidad Central de Venezuela. Dirección: Facultad de Ingeniería, UCV. Cagua 2122, Estado Aragua, Venezuela. e-mail: amaror@hotmail.com

José Luis Vicente-Villardón. Doctor en Estadística, Universidad de Salamanca. Profesor, Departamento de Estadística, Universidad de Salamanca, España

María Purificación Galindo-Villardón. Doctora en Matemáticas, Universidad de Salamanca. Directora, Departamento de Estadística, Universidad de Salamanca. España.

Resumen

Este trabajo generaliza el Manova-Biplot de modelos lineales generales multivariantes para diseños de dos vías, proponiendo cuatro tipos de Biplot: el Biplot Total, el Biplot de Interacción y los Biplots de Filas y Columnas. Estos Biplots permiten estudiar la separación de grupos, la influencia de las variables, el efecto de la interacción, importancia de las variables en la interacción, el efecto de filas y el efecto de columnas, y los contrastes respectivos. Los resultados se presentan como diagramas de dispersión con marcadores para los grupos y vectores para las diferentes variables. Se introducen regiones de confianza y se proponen índices para el cálculo de la calidad de representación.

Summary

The Manova-Biplot for the Multivariate General Linear Model is generalized for two way Manova, and four Biplot representations are proposed: Total Biplot, Interaction Biplot, and Row and Column Biplots. These Biplots allow group separation, the study of the influence of variables, interaction effects, weight of variables in the interaction, row and column effects, and the corresponding contrasts. The results are presented as dispersion diagrams with group and vector markers for the different variables. Confidence regions are calculated and measures of quality of representation are proposed.

Resumo

Este trabalho generaliza o Manova-Biplot de modelos lineares gerais multivariantes para desenhos de duas vías, propondo quatro tipos de Biplot: o Biplot Total, o Biplot de Interação e os Biplots de Filas e Colunas. Estes Biplots permitem estudar a separação de grupos, a influência das variáveis, o efeito da interação, importância das variáveis na interação, o efeito de filas e o efeito de colunas, e os contrastes respectivos. Os resultados se apresentam como diagramas de dispersão com marcadores para os grupos e vectores para as diferentes variáveis. Se introduzem regiões de confiança e se propõe índices para o cálculo da qualidade de representação.

Palabras Claves / Biplot / Calidad de Representación / MANOVA / Manova-Biplot / Modelo Lineal General Multivariante/

Recibido: 07/10/2003. Aceptado: 14/01/2004.

En muchos experimentos diseñados se dispone de varias variables respuesta y se quiere buscar las diferencias entre varios grupos. El análisis adecuado para este tipo de situación es el Análisis Multivariante de la Varianza, MANOVA; aunque también se ha utilizado el análisis de variables canónicas o ambas técnicas combinadas.

La limitación fundamental a la hora de trabajar con las técnicas multivariantes es la complejidad en la presentación de los resultados y la interpretación de los mismos, sobre todo cuando se tienen muchas variables, debido a las interrelaciones entre ellas y a la variabilidad de características asociadas a los modelos. Ésto ha conducido a muchos investigadores a realizar análisis univariantes para cada una de las variables por separado, con los consecuentes errores u omisiones en la interpretación de sus resultados.

Con el propósito de subsanar estos problemas se han usado los métodos Biplot para representar los resultados de un MANOVA. Así han nacido los denominados Manova-Biplot de una vía (Gabriel, 1972, 1995) o Biplot Canónico (Vicente-Villardón, 1992; Gower y Hand, 1996), que permiten una representación ponderada de la matriz de medias que consigue las direcciones con máximo poder discriminante entre grupos. Esta técnica permite poner de manifiesto las principales diferencias entre grupos, las variables responsables de las diferencias y realizar inferencias sobre las variables canónicas y originales mediante círculos de confianza situados sobre los puntos que representan a los grupos.

La incorporación de pruebas gráficas de significación introduce una característica diferencial importante con respecto a los Biplots Clásicos de Gabriel (1971), en el sentido que se usa el Biplot para estudiar aspectos inferenciales y no solo descriptivos.

De esta forma, los métodos Biplot se usan como representaciones de los resultados de un MANOVA y permiten reducir la dimensionalidad del problema y facilitar la interpretación de los modelos.

Generalmente se ha estudiado el caso en el que se dispone de una clasificación simple. Lejeune y Calinski (2000) abordan el problema para la clasificación de dos vías desde el punto de vista del análisis de variables canónicas usando el estadístico Lawley-Hotelling, pero no estudian detalladamente la interacción entre factores y no presentan estimadores sobre la calidad de las representaciones gráficas y estudios sobre los intervalos de confianza.

En el presente trabajo se propone la generalización del Manova-Biplot al caso de diseños de dos vías, utilizando cuatro representaciones que recogen las diferentes fuentes de variación: el Biplot Total, el Biplot de Interacción, y los Biplots de Filas y Columnas. El trabajo se complementa con la propuesta de índices de calidad de la representación de medias y variables, que permiten determinar qué se interpreta en cada eje, así como regiones de confianza para medias o combinaciones de medias. Los Biplots y los índices propuestos se aplican a un conjunto de datos.

Métodos

Se describen a continuación algunas propiedades básicas de la teoría general de MANOVA y de Manova-Biplot, así como la descripción detallada de los Biplots propuestos. La justificación de muchos de los resultados presentados aquí puede encontrarse en Gabriel (1972, 1995), Mardia et al. (1979), Morrison (1978) o Seber (1984).

Manova-Biplot

El modelo MANOVA para p variables, puede expresarse en forma matricial como

X = AB + U           (1)

donde X denota la matriz n·p de las observaciones, A es una matriz de diseño apropiada de rango r, B es la matriz de parámetros desconocidos, y la matriz U, n·p, contiene los residuales.

La hipótesis lineal general multivariante es

H0: CB = 0          (2)

donde C, tiene dimensiones g·q y rango g £ r.

La matriz C puede elegirse de muchas formas distintas. Cambiando la forma de C es posible construir Biplots para las distintas hipótesis a estudiar. Generalmente C contiene un conjunto de coeficientes para los contrastes.

Un Biplot para la matriz se puede construir a partir de la Descomposición en Valores Singulares Generalizada:

donde y es la matriz de suma de cuadrados y productos ‘dentro’ de grupos, y los ls son los valores propios correspondientes según el proceso de Descomposición en Valores Singulares.

A partir de aquí se toman como marcadores para las filas a

P = R½UDl           (4)

y como marcadores para las columnas a

Q = E½V            (5)

de manera que

 

Esta descomposición puede interpretarse como una Descomposición en Valores Singulares Generalizada de la matriz de estimadores de los parámetros usando R y E como métricas, de esta manera, el primer valor propio de la descomposición Biplot coincide con el de MANOVA, y así se logran las direcciones de máxima separación entre grupos.

Sin embargo, en general, el Biplot obtenido es difícil de interpretar, por lo que se propone para el estudio una representación alternativa, la proyección de las matrices de medias cuya interpretación es semejante a la que se hace en los Biplots clásicos.

En las representaciones de las medias conservamos la propiedad de que el eje maximiza la F para la hipótesis estudiada y además podemos interpretar las medias en términos de patrones geométricos que describiremos más adelante.

Manova de Dos Vías

La diferencia en un MANOVA de dos vías es que pueden contrastarse varias hipótesis, para los efectos principales y para la interacción; asociados con cada una de las hipótesis pueden construirse distintas representaciones canónicas que permiten el estudio separado de cada una de ellas.

Si xijkh es la k-ésima observación sobre la respuesta h obtenida bajo el i-ésimo tratamiento de la primera vía de clasificación (fila) y el j-ésimo tratamiento de la segunda (columna), el modelo lineal para cada observación es

xijkh = µh + aih + tjh + hijh + eijkh

donde µh: parámetro general de la respuesta h, h=1, ..., p; aih: efecto del tratamiento fila i sobre la respuesta h, i=1, ..., r; tjh: efecto del tratamiento columna j sobre la respuesta h, j=1, ..., c; hijh: efecto de la interacción entre el tratamiento i y el j sobre la respuesta h, k=1, ..., n; y eijkh: término del error.

Ésto puede escribirse en forma matricial compacta como X = AB + U,

donde X = (rcn) · (p), A = (rcn) · (r+1)(c+1), B = (r+c)(c+1) · (p), y U = (rcn) · (p).

Llamando ai = (ai1, …, aip)’, tj = (tj1, …, tjp)’, y hij = (hij1, …, hijp)’ las hipótesis de interés son

H0 : a1 = … = ar, no hay efecto fila

0 : t1 = … = tc, no hay efecto columna

H’’0 : h11 = … = hrc = 0, no hay interacción

Para escribir estas hipótesis en forma matricial compacta, CB = 0, es necesario usar una matriz C distinta según la hipótesis que se quiere probar.

Morrison (1978) indica que para probar estas hipótesis, usando el Principio de Unión-Intersección, se forman los productos H1E-1 para efecto fila, H2E-1para efecto columna, y H3E-1 para efecto interacción, donde

Hi = X’Ai(A’iAi)-1C’i[Ci(A’iAi)-1C’i]-1 Ci(A’iAi)-1A’iX       (6)

y E = X’[IA(A’A)-1A’]X

donde A1 (rcn)·r, A2 (rcn)·c, A3 (rcn)·(rc)

Las matrices Ci cambian según las hipótesis a probar y, al igual que las Ai, son matrices de 0 y 1 convenientemente  ubicados.

A partir de estos productos se calculan las mayores raíces características: c1s, c2s, c3s y los estadísticos (c1s/1+c1s) se buscan en la tabla adecuada (tablas 6 al 14 del apéndice en Morrison, 1978; y apéndice D4 en Seber, 1984), para finalmente aplicar el criterio de la mayor raíz característica.

Manova-Biplot de Dos Vías

Se proponen 4 tipos de Biplot para representar los resultados de un MANOVA para un diseño de dos vías, todos construidos a partir del Biplot de la matriz de parámetros del modelo MANOVA: el primero que denominamos Biplot Total; y, los otros tres: Biplot de interacción, de filas y de columnas.

Cada uno con un objetivo particular, y que se diferencian, básicamente, en la forma de escoger las matrices R y en la descomposición inicial.

Biplot Total. En este caso R = (A’A)-1, = (A’A)-1A’X, y C = I. Se sustituyen estas expresiones en (3) y se obtienen los respectivos marcadores para filas y columnas de las ecuaciones (4) y (5).

Esto es equivalente a tomar todos los tratamientos (combinaciones de niveles de los factores) y así se trata el problema como el MANOVA de una vía (Gabriel, 1995).

Por lo tanto, el Manova-Biplot obtenido de esta forma tiene las mismas propiedades que el Manova-Biplot de una vía. En particular nos permite estudiar semejanzas y diferencias entre grupos, que en este caso son las combinaciones de niveles de los factores; variables que más importan en las comparaciones entre los grupos, la dirección de máxima separación entre grupos, y las calidades de representación. Sin embargo, en general no es la forma más adecuada para estudiar la interacción, ni los efectos de filas y/o columnas, ya que muestra combinados los efectos principales y la interacción.

En este tipo de Biplot, el eje es la combinación de variables que maximiza la parte controlada en el MANOVA, por lo que estará dominado fundamentalmente por aquella parte en la que el efecto sea más claro. No obstante, el Biplot seguirá siendo útil para estudiar las características del problema.

Biplot de Interacción. En este caso se sustituyen R y en (3) por R = C3(A’3A3)-1C’3 y = C3(A’3A3)-1A’3X, donde A3 y C3 son las matrices usadas en (6).

Los marcadores para los centroides de los grupos son = inEV, donde in es la matriz de las medias de las celdas que se expresa como in = (A’3A3)-1A’3X.

Los marcadores para las variables son Q = E½V y los marcadores para el conjunto de contrastes son P = R½UDl .

Las propiedades del Biplot de Interacción son:

1- El Biplot obtenido de esta forma es equivalente a la obtención de las variables canónicas para la hipótesis de interacción, es decir, los ejes son aquellas combinaciones lineales de variables que maximizan la F de Snedecor para la interacción. Este hecho nos permite la interpretación de la interacción con máxima resolución, a diferencia del Biplot Total que la combina con los efectos principales.

2- El producto escalar p’kq aproxima el contraste k-ésimo sobre la variable l y el producto escalar ’(i,j)q aproxima la media (i,j)l de la combinación del nivel i de las filas y el j de las columnas sobre la variable l.

3- La bondad del ajuste para la representación de los contrastes será

 

y la bondad del ajuste para la representación de las medias no se calcula porque el propósito de la representación es la interpretación de la interacción.

4- Para cada uno de los contrastes, la longitud al cuadrado del marcador aproxima la distancia de Mahalanobis al vector nulo, es decir, aproxima la desviación de la hipótesis nula de igualdad a cero para ese contraste particular.

5- Las contribuciones calculadas en la forma habitual como el cociente entre la coordenada al cuadrado y la suma de cuadrados de las coordenadas para los distintos ejes, puede interpretarse como la parte de la desviación de la hipótesis nula recogida por el eje.

6- En la proyección de las medias, la longitud al cuadrado del marcador que representa a una media aproxima también la distancia de Mahalanobis al vector nulo, pero la aproximación no es óptima en relación a las medias. Puede interpretarse como la parte de la distancia explicada por la interacción, esto es

7- El Biplot de medias puede utilizarse para estudiar la interacción mediante patrones gráficos de forma similar a como se utilizan los gráficos de interacción en el análisis univariante.

Si (ij),l representa la media de la variable l (l=1, ..., p) del grupo i,j-ésimo (i=1, ..., r), (j=1, ..., c), entonces, no existe interacción entre los dos factores de variación si (ij), l (ij’), l - (i’j), l - (i’j’), l = 0, que sobre la representación Biplot vienen aproximadas como p’ijql - p’ij’ql - p’i’jql + p’i’j’ql = (p’ij - p’ij’ - p’i’j + p’i’j’)ql para p y q tomados apropiadamente. Esta cantidad es aproximadamente cero si p’ij - p’ij’ = p’i’j - p’i’j’.

Para que estas cantidades sean aproximadamente iguales, los cuatro marcadores fila correspondientes han de formar un paralelogramo. Si no es así, el efecto interacción puede estimarse como el vector que hay que trasladar uno de los puntos para que forme un paralelogramo con los otros tres (Figura 1).

La interacción será máxima para aquellos vectores variables paralelos al vector de interacción resultante, y mínima para los perpendiculares.

Biplot de Filas. En este caso R = C1(A’1A1)-1C’1, y = C1(A’1A1)-1A’1X.

La matriz fi de las medias para filas, se expresa como fi = (A’1A1)-1A’1X.

Los marcadores para los grupos son fi = XfiEV y los marcadores para las variables son Q = EV.

Las propiedades del Biplot de Filas son:

1- El Biplot de filas es equivalente a la obtención de las variables canónicas para la hipótesis de efecto de filas; por lo tanto, los ejes son aquellas combinaciones lineales de las variables que maximizan la F de Snedecor para el efecto del factor fila.

2- Este Biplot permite estudiar semejanzas y diferencias entre los grupos construidos según el factor de clasificación por filas, cuando el efecto es significativo.

3- Se pueden construir círculos de confianza alrededor de los centroides de los grupos, de tal forma que si los círculos no se interceptan el efecto del factor fila es significativo. Si se interceptan es necesario hacer otras pruebas para estudiar la significación.

4- Se puede interpretar la importancia de las variables en la separación de los grupos, de manera análoga a como se hace en el Manova-Biplot de una vía.

5- La calidad de representación se estudia más adelante.

Biplot de Columnas. En este caso se sustituyen R y en (3) por R = C2(A’2A2)-1C’2, y = C2(A’2A2)-1A’2X. La matriz co de las medias para columnas, se expresa como co = (A’2A2)-1A’2X.

Los marcadores para los grupos son Pco1 = coEV, y los marcadores para las variables son Q = E½V.

El Biplot de Columnas tiene propiedades semejantes a las del Biplot de filas, solo que en este caso se hacen comparaciones entre los grupos que resultan del factor columna.

Regiones de Confianza

Se puede construir un intervalo de confianza univariante sobre la proyección de cada una de las medias en cada una de las variables. El estimador de la media es

(ij),l = p’ij ql = proy (pij,ql||ql||

por tanto, el intervalo puede calcularse sobre las proyecciones directamente como

proy (pij,ql) ± tj,a / Önij

ya que la longitud es la misma para todos los grupos. El intervalo construido de esta forma sirve para la proyección en cualquier dirección. Luego, en el espacio multidimensional puede construirse una hiperesfera de radio tj,a / Önij de forma que, al proyectarla sobre cada variable, obtenemos un intervalo de confianza univariante.

La proyección de las esferas de confianza sobre el espacio canónico en dimensión reducida produce una prueba conservadora en el sentido de que si las proyecciones no se cortan, se encuentran diferencias entre las medias, pero si se cortan, puede ser un efecto debido simplemente a la proyección. Con el software adecuado, se podrían obtener radios exactos en cada variable por separado, ajustando los radios de los círculos usando la calidad de representación.

Las pruebas propuestas de esta forma sirven tanto para las medias de las celdas como para las medias de los efectos principales sin más que adecuar los tamaños muestrales.

Los contrastes para la interacción suelen realizarse para subtablas dos por dos, tomando una categoría de filas y una de columnas como base, y realizando todas las comparaciones con ellas, tendríamos así (r-1)(c-1) comparaciones posibles, que serán generalmente las que se incluyan en la matriz C.

En el mismo sentido que antes, dado un contraste de medias de la forma

Y(i,j,i’,j’) = µ(i,j),l - µ(ij’),l - µ(i’j),l + µ(i’j’),l 

para cualquiera de las variables l, en el espacio global, el contraste se estima como

 (i,j,i’,j’) = (pij - pij’ - pi’j + pi’j’)ql

es decir

proy [(pij - pij’ - pi’j + pi’j’), ql ] ||ql||

Es necesario recordar que la longitud de ql coincide con la variabilidad dentro de los grupos para la variable l.

El contraste es significativo si (i,j,i’,j’)³tj,aÖ(4/q)Sl cuando el diseño es balanceado, es decir, si proy[(pij - pij’ - pi’j + pi’j’), ql ] ³tj,aÖ(4/q). Luego, la cantidad ³tj,aÖ(4/q) puede ser utilizada como patrón de comparación del vector resultante en el punto anterior.

Si representamos directamente los contrastes sobre el gráfico, el contraste será significativo si el círculo de confianza no contiene al cero. De la misma forma que en los casos anteriores, el contraste es conservador en el sentido de que si la proyección no contiene al cero hay significación, mientras que si lo contiene, no estamos seguros, la significación puede estar en otro eje.

Otra forma de interpretar la interacción, pero ahora sobre el Biplot de medias, es que para cada una de las subtablas 2x2 representadas en el gráfico por cuatro puntos, se toman tres de ellos y se busca el punto sobre el que formarían un paralelogramo; sobre este punto se coloca un círculo de confianza con el mismo radio que el utilizado para las medias. Si el círculo se cruza con el del cuarto punto, el contraste no es significativo.

Calidad de Representación

La calidad de representación en este caso se define en forma análoga a como se define en el Biplot clásico, esto es, el coseno al cuadrado del ángulo que forma el vector que representa a una variable y uno de los ejes es la correlación al cuadrado entre la variable y el eje.

Este coseno al cuadrado es la calidad de representación (CLRjt) de la j-ésima variable sobre el eje t, siguiendo la terminología de la escuela Francesa. Esta cantidad puede ser calculada a partir del producto interno del vector que representa al i-ésimo grupo y cualquier vector en la dirección del eje. Sea p = (pi1, …, pir)’, y et = (0, …, dt, …, 0) un vector en la dirección del eje t, entonces

La calidad de representación así definida es una medida aditiva que puede ser calculada para cualquier subespacio factorial sumando las calidades de representación para los ejes que forman el subespacio. Además, es una medida relativa porque la suma para todos los ejes es 1. En una forma análoga pueden definirse calidades de representación para las variables.

Una interpretación adicional es: siguiendo a Lejeune y Calinski (2000) la distancia al cuadrado de un punto fila al origen, coincide con la distancia de Mahalanobis a la fila nula y, por tanto puede entenderse como la desviación de la hipótesis nula para esa fila (reacuérdese que la fila es un grupo o un contraste entre grupos). De esta forma lo que hemos llamado contribución relativa del factor al elemento (o la calidad de representación) puede interpretarse como la parte de la desviación de la hipótesis nula del grupo o el contraste recogida por el eje canónico.

Cuando se trata directamente de las medias centradas en la forma que se ha hecho en los puntos anteriores, la longitud al cuadrado es la distancia de Mahalanobis con respecto a la media global, es decir, mide el efecto (multivariante) del correspondiente tratamiento. La contribución es, entonces, la parte del efecto del tratamiento recogida por el eje.

Aplicación

El siguiente ejemplo ha sido tomado de Seber (1984; página 460). Se ha realizado un experimento de laboratorio para determinar el efecto de una infección de hongos sobre el crecimiento de un determinado tipo de césped. Para el análisis, el grupo infectado (GI) fue comparado con un grupo control (GC). El experimento se realizó a temperaturas de 14, 18, 22, y 26ºC (T1, T2, T3 y T4; factor columna). Para cada tratamiento (factor fila) se midieron 6 réplicas.

Las variables observadas fueron peso de las raíces frescas (g, X1), longitud máxima de la raíz (mm, X2), y peso fresco de la parte aérea (g, X3) Todos los análisis fueron realizados utilizando programas desarrollados por los autores bajo MATLABä versión 4.2.

Como paso previo al análisis, los datos fueron centrados por columnas para eliminar el efecto común a todas las observaciones representado por la media global. El centrado no modifica los resultados de los análisis de la varianza univariantes o multivariantes, y es importante para la obtención de las representaciones canónicas, ya que si los datos no se centran, el primer eje mostrará solamente el desplazamiento del centro de gravedad de las nubes de puntos de las medias.

En primer lugar se realizaron los análisis de la varianza para cada una de las variables por separado y el análisis de la varianza multivariante (MANOVA). Los resultados del MANOVA se muestran en la Tabla I. Para el contraste multivariante se ha utilizado la lambda de Wilks con la aproximación c2. Para todas las variables y para el caso multivariante se observa que no se detecta interacción significativa y se detectan efectos fila y columna significativos. En el contraste multivariante el efecto fila es significativo solamente al 5%.

Biplot de interacción. La interacción, a pesar de no resultar significativa, necesita tres dimensiones para ser representada, si bien las dos primeras recogen el 99,98% de la información (Tabla II). Junto con los contrastes de interacción, es posible la representación de la proyección de las medias de los tratamientos sobre el Biplot (Figura 2) lo que permite la interpretación del Biplot en términos más intuitivos, al basarse en las medias directamente en lugar de combinaciones lineales (contrastes) de las mismas. A la vista del gráfico observamos que la variable X1 está asociada fundamentalmente con el primer eje, es decir, está directamente relacionada con la dirección del espacio en la que la interacción es mayor. Para las otras dos la asociación no es tan clara.

Es posible también calcular las calidades de la representación de las medias sobre esta representación, haciendo notar que la aproximación de las mismas no es óptima sobre este Biplot, que fue calculado para representar los contrastes de interacción (Tabla III).

La interpretación de la interacción sobre el Biplot de medias necesita alguna aclaración ya que no es tan sencilla como la relativa a los contrastes. En la Figura 2 se muestra la interpretación de algunos de los posibles contrastes. Dada una subtabla 2x2 cualquiera, es decir, seleccionando dos niveles del factor fila y dos niveles del factor columna, y obteniendo la subtabla de medias correspondiente, la interpretación es que a cada una de las celdas de la tabla le corresponde un punto sobre el gráfico. Si no existe interacción, los 4 puntos asociados deberían estar sobre un paralelogramo. La determinación del efecto interacción se hace tomando tres puntos cualesquiera de la subtabla y calculando la posición que tendría el cuarto punto para que formaran un paralelogramo. La distancia entre el punto real y el punto teórico mide el efecto de la interacción para dicha subtabla.

En la Figura 3 se ha representado el efecto interacción para algunas de las subtablas 2x2, en concreto, como la interacción tiene 3 grados de libertad, en tres subtablas que descomponen el efecto en tres partes independientes, utilizando las últimas categorías de ambos factores de variación como base para las comparaciones, de la misma forma que se hace con los contrastes.

En un diseño balanceado como es el caso, el efecto resulta significativo si la longitud del vector, en alguna de las proyecciones sobre las variables o sobre los ejes, es aproximadamente el doble del radio del círculo de confianza alrededor de las medias. Por esta razón, se ha situado sobre el punto que cierra el paralelogramo, un círculo de confianza con el mismo radio. El efecto será significativo si este círculo y el del cuarto punto de la tabla no se cruzan. El contraste para una variable particular se hará proyectando los círculos sobre la dirección adecuada.

Sobre el gráfico se han sombreado los círculos correspondientes a los puntos que cierran los paralelogramos que, en todos los casos, se cruzan con los círculos que representan a la celda restante de la subtabla. Como los círculos se cruzan sobre el espacio global, también se cruzarán en las proyecciones sobre cualquiera de las direcciones del mismo.

Si, en lugar de interpretar las interacciones, queremos interpretar las medias de los grupos, el Biplot a utilizar es diferente, será el que en la parte teórica hemos denominado Biplot Total. El Biplot Total busca las direcciones que más separan a las medias del conjunto total de tratamientos y contiene los efectos combinados de los factores principales y las interacciones.

Biplot Total. Los valores propios, inercias e inercias acumuladas para el Biplot Total se muestran en la Tabla IV. Los dos primeros ejes absorben prácticamente el 100% de la variabilidad entre medias, por lo que las diferencias pueden interpretarse en el primer plano principal.

La representación total (Figura 4) será útil para la interpretación directa de las medias de los grupos, aunque como la calidad de la representación es buena servirá también para interpretar las interacciones y los efectos principales.

En la Tabla V se muestran las calidades de la representación para las medias y para las variables. Todas ellas, tanto para las medias como para las variables, son altas, por lo que pueden interpretarse sobre la Figura 4. De la representación se deduce que, para una misma temperatura, los puntos correspondientes al control y la infección están cercanos en el gráfico, por lo que parece que el efecto de la infección no es muy grande. Si aparecen diferencias claras entre las distintas temperaturas, especialmente entre la más baja y las demás. Las variables no se sitúan paralelas a ninguno de los ejes, y todas ellas tienen direcciones casi paralelas, por lo que el efecto de los tratamientos parece tener el mismo sentido en todas ellas. Cabe destacar que parecen más asociadas al segundo eje, aunque las calidades de representación son mayores para el primero. Esto es así porque las calidades de representación se han calculado sobre las coordenadas principales, mientras que en la representación se han tomado como coordenadas estándar para mantener la interpretación Biplot de las proyecciones.

Utilizando la interpretación habitual del Biplot mediante proyección de las medias sobre las variables, las temperaturas intermedias presentan valores más altos de las variables mientras que las extremas presentan valores más bajos. Esto sugiere una curva de respuesta cuadrática, de la misma forma que aparece en la explicación original de Seber (1984).

Sobre el Biplot Total pueden proyectarse las medias de las filas (Figura 5) realizando las correspondientes interpretaciones, aunque la calidad de las representaciones sea menor que en el Biplot específico, que no se realiza aquí porque la dimensión efectiva para filas es 1 y no tiene sentido una representación plana.

Puede comprobarse que las calidades de la representación son elevadas y que, sobre el gráfico, se observa la pequeña diferencia que existe entre el control y la infección por hongos, como cabría esperar del hecho de que el efecto fila es significativo solo al 5%.

También es posible la proyección de las medias de las columnas sobre el Biplot Total, pero la calidad de representación es menor que en el Biplot de Columnas que se muestra a continuación.

Biplot de columnas. La absorción de inercia para el Biplot de columnas se muestra en la Tabla VI. Aunque, en principio, la dimensión del problema es 3, los dos primeros ejes recogen prácticamente el 100% de la variabilidad de las medias de columnas, por lo que las diferencias entre las columnas pueden interpretarse sobre el primer plano, ya que las calidades de representación para todas ellas será prácticamente del 100%.

Las calidades de la representación de las variables en relación a las medias de columnas se muestran en la Tabla VII y son prácticamente del 100% para todas ellas. El gráfico correspondiente (Figura 6) muestra la significación del factor columna en la separación de los grupos: ninguno de los círculos se intercepta, por lo que el efecto temperatura es significativo. También se observa, de nuevo, la tendencia cuadrática.

Discusión

Se han mostrado distintas representaciones que pueden resultar útiles para la interpretación de los resultados de un MANOVA y permiten conocer las razones por las que se rechaza la hipótesis nula, de igualdad a cero, del conjunto de contrastes.

Teniendo en cuenta que el Análisis Multivariante de la Varianza de dos vías puede ser expresado como caso particular del Modelo Lineal General Multivariante, se ha generalizado el Manova-Biplot de una vía, propuesto por Gabriel (1972), al caso de dos vías, en el que es posible llevar a cabo cuatro formas de Manova-Biplot: Manova-Biplot Total, Manova-Biplot para filas, Manova-Biplot para columnas y Manova-Biplot de interacción.

El procedimiento habitual de análisis consistirá en estudiar la interacción, en caso de que sea significativa y los efectos principales en caso de que no lo sea. El Biplot de medias globales puede utilizarse como paso intermedio para cualquiera de las situaciones descritas, ya que permite interpretar el problema en términos de las medias de las celdas.

Hay que tener en cuenta que cualquiera de las matrices de medias puede ser proyectada sobre cualquiera de los Biplots propuestos pero que, en cada caso, la aproximación es óptima solamente para algunas de las representaciones.

Cuando el número de niveles de cada uno de los factores no es muy elevado, todas las representaciones producirán resultados similares y la más útil de ellas será probablemente el Biplot Total, ya que todas las proyecciones estarán bien representadas. Además, la interpretación del Biplot de las medias de las celdas estará dominada por los efectos más importantes.

Es posible representar sobre los gráficos Biplot círculos de confianza multivariantes que muestran, de forma aproximada, diferencias significativas entre los grupos, o contrastes, cuando su intersección es nula. En particular cuando la intersección en la proyección de una variable concreta es vacía, es posible afirmar que existen diferencias significativas para esa variable.

Todos los intervalos de confianza mostrados en los gráficos corresponden, en realidad, a situaciones univariantes para cada una de las variables; es decir, muestran intervalos de confianza para las proyecciones de los círculos sobre los vectores que representan a las variables. En ningún caso se ha realizado corrección alguna para las posibles comparaciones múltiples, ya que se trata de una aproximación general casi descriptiva. No habría ninguna dificultad para adaptar los círculos utilizando, por ejemplo la corrección de Bonferroni o cualquier otra de las utilizadas para comparaciones múltiples.

Aunque los intervalos de confianza hayan sido calculados para el supuesto univariante, serían válidos para las proyecciones en cualquiera de las direcciones del espacio de la representación por lo que, de alguna manera, pueden considerarse también como regiones de confianza multivariantes apelando al principio de unión-intersección.

Los conceptos clásicos de contribución relativa del factor al elemento y de calidad de representación han sido generalizados para los distintos Manova-Biplot y pueden ser interpretados sobre los gráficos en términos de desviación de las respectivas hipótesis nulas.

En la representación Manova-Biplot Total, la longitud del vector que representa a cada una de las medias se corresponde con la distancia de Mahalanobis entre la media del grupo que representa y la media global. Por tanto, la contribución del factor al elemento en esta representación es la parte de la desviación de la hipótesis nula, de que no existe ningún efecto, recogida por el factor.

REFERENCIAS

1. Gabriel KR (1971) The Biplot graphic display of matrices with applications to principal components analysis. Biometrika 58: 453-467.        [ Links ]

2. Gabriel KR (1972) Analysis of meteorological data by means of canonical decomposition and Biplots. J. Appl. Meteorol. 11: 1071-1077.        [ Links ]

3. Gabriel KR (1995) MANOVA Biplots for two-way contingency tables. En Krzanowski W (Ed.) Recent Advances in Descriptive Multivariate Analysis. Clarendon Press. Oxford, RU. pp. 227-268.        [ Links ]

4. Gower JC, Hand DJ (1996) Biplots. Chapman and Hall. Londres, RU. 277 pp.        [ Links ]

5. Lejeune M, Calinski T (2000) Canonical analysis applied to multivariate analysis of variance. J. Multivar. Anal. 72: 100-119.        [ Links ]

6. Mardia KV, Kent JT, Bibby JM (1979) Multivariate Analysis. Academic Press. Londres, RU. 521 pp.        [ Links ]

7. Morrison DF (1978) Multivariate Statistical Methods. McGraw-Hill. Londres, RU. 415 pp.        [ Links ]

8. Seber GA (1984) Multivariate Observations. Wiley. Nueva York, EEUU. 712 pp.        [ Links ]

9. Vicente-Villardón JL (1992) Una alternativa a las técnicas factoriales clásicas basada en una generalización de los métodos Biplot. Tesis. Universidad de Salamanca. España. 248 pp.        [ Links ]