|
|
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés. El Anova requiere el cumplimiento los siguientes supuestos:
El ANOVA se basa en la descomposición de la variación total de los
datos con respecto a la media global (SCT), que bajo el supuesto de que H0 es cierta es una estimación de obtenida a partir de
toda la información muestral, en dos partes:
Las expresiones para el cálculo de los elementos que intervienen en el Anova son las siguientes: Media Global: Variación Intra-grupos: Variación Inter-grupos: Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media. Cuando la hipótesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la varianza poblacional y el cociente entre ambos se distribuye según una F de Snedecor con K-1 grados de libertad en el numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar que el cociente entre ambas estimaciones será aproximadamente igual a 1, de forma que se rechazará H0 si dicho cociente difiere significativamente de 1. La secuencia para realizar un ANOVA es:
Se abre el siguiente cuadro de diálogo:
Se selecciona la variable que se considera Dependiente y la variable Factor y con el botón Opciones se activan Estadísticos Descriptivos y Homogeneidad de varianzas.
Al aceptar en el visor de resultados aparecen los siguientes cuadros:
Como complemento gráfico de este análisis, para obtener una primera aproximación acerca de si es razonable o no la hipótesis nula, se selecciona Gráficos > Barras de error y se activa la opción Simple. Con el botón Definir se abre el siguiente cuadro de diálogo:
Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categorías la variable factor. El intervalo de confianza EJEMPLOS
Con la opción de menú Gráficos > Barras de error > Simple y con el botón Definir se selecciona como Variable Tiempo y en Eje de categorías la variable Trans; al aceptar se obtiene la siguiente representación gráfica: Como puede observarse, los puntos que representan a las medias de cada grupo aparecen dispersos a diferentes niveles; sobre todo la media del grupo definido por el factor Tren. El intervalo de confianza para la media correspondiente al grupo definido por el factor Metro está contenido dentro del intervalo correspondiente al grupo definido por el factor Bus, así como, el intervalo correspondiente al factor Coche está contenido dentro de los intervalos correspondientes definidos por los factores Metro y Otros. El gráfico, por tanto, parece sugerir no una única población sino tres poblaciones con distintas medias. Para realizar el análisis de la varianza propiamente dicho la secuencia es Analizar > Comparar medias > ANOVA de un factor. En el cuadro de diálogo se selecciona Tiempo como variable Dependiente y Trans como Factor. Para contrastar la hipótesis de igualdad de varianzas se abre con el botón correspondiente el cuadro de diálogo ANOVA de un factor: Opciones y se activa Homogeneidad de varianzas. Si se desea un análisis descriptivo del comportamiento de la variable dependiente dentro de cada grupo se activa también la opción Descriptivos. Al aceptar se obtienen los siguientes cuadros de resultados:
Este cuadro contiene un análisis descriptivo de la variable dependiente por grupos, así como, los límites superior e inferior para la media de cada grupo al 95% de confianza.
El estadístico de Levene toma un valor lo suficientemente pequeño para no rechazar la hipótesis de homocesdaticidad a los niveles de significación habituales.
En el cuadro de resultados del ANOVA, el valor del estadístico de prueba, F=6,450, es significativamente distinto de 1 para cualquier nivel de significación y, por lo tanto, se rechaza la hipótesis nula de igualdad de medias y queda confirmada la primera impresión proporcionada por el gráfico de barras de error. |
|
|