martes, 28 de agosto de 2012

TEST “T” PARA LA ESTABILIDAD DE LA VARIANZA Y LA MEDIA


Ronald Fisher (1890-1962)

TALLER Y SEMINARIO 2
TEST “T” PARA LA ESTABILIDAD DE LA VARIANZA Y LA MEDIA

INTRODUCCIÓN

La prueba t-Student se utiliza para contrastar hipótesis sobre medias en poblaciones con distribución normal. También proporciona resultados aproximados para los contrastes de medias en muestras suficientemente grandes cuando estas poblaciones no se distribuyen normalmente (aunque en este último caso es preferible realizar una prueba no paramétrica). Para conocer si se puede suponer que los datos siguen una distribución normal, se pueden realizar diversos contrastes llamados de bondad de ajuste, de los cuales el más usado es la prueba de Kolmogorov, a menudo referida erróneamente como prueba de Kolmogorov-Smirnov, ya que en realidad esta última, sirve para contrastar si dos poblaciones tienen la misma distribución. Otros tests empleados para la prueba de normalidad son debidos a Saphiro y Wilks (Pinilla, y Rodriguez, 2010).
Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de comparación de dos varianzas.

En este trabajo proponemos la aplicación de un análisis de sensibilidad para los resultados de la prueba t para una muestra y su presentación como parte del informe respectivo para que el investigador tenga un mejor conocimiento de las condiciones en las que toma sus decisiones.

DESARROLLO

La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín. Debido a que en la destilería, su puesto de trabajo no era inicialmente de estadístico y su dedicación debía estar exclusivamente encaminada a mejorar los costes de producción, publicó sus hallazgos anónimamente firmando sus artículos con el nombre de "Student".

La estadística t de Student no es monótona en función de la diferencia entre x y µ0, pues esta se modifica mediante alteraciones en los datos que también afectan el valor de la varianza. En este trabajo se utiliza esta propiedad para analizar la estabilidad en las pruebas cuando se encuentran valores-p cercanos del nivel de significación dado por el investigador.
En la aplicación de la prueba t, la decisión de rechazo de la hipótesis nula se toma con base en el valor-p, calculado con los datos de la muestra observada, o a partir de la posición del valor de la estadística fuera del intervalo conocido como la región de aceptación. Por lo general, los estudios que abordan el tema de la calidad de las pruebas se centran en el comportamiento de la función de potencia. En algunos, sólo se trata el caso particular correspondiente a µX = µ0, considerando que la prueba se comporta bien si la proporción de rechazos de Ho: µX = µ0 coincide con el nivel de significación utilizado. Más detalles y referencias adicionales se encuentran en (Montilla 2010).

En ocasiones, el investigador desconoce en su aplicación especifica que su decisión puede verse afectada por un simple cambio en la cantidad de dígitos de sus datos o por un cambio muy pequeño en uno solo de ellos. Se encuentran casos más complejos cuando se rechaza la hipótesis nula con una muestra cuyo promedio se encuentra a una distancia d1 del valor de la media poblacional especifica en Ho y una alteración del valor más extremo de la muestra lleva a no rechazar Ho y el valor del promedio con los nuevos datos se encuentra a una mayor distancia d2 del mismo valor poblacional mencionado.

La distribución de t Student

De acuerdo al Teorema del Límite Central, la distribución muestral de una estadística (como la media de la muestra) seguirá una distribución normal, siempre y cuando el tamaño de la muestra sea suficientemente grande.

Entonces cuando conocemos la desviación  estándar  de  la  población podemos calcular un valor o calificación z y emplear la distribución normal para evaluar probabilidades sobre la media de la muestra.

Sin embargo, muchas veces los tamaños de las muestras son muy pequeños, y frecuentemente no conocemos la desviación estándar de la población. Cuando estos problemas ocurren, en estadística se recurre a una distribución  conocida como la “t de  Student” cuyos valores están dados por:
 

 Podemos ver que la ecuación es prácticamente igual a la utilizada para la distribución muestral de medias,  pero reemplazando la desviación estándar de la población por la desviación estándar de la muestra.

De manera similar al caso de la distribución muestral de medias para el caso de que n > 30, en donde usamos la distribución normal, podemos encontrar la distribución de los valores t de  student para aquellos casos  cuando n  < 30.

Sin  embargo, otra diferencia en su uso es el empleo de tablas de distribución para valores t en lugar de las tablas para valor Z.

Las curvas muestran la forma que puede  tomar  la distribución  t de student la cual  depende del  n depende del número de grados de libertad. Como se puede apreciar se parece mucho a la distribución normal. Incluso, para un n para un número grande de grados de libertad (es decir de  n grados de libertad las dos  numero de datos en la muestra) las dos distribuciones son iguales (Sánchez, 1999).


Fig. 1. Distribución de t en función de de los grados de libertad

Aunque parece una distribución normal, la distribución t tiene un poco más de área en los extremos y menos en el centro.

Otro punto a notar es que la  distribución t es más bien una colección de n de distribuciones, una para cada n distribuciones, una para cada número de grados de libertad.

El concepto de grados de libertad  se puede visualizar haciendo referencia a la varianza muestral que es igual a:



Esta fórmula puede verse como un promedio sobre n-1 datos. La terminología de grados de libertad resulta del hecho de que si bien s2 considera n cantidades, sólo n – 1 de ellas pueden determinarse libremente.

Propiedades de la distribución de t:

-          Cada curva t tiene forma de campana con centro en 0.
-          Cada curva t, está más dispersa que la curva normal estándar.
-          A medida que k aumenta, la dispersión de la curva t correspondiente disminuye.
-          A medida que k ®¥, la secuencia de curvas t aproxima a la curva normal estándar.

La distribución  t de student se puede usar cuando  cualquiera de las siguientes condiciones se cumple:

-          La distribución de la población es normal. 
-          La distribución de la muestra es simétrica, unimodal, sin puntos  dispersos  y alejados (outliers)  el tamaño de la muestra es de 15 o menos.
-          La distribución de la muestra es  moderadamente   asimétrica, unimodal, sin puntos dispersos (outliers) el tamaño de la muestra está á entre 16 y 30.
-          El tamaño de la muestra es mayor de 30, sin puntos dispersos (aunque en este  caso también se puede usar la distribución normal).
 

Fig. 2. Distribución de t Student con 10 grados de libertad

Cuando se extrae una muestra de una población con distribución normal (o casi normal), la media de la muestra puede compararse con la media de la población usando un valor t calculado por medio de la ecuación anterior. El valor t puede entonces asociarse con una probabilidad acumulada única que representa la posibilidad de que, dada una muestra aleatoriamente extraída de la población de tamaño n, la media de la muestra sea IGUAL, MENOR o MAYOR IGUAL, MENOR o MAYOR a  la media de la población.


 
                                        

 

Fig. 3. Distribución de t Student, función de distribución y función de distribución de probabilidad

Distribución acerca de la diferencia entre medias:

Esta prueba asume que las observaciones se distribuyen normalmente y que las varianzas de las dos poblaciones estudiadas son similares, lo que puede determinar con la prueba de F. En caso de no existir homogeneidad de la varianzas, existen alternativas de esta prueba para tales casos.

Cálculo de la prueba t-Student para la diferencia de medias suponiendo no igualdad de varianzas

Para llevar a cabo el contraste:
Ho: m1 - m2 = 0
H1: m1 - m2 ¹ 0


Varianza ponderada o agrupada:


Estadístico de prueba:



Cálculo de la prueba t-Student para la diferencia de medias suponiendo igualdad de varianzas
Para llevar a cabo el contraste:
Ho: m1 - m2 = 0
H1: m1 - m2 ¹ 0

Suponiendo igualdad de varianzas poblacionales, se construye el estadístico de contraste experimental t dado por:
Que bajo la hipótesis nula sigue una distribución t-Student con grados de libertad gl = (n1 - 1) + (n2 – 1) = n1 + n2 – 2.


Análisis de tendencias y homogeneidad

En los gráficos que se muestran a continuación, la primera serie es estable en la media pero no en la varianza. La segunda, aún cuando no es estable en la media, si parece serlo en la varianza.


Fig. 4. Variación de la media y la varianza
Estabilidad en la varianza

Detectar cambios en la varianza y en la media son pasos fundamentales para determinar si la serie presenta homogeneidad o no; el hecho de que no lo sea significa que los parámetros estadísticos varían, ya sea debido a causas naturales o antropogénicas. Se recomienda hacer en primer lugar el test para la estabilidad de la varianza, debido básicamentea dos razones: la inestabilidad de la varianza implica que la serie cronológica no es estacionaria, así que no se puede usar para análisis posteriores; y algunos tests de estabilidad en la media requieren que haya estabilidad en la varianza (Dahmen y Hall, 1990). A continuación se describe el Test F y el Test Siegel Turkey, pruebas estadísticas usadas en el desarrollo del documento para establecer la estabilidad de la varianza, pero existen otras que pueden ser consultadas en Maidment (1993), Kottegoda y Rosso (1997); Sheskin (1997), y entre otros.

Test F: es una prueba parámetrica que relaciona las varianzas de dos conjuntos de información que resultan de dividir la serie hidroclimatológica en dos partes iguales. Se conoce como distribución F o Fisher a la distribución de la relación entre varianzas de muestras que vienen de una distribución normal; sin embargo, Dahmen y Hall (1990) afirman que si las muestras no vienen de una distribución normal, el Test F dará una buena estimación de la estabilidad de la varianza. El test estadístico se denota como (Snedecor y Cochran, 1983)


Donde s2 representa la varianza de cada subconjunto y se calcula a partir de la siguiente expresión


Donde xi denota la observación y n el número total de datos en la muestra (subconjunto).

La hipótesis nula para el test es, Ho: s12 = s22 (igualdad de varianzas), y la hipótesis alterna, Ha: s12 < > s22. La prueba se rechaza si el estadístico estimado se encuentra en la siguiente zona de rechazo, para un nivel de significancia:

Donde n1 y n2 son la cantidad de datos para cada uno de los subconjuntos, y (n1-1), (n2-1) son los grados de libertad de la distribución. 


Test Siegel – Tukey: es una prueba no parámetrica utilizada para determinar si uno de los dos grupos (subconjunto de la serie original) tiende a tener más valores extremos que el otro grupo, o dicho de otra manera determina si uno de los dos grupos presenta mayor dispersión que el otro con respecto a la medida de tendencia central (Sheskin, 1997).

Estabilidad de la media

Se puede determinar si la serie hidroclimatológica es estable en la media a partir de la comparación de subconjuntos de la información. En la mayoría de las ocasiones se recomienda dividir la serie original en dos partes, de tal forma que se puedan aplicar tests estadísticos de comparación de medias para determinar si vienen de la misma población (Maidment, 1993). Para establecer la estabilidad en la varianza existen variadas pruebas paramétricas y no paramétricas, tales como: test Test – t, U testMann-Whitney, test Signed Rank test , test Kruskal-Wallis, test Mann-Whitney-Wilcoxon , entre otros, que pueden ser consultados en Sheskin (1997); Kottegoda y Rosso (1997). A continuación se describen dos de los test usados en el desarrollo del documento.
Test t: Es una prueba parámetrica que involucra el cálculo y la comparación de las medias de dos subconjuntos de la serie cronológica (los mismos subconjuntos que se usaron para determinar la estabilidad de la varianza con el Test - F). La hipótesis nula se calcula con la siguiente expresión: 



Donde n1 y n2 son los números de datos en los dos arreglos subconjuntos, representa la media de cada subconjunto
y s2 su varianza. La prueba exige que las varianzas no sean significativamente diferentes. La prueba se rechaza si tt cae dentro de la siguiente región de rechazo para un nivel de significancia: 

 
  
Donde (n1-1) + (n2-1) son los grados de libertad de la distribución.

En las Figuras 5 a 6 se muestra la aplicación de las gráficas de series de tiempo, diagramas de cajas, gráfica de doble masa y la gráfica de probabilidad. Las gráficas de series de tiempo no muestran ninguna tendencia definida, pero La Balsa, Loboguerrero y Los Bancos muestran una alta dispersión en los datos en algunas partes de las series. Se observa en la estación La Balsa un salto en el año 1968, que puede producir un cambio en la medida de tendencia central y también en la varianza (suposición que será posteriormente comprobada con el análisis confirmatorio). El diagrama de cajas, por su parte, muestra que en algunas de las series existe una diferencia en la dispersión de los datos; es así como las estaciones La Balsa, Loboguerrero y Los Bancos muestran rangos intercuartilicos en cada

Fig. 5. Precipitación anual en las estaciones La Balsa, Loboguerrero, J. Fernandez y los Bancos


Fig. 6. Diagramas de cajas de la precipitación anual en las estaciones, La Bolsa, Loboguerrero,
Julio Fernández , Los Bancos


Fig. 7. Curvas de probabilidad acumulada
 

Tabla 1. Pruebas estadisticas de carácter confirmatorio



CONCLUSIONES

Las pruebas gráficas son herramientas imprescindibles en el análisis exploratorio de datos y permiten identificar, de forma simple, si la serie se distribuye normalmente o no, si presenta tendencias y cambios, y el periodo donde éstos se producen.

El análisis cuantitativo como herramienta en el EDA (análisis exploratorio de los datos) es valioso debido a que confirma estadísticamente la homogeneidad de la varianza y de la media, además de la estacionariedad, condiciones básicas en cualquier simulación o modelación que haga uso de series hidroclimatológicas.

Las herramientas presentadas en este documento muestran la variedad de alternativas que el analista tiene para tomar decisiones respecto a las series que está usando, pero es importante conocer claramente con qué clase de datos se está trabajando y cuáles pueden ser las causas de error en las mismas.

Cuando el análisis exploratorio de datos muestre que las series son inconsistentes, con tendencias, cambios, etc, se hará necesario la remoción de esa parte de la serie, lo que implica una disminución en la cantidad de información disponible para realizar cualquier tipo de análisis, además que la serie se convierte en una serie artificial, manipulada por el analista.



BIBLIOGRAFÍA

Castro, L. y Carbajal, Y., 2010. Análisis de tendencia y homogeneidad de series climatológicas
Escuela de Ingeniería de Recursos Naturales y del Ambiente. Universidad del Valle, Cali, Colombia.
Dahmen, E. y Hall, M., 1990. Screening of Hydrological Data: Tests for Stationary and Relative Consistency. International Institute for Land Reclamation and Improvement – ILRI. Wageningeq. The Netherlands.
Kottegoda, N. y Rosso, R., 1997. Statistics, Probability and Reliability for Civil and Environmental Engineers. The McGraw – Hill Companies, Inc. United States of America.
Montilla, 2010. La distribución  t de Student.

Maidment, D., 1993. Handbook of Hydrology. McGRAW – HILL, INC. United States of America.

Sánchez, J., 1999. Manual de análisis estadístico de los datos. Segunda edición. Alianza Editorial S.A. Madrid.

Sheskin, D., 1997. Handbook of Parametric and Nonparametric Statistical Procedures. Western Connecticut State University. CRC Press.

Pinilla, j. y Rodriguez, H., 2010. Sensitivity Analysis for Student-Test in one sample. Universidad de Santo Tomas, Colombia.

Snedecor, G.W. y Cochran, W. G., 1989. Statistical Methods. Eighth Edition, Iowa State University Press.

2 comentarios:

  1. buen tutorial, yo estoy buscando información de todas las pruebas para determinar homogeneidad para aplicarlos en hidrologia
    saludos

    ResponderEliminar
  2. Gracias por el comentario! Nosotros sugerimos consultar el Dahmen y Hall *ver arriba

    ResponderEliminar

*Utiliza Chrome o Explorer para insertar comentarios. Por alguna razón, en Firefox hay un error. Gracias!

Related Posts Plugin for WordPress, Blogger...