Ronald Fisher (1890-1962)
TALLER
Y SEMINARIO 2
TEST
“T” PARA LA ESTABILIDAD DE LA VARIANZA Y LA MEDIA
INTRODUCCIÓN
La prueba t-Student se utiliza para
contrastar hipótesis sobre medias en poblaciones con distribución normal.
También proporciona resultados aproximados para los contrastes de medias en
muestras suficientemente grandes cuando estas poblaciones no se distribuyen
normalmente (aunque en este último caso es preferible realizar una prueba no
paramétrica). Para conocer si se puede suponer que los datos siguen una distribución
normal, se pueden realizar diversos contrastes llamados de bondad de ajuste, de
los cuales el más usado es la prueba de Kolmogorov, a menudo referida
erróneamente como prueba de Kolmogorov-Smirnov, ya que en realidad esta última,
sirve para contrastar si dos poblaciones tienen la misma distribución. Otros
tests empleados para la prueba de normalidad son debidos a Saphiro y Wilks (Pinilla, y
Rodriguez, 2010).
Existen dos versiones de la prueba
t-Student: una que supone que las varianzas poblacionales son iguales y otra
versión que no asume esto último. Para decidir si se puede suponer o no la
igualdad de varianza en las dos poblaciones, se debe realizar previamente la
prueba F-Snedecor de comparación de dos varianzas.
En este trabajo proponemos la aplicación
de un análisis de sensibilidad para los resultados de la prueba t para una
muestra y su presentación como parte del informe respectivo para que el
investigador tenga un mejor conocimiento de las condiciones en las que toma sus
decisiones.
DESARROLLO
La prueba t-Student fue desarrollada en
1899 por el químico inglés William Sealey Gosset (1876-1937), mientras
trabajaba en técnicas de control de calidad para las destilerías Guiness en
Dublín. Debido a que en la destilería, su puesto de trabajo no era inicialmente
de estadístico y su dedicación debía estar exclusivamente encaminada a mejorar
los costes de producción, publicó sus hallazgos anónimamente firmando sus
artículos con el nombre de "Student".
La estadística t de Student no es monótona
en función de la diferencia entre x y µ0, pues esta se modifica mediante alteraciones
en los datos que también afectan el valor de la varianza. En este trabajo se
utiliza esta propiedad para analizar la estabilidad en las pruebas cuando se
encuentran valores-p cercanos del nivel de significación dado por el
investigador.
En la aplicación de la prueba t, la
decisión de rechazo de la hipótesis nula se toma con base en el valor-p,
calculado con los datos de la muestra observada, o a partir de la posición del
valor de la estadística fuera del intervalo conocido como la región de
aceptación. Por lo general, los estudios que abordan el tema de la calidad de
las pruebas se centran en el comportamiento de la función de potencia. En
algunos, sólo se trata el caso particular correspondiente a µX = µ0,
considerando que la prueba se comporta bien si la proporción de rechazos de Ho:
µX = µ0 coincide con el nivel de significación utilizado. Más detalles y
referencias adicionales se encuentran en (Montilla 2010).
En ocasiones, el investigador desconoce
en su aplicación especifica que su decisión puede verse afectada por un simple
cambio en la cantidad de dígitos de sus datos o por un cambio muy pequeño en
uno solo de ellos. Se encuentran casos más complejos cuando se rechaza la
hipótesis nula con una muestra cuyo promedio se encuentra a una distancia d1
del valor de la media poblacional especifica en Ho y una alteración del valor
más extremo de la muestra lleva a no rechazar Ho y el valor del promedio con
los nuevos datos se encuentra a una mayor distancia d2 del mismo valor
poblacional mencionado.
La
distribución de t Student
De acuerdo al Teorema del Límite
Central, la distribución muestral de una estadística (como la media de la
muestra) seguirá una distribución normal, siempre y cuando el tamaño de la
muestra sea suficientemente grande.
Entonces cuando conocemos la
desviación estándar de
la población podemos calcular un
valor o calificación z y emplear la distribución normal para evaluar
probabilidades sobre la media de la muestra.
Sin embargo, muchas veces los tamaños de
las muestras son muy pequeños, y frecuentemente no conocemos la desviación
estándar de la población. Cuando estos problemas ocurren, en estadística se
recurre a una distribución conocida como
la “t de Student” cuyos valores están
dados por:
Podemos ver que la ecuación es
prácticamente igual a la utilizada para la distribución muestral de
medias, pero reemplazando la desviación
estándar de la población por la desviación estándar de la muestra.
De manera similar al caso de la
distribución muestral de medias para el caso de que n > 30, en donde usamos
la distribución normal, podemos encontrar la distribución de los valores t
de student para aquellos casos cuando n
< 30.
Sin
embargo, otra diferencia en su uso es el empleo de tablas de distribución
para valores t en lugar de las tablas para valor Z.
Las curvas muestran la forma que
puede tomar la distribución t de student la cual depende del
n depende del número de grados de libertad. Como se puede apreciar se
parece mucho a la distribución normal. Incluso, para un n para un número grande
de grados de libertad (es decir de n
grados de libertad las dos numero de
datos en la muestra) las dos distribuciones son iguales (Sánchez, 1999).
Fig. 1. Distribución de t en función de
de los grados de libertad
Aunque parece una distribución normal, la
distribución t tiene un poco más de área en los extremos y menos en el centro.
Otro punto a notar es que la distribución t es más bien una colección de n
de distribuciones, una para cada n distribuciones, una para cada número de
grados de libertad.
El concepto de grados de libertad se puede visualizar haciendo referencia a la
varianza muestral que es igual a:
Esta fórmula puede verse como un
promedio sobre n-1 datos. La terminología de grados de libertad resulta del
hecho de que si bien s2 considera n cantidades, sólo n – 1 de ellas pueden
determinarse libremente.
Propiedades de la distribución de t:
-
Cada curva t tiene
forma de campana con centro en 0.
-
Cada curva t, está más
dispersa que la curva normal estándar.
-
A medida que k aumenta,
la dispersión de la curva t correspondiente disminuye.
-
A medida que k ®¥,
la secuencia de curvas t aproxima a la curva normal estándar.
La distribución t de student se puede usar cuando cualquiera de las siguientes condiciones se cumple:
-
La distribución de la población
es normal.
-
La distribución de la
muestra es simétrica, unimodal, sin puntos
dispersos y alejados (outliers) el tamaño de la muestra es de 15 o menos.
-
La distribución de la
muestra es moderadamente asimétrica, unimodal, sin puntos dispersos (outliers)
el tamaño de la muestra está á entre 16 y 30.
-
El tamaño de la muestra
es mayor de 30, sin puntos dispersos (aunque en este caso también se puede usar la distribución
normal).
Fig. 2. Distribución de t Student con 10
grados de libertad
Cuando se extrae una muestra de una
población con distribución normal (o casi normal), la media de la muestra puede
compararse con la media de la población usando un valor t calculado por medio
de la ecuación anterior. El valor t puede entonces asociarse con una
probabilidad acumulada única que representa la posibilidad de que, dada una
muestra aleatoriamente extraída de la población de tamaño n, la media de la
muestra sea IGUAL, MENOR o MAYOR IGUAL, MENOR o MAYOR a la media de la población.
Fig. 3. Distribución de t Student,
función de distribución y función de distribución de probabilidad
Distribución
acerca de la diferencia entre medias:
Esta prueba asume que las observaciones
se distribuyen normalmente y que las varianzas de las dos poblaciones
estudiadas son similares, lo que puede determinar con la prueba de F. En caso
de no existir homogeneidad de la varianzas, existen alternativas de esta prueba
para tales casos.
Cálculo
de la prueba t-Student para la diferencia de medias suponiendo no igualdad de
varianzas
Para llevar a cabo el contraste:
Ho:
m1 - m2 = 0
H1:
m1 - m2 ¹ 0
Varianza ponderada o
agrupada:
Estadístico de prueba:
Cálculo
de la prueba t-Student para la diferencia de medias suponiendo igualdad de
varianzas
Para llevar a cabo el contraste:
Ho: m1 - m2 = 0
H1: m1 - m2 ¹
0
Suponiendo igualdad de varianzas
poblacionales, se construye el estadístico de contraste experimental t dado
por:
Que bajo la hipótesis nula sigue una
distribución t-Student con grados de libertad gl = (n1 - 1) + (n2 – 1) = n1 +
n2 – 2.
Análisis
de tendencias y homogeneidad
En los gráficos que se muestran a
continuación, la primera serie es estable en la media pero no en la varianza.
La segunda, aún cuando no es estable en la media, si parece serlo en la
varianza.
Fig. 4. Variación de la media y la
varianza
Estabilidad en la
varianza
Detectar cambios en la
varianza y en la media son pasos fundamentales para determinar si la serie
presenta homogeneidad o no; el hecho de que no lo sea significa que los
parámetros estadísticos varían, ya sea debido a causas naturales o
antropogénicas. Se recomienda hacer en primer lugar el test para la estabilidad
de la varianza, debido básicamentea dos razones: la inestabilidad de la
varianza implica que la serie cronológica no es estacionaria, así que no se
puede usar para análisis posteriores; y algunos tests de estabilidad en la
media requieren que haya estabilidad en la varianza (Dahmen y Hall, 1990). A
continuación se describe el Test F y el Test Siegel Turkey, pruebas
estadísticas usadas en el desarrollo del documento para establecer la
estabilidad de la varianza, pero existen otras que pueden ser consultadas en
Maidment (1993), Kottegoda y Rosso (1997); Sheskin (1997), y entre otros.
Test F: es una prueba
parámetrica que relaciona las varianzas de dos conjuntos de información que
resultan de dividir la serie hidroclimatológica en dos partes iguales. Se
conoce como distribución F o Fisher a la distribución de la relación entre
varianzas de muestras que vienen de una distribución normal; sin embargo,
Dahmen y Hall (1990) afirman que si las muestras no vienen de una distribución
normal, el Test F dará una buena estimación de la estabilidad de la varianza.
El test estadístico se denota como (Snedecor y Cochran, 1983)
Donde s2 representa la varianza de cada subconjunto y se calcula a partir de la siguiente expresión
Donde xi denota la observación y n el número total de datos en la muestra (subconjunto).
La hipótesis nula para
el test es, Ho: s12 = s22 (igualdad de varianzas), y la hipótesis alterna, Ha:
s12 < > s22. La prueba se rechaza si el estadístico estimado se encuentra
en la siguiente zona de rechazo, para un nivel de significancia:
Donde n1 y n2 son la
cantidad de datos para cada uno de los subconjuntos, y (n1-1), (n2-1) son los
grados de libertad de la distribución.
Test Siegel – Tukey: es
una prueba no parámetrica utilizada para determinar si uno de los dos grupos (subconjunto
de la serie original) tiende a tener más valores extremos que el otro grupo, o
dicho de otra manera determina si uno de los dos grupos presenta mayor
dispersión que el otro con respecto a la medida de tendencia central (Sheskin,
1997).
Estabilidad de la media
Se puede determinar si
la serie hidroclimatológica es estable en la media a partir de la comparación
de subconjuntos de la información. En la mayoría de las ocasiones se recomienda
dividir la serie original en dos partes, de tal forma que se puedan aplicar
tests estadísticos de comparación de medias para determinar si vienen de la
misma población (Maidment, 1993). Para establecer la estabilidad en la varianza
existen variadas pruebas paramétricas y no paramétricas, tales como: test Test
– t, U testMann-Whitney, test Signed Rank test , test Kruskal-Wallis, test
Mann-Whitney-Wilcoxon , entre otros, que pueden ser consultados en Sheskin
(1997); Kottegoda y Rosso (1997). A continuación se describen dos de los test
usados en el desarrollo del documento.
Test t: Es una prueba
parámetrica que involucra el cálculo y la comparación de las medias de dos
subconjuntos de la serie cronológica (los mismos subconjuntos que se usaron
para determinar la estabilidad de la varianza con el Test - F). La hipótesis
nula se
calcula con la siguiente expresión:
Donde n1 y n2 son los números de datos en los dos arreglos subconjuntos, representa la media de cada subconjunto y s2 su varianza. La prueba exige que las varianzas no sean significativamente diferentes. La prueba se rechaza si tt cae dentro de la siguiente región de rechazo para un nivel de significancia:
Donde (n1-1) + (n2-1)
son los grados de libertad de la distribución.
En las Figuras 5 a 6 se muestra la
aplicación de las gráficas de series de tiempo, diagramas de cajas, gráfica de
doble masa y la gráfica de probabilidad. Las gráficas de series de tiempo no
muestran ninguna tendencia definida, pero La Balsa, Loboguerrero y Los Bancos
muestran una alta dispersión en los datos en algunas partes de las series. Se
observa en la estación La Balsa un salto en el año 1968, que puede producir un
cambio en la medida de tendencia central y también en la varianza (suposición
que será posteriormente comprobada con el análisis confirmatorio). El diagrama
de cajas, por su parte, muestra que en algunas de las series existe una
diferencia en la dispersión de los datos; es así como las estaciones La Balsa,
Loboguerrero y Los Bancos muestran rangos intercuartilicos en cada
Fig. 5. Precipitación anual en las
estaciones La Balsa, Loboguerrero, J. Fernandez y los Bancos
Fig. 6. Diagramas
de cajas de la precipitación anual en las estaciones, La Bolsa, Loboguerrero,
Julio Fernández ,
Los Bancos
Fig. 7. Curvas de
probabilidad acumulada
Tabla 1. Pruebas estadisticas de carácter confirmatorio
CONCLUSIONES
Las pruebas gráficas son herramientas
imprescindibles en el análisis exploratorio de datos y permiten identificar, de
forma simple, si la serie se distribuye normalmente o no, si presenta
tendencias y cambios, y el periodo donde éstos se producen.
El análisis cuantitativo como herramienta en el EDA (análisis exploratorio de los datos) es valioso debido a que confirma estadísticamente la homogeneidad de la varianza y de la media, además de la estacionariedad, condiciones básicas en cualquier simulación o modelación que haga uso de series hidroclimatológicas.
Las herramientas presentadas en este documento muestran la variedad de alternativas que el analista tiene para tomar decisiones respecto a las series que está usando, pero es importante conocer claramente con qué clase de datos se está trabajando y cuáles pueden ser las causas de error en las mismas.
Cuando el análisis exploratorio de datos muestre que las series son inconsistentes, con tendencias, cambios, etc, se hará necesario la remoción de esa parte de la serie, lo que implica una disminución en la cantidad de información disponible para realizar cualquier tipo de análisis, además que la serie se convierte en una serie artificial, manipulada por el analista.
BIBLIOGRAFÍA
Castro,
L. y Carbajal, Y., 2010. Análisis de tendencia y homogeneidad de series
climatológicas
Escuela
de Ingeniería de Recursos Naturales y del Ambiente. Universidad del Valle,
Cali, Colombia.
Dahmen, E.
y Hall, M., 1990. Screening of Hydrological Data: Tests for Stationary and
Relative Consistency. International Institute for Land Reclamation and
Improvement – ILRI. Wageningeq. The Netherlands.Kottegoda, N. y Rosso, R., 1997. Statistics, Probability and Reliability for Civil and Environmental Engineers. The McGraw – Hill Companies, Inc. United States of America.
Montilla, 2010. La distribución t de Student.
Maidment, D., 1993. Handbook of Hydrology.
McGRAW – HILL, INC. United States of America.
Sánchez, J., 1999. Manual de análisis estadístico de los datos. Segunda edición. Alianza Editorial S.A. Madrid.
Sánchez, J., 1999. Manual de análisis estadístico de los datos. Segunda edición. Alianza Editorial S.A. Madrid.
Sheskin, D., 1997. Handbook of Parametric and
Nonparametric Statistical Procedures. Western Connecticut State University. CRC
Press.
Pinilla, j. y Rodriguez, H., 2010. Sensitivity Analysis for Student-Test
in one sample. Universidad
de Santo Tomas, Colombia.
Snedecor,
G.W. y Cochran, W. G., 1989. Statistical Methods. Eighth Edition, Iowa State
University Press.
buen tutorial, yo estoy buscando información de todas las pruebas para determinar homogeneidad para aplicarlos en hidrologia
ResponderEliminarsaludos
Gracias por el comentario! Nosotros sugerimos consultar el Dahmen y Hall *ver arriba
ResponderEliminar