Hidrología para ingenieros: Test de corrida para prueba de aleatoriedad-Freddy1

Todos los métodos de inferencia se basan en la suposición de que las muestras son aleatorias; no obstante, hay muchas aplicaciones en que es difícil decidir si la suposición es justificable. Esto es verdadero, particularmente, cuando tenemos poco control o ninguno sobre la selección de los datos, como es el caso, por ejemplo, cuando confiamos en cualquier registro disponible para hacer pronósticos de largo alcance sobre el clima, cuando usamos cualquier dato disponible para estimar la tasa de mortalidad como consecuencia de una enfermedad o cuando usamos los registros de ventas del mes pasado para pronosticar las ventas de una tienda de departamentos. Ninguna de estas informaciones constituye una muestra aleatoria en forma estricta.

Una condición básica en casi toda la estadística deductiva es que un sistema de datos constituye una muestra escogida aleatoria de una población homogénea dada. La condición de la aleatoriedad es esencial para cerciorarse de que la muestra es verdaderamente representativa de la población. La prueba más usada para la aleatoriedad es la Prueba de corridas (Wald-Wolfowitz).

Test de Corrida

Hay varios métodos para juzgar el azar de una muestra con base en el orden en que se obtienen las observaciones; nos permiten decidir, después de haber recopilado los datos, si se pueden atribuir a la probabilidad los patrones que aparentan ser no aleatorios.

La prueba de corrida es generalmente la prueba principal usada para verificar la dependencia. Esta prueba detecta si un patrón inaceptable estadísticamente que se incrementa o decrece existe entre números adyacentes en un flujo de números.

Un test de Corridas es un método que nos ayuda a evaluar el carácter de aleatoriedad de una secuencia de números estadísticamente independientes y números uniformemente distribuidos. Es decir dado una serie de números determinar si son o no aleatorios. Existen dos versiones de la prueba de corridas:

· Prueba de corridas arriba y abajo (ascendente y descendente).- Si tenemos una secuencia de números de tal manera que a cada uno de los números siga otro mayor la secuencia dada será ascendente (arriba).

Si cada número va seguido por otro menor, la secuencia será descendente (abajo).

· Prueba de corridas arriba y abajo de la media (promedio).- El carácter no aleatorio de las secuencia se sugiere por el hecho de que tenemos una corrida de números por encima de la media, seguida por una corrida por debajo de la media. Es por ello que necesitamos de otro método que nos lleva a la verdadera respuesta. Utilizando entonces el método llamado prueba de corridas por arriba y abajo de la media.

Este último es el que más se utiliza debido a que utiliza las medias de los datos observados. La Prueba de corridas arriba y abajo de la media utiliza las siguientes formulas:

Donde “n” son los datos por encima del promedio y “m” son los datos por debajo del promedio.

También se calcula un valor Z con la siguiente formula:

Donde R es el valor de las corridas contadas en el conjunto de datos.

Generalmente se trabaja a un nivel de confianza de 0.05% de confiabilidad y se maneja las siguiente hipotesis:

Ho Los datos son aleatorios

Ha Los datos no son aleatorios

El valor tabulado de “Z”para un nivel de confianza de 0.05%, según la distribucion normal es de 1.96; esto quiere decir que nuestro valor calculado de Z debe estar entre este intervalo:

-1.96< z < 1.96

De ser asi acepta la Ho, caso contrario se acepta la Ha

Para el entendimiento de este test de corridas seguiremos el siguiente ejemplo:

- Prueba de corridas en las corrientes fluviales anuales. Los flujos anuales de la Derwent en Yorkshire Bridge, Inglaterra, para el período de 1938-1967 se tabulan a continuación en milímetros de equivalente escurrimiento sobre la zona de captación por encima del lugar.

946	1058	1133	869	927	742	1113	665	955	1288
1074	838	815	910	1193	1386	955	1187	891	1302
867	837	1138	868	969	737	1143	947	763	1029

Ordenado los datos y realizando los cálculos, tenemos:

· Caso I

Valores de R (Corridas)

Annual flows (mm)

946

Promedio

985

1074

Valores por encima del promedio (Rojo)

867

1058

838

837

Valores por debajo del promedio (amarillo)

1133

815

1138

869

Valores de R (Corridas)

910

868

927

Los datos son aleatorios

1193

Los datos no son aleatorios

969

742

Valor µ_R

1386

µ_R

15.4

737

1113

955

Valor Var[R]

1143

Var[R]

6.653793103

665

1187

947

Valor Z

955

1.98

891

Valor Critico Z al 0.05%

±1.96

763

-1.96<1.98<1.96

1288

1302

1029

· Caso II

Para el mismo ejemplo pero con los datos distribuidos al azar tenemos lo siguiente:

Valores de R (Corridas)

Annual flows (mm)

946

Promedio

985

838

Valores por encima del promedio (Rojo)

1302

1058

837

1133

Valores por debajo del promedio (amarillo)

910

869

1138

1074

Valores de R (Corridas)

815

868

927

Los datos son aleatorios

1193

Los datos no son aleatorios

1386

742

737

1288

Valor µ_R

1113

µ_R

15.40

891

1143

Valor Var[R]

969

Var[R]

6.653793103

665

1029

1187

947

Valor Z

955

0.04

867

763

Valor Critico Z al 0.05%

±1.96

955

-1.96<0.04<1.96

Para este caso, aceptamos la Ho y rechazamos la Ha

Como se puede observar para ambos casos el número de corridas cambia de valor haciendo que, matemáticamente, nos diga si nuestros valores son aleatorios o no.

Conclusiones

Este tipo de test son importantes para poder saber si nuestros datos son independientes y totalmente aleatorios. Esto nos sirve para poder determinar la confiabilidad de los datos y saber que no han sido manipulados de alguna manera

Bibliografía

Kottegoda, N. T. 1997. Applied statistic for civil and environmental engineers. 2ª ed. Editorial McGraw Hill. New york. Pag. 267-267
Estadística elemental. John E. Freund, Gary A. Simon.

Hidrología para ingenieros

sábado, 1 de septiembre de 2012

Test de corrida para prueba de aleatoriedad-Freddy1

No hay comentarios:

Publicar un comentario