sábado, 1 de septiembre de 2012

Test de corrida para prueba de aleatoriedad-Freddy1

   Todos los métodos de inferencia se basan en la suposición de que las muestras son aleatorias; no obstante, hay muchas aplicaciones en que es difícil decidir si la suposición es justificable. Esto es verdadero, particularmente, cuando tenemos poco control o ninguno sobre la selección de los datos, como es el caso, por ejemplo, cuando confiamos en cualquier registro disponible para hacer pronósticos de largo alcance sobre el clima, cuando usamos cualquier dato disponible para estimar la tasa de mortalidad como consecuencia de una enfermedad o cuando usamos los registros de ventas del mes pasado para pronosticar las ventas de una tienda de departamentos. Ninguna de estas informaciones constituye una muestra aleatoria en forma estricta.
Una condición básica en casi toda la estadística deductiva es que un sistema de datos constituye una muestra escogida aleatoria de una población homogénea dada. La condición de la aleatoriedad es esencial para cerciorarse de que la muestra es verdaderamente representativa de la población. La prueba más usada para la aleatoriedad es la Prueba de corridas (Wald-Wolfowitz).

Test de Corrida

Hay varios métodos para juzgar el azar de una muestra con base en el orden en que se obtienen las observaciones; nos permiten decidir, después de haber recopilado los datos, si se pueden atribuir a la probabilidad los patrones que aparentan ser no aleatorios.
La prueba de corrida es generalmente la prueba principal usada para verificar la dependencia. Esta prueba detecta si un patrón inaceptable estadísticamente que se incrementa o decrece existe entre números adyacentes en un flujo de números.
Un test de Corridas es un método que nos ayuda a evaluar el carácter de aleatoriedad de una secuencia de números estadísticamente independientes y números uniformemente distribuidos. Es decir dado una serie de números determinar si son o no aleatorios. Existen dos versiones de la prueba de corridas:
·         Prueba de corridas arriba y abajo (ascendente y descendente).- Si tenemos una secuencia de números de tal manera que a cada uno de los números siga otro mayor la secuencia dada será ascendente (arriba).
Si cada número va seguido por otro menor, la secuencia será descendente (abajo).
·         Prueba de corridas arriba y abajo de la media (promedio).- El carácter no aleatorio de las secuencia se sugiere por el hecho de que tenemos una corrida de números por encima de la media, seguida por una corrida por debajo de la media. Es por ello que necesitamos de otro método que nos lleva a la verdadera respuesta. Utilizando entonces el método llamado prueba de corridas por arriba y abajo de la media.
Este último es el que más se utiliza debido a que utiliza las medias de los datos observados. La Prueba de corridas arriba y abajo de la media utiliza las siguientes formulas:

Donde “n” son los datos por encima del promedio y “m” son los datos por debajo del promedio.
También se calcula un valor Z con la siguiente formula:

Donde R es el valor de las corridas contadas en el conjunto de datos.
Generalmente se trabaja a un nivel de confianza de 0.05% de confiabilidad y se maneja las siguiente hipotesis:
Ho       Los datos son aleatorios
Ha       Los datos no son aleatorios
El valor tabulado de “Z”para un nivel de confianza de 0.05%, según la distribucion normal es de 1.96; esto quiere decir que nuestro valor calculado de Z debe estar entre este intervalo:
-1.96< z < 1.96
De ser asi acepta la Ho, caso contrario se acepta la Ha
Para el entendimiento de este test de corridas seguiremos el siguiente ejemplo:
-       Prueba de corridas en las corrientes fluviales anuales. Los flujos anuales de la Derwent en Yorkshire Bridge, Inglaterra, para el período de 1938-1967 se tabulan a continuación en milímetros de equivalente escurrimiento sobre la zona de captación por encima del lugar.
946
1058
1133
869
927
742
1113
665
955
1288
1074
838
815
910
1193
1386
955
1187
891
1302
867
837
1138
868
969
737
1143
947
763
1029
Ordenado los datos y realizando los cálculos, tenemos:
·         Caso I
Valores de R (Corridas)
Annual flows (mm)
1
946
Promedio
985
2
1074
Valores por encima del promedio (Rojo)
12
n
3
867
4
1058
5
838
837
Valores por debajo del promedio (amarillo)
18
m
6
1133
7
815
8
1138
9
869
Valores de R (Corridas)
20
R
910
868
927
Ho
Los datos son aleatorios
10
1193
Ha
Los datos no son aleatorios
11
969


742
 Valor µR

12
1386
µR
15.4
13
737


14
1113


15
955
 Valor Var[R]

16
1143
Var[R]
6.653793103
17
665

  



18
1187



19
947
Valor Z 

955
Z
1.98
891
Valor Critico Z al 0.05%
±1.96
763
-1.96<1.98<1.96
20
1288


1302



1029






·         Caso II
Para el mismo ejemplo pero con los datos distribuidos al azar tenemos lo siguiente:
Valores de R (Corridas)
Annual flows (mm)
1
946
Promedio
985
838
Valores por encima del promedio (Rojo)
12
n
2
1302
1058
3
837
4
1133
Valores por debajo del promedio (amarillo)
18
m
5
910
869
6
1138
1074
Valores de R (Corridas)
15
R
7
815
868
927
Ho
Los datos son aleatorios
8
1193
Ha
Los datos no son aleatorios
1386
9
742

737
10
1288
Valor µR
1113
µR
15.40
11
891

12
1143
Valor Var[R]


13
969
Var[R]
6.653793103

665
14
1029

1187
15
947
Valor Z 

955
Z
0.04
867


763
Valor Critico Z al 0.05%
±1.96
955
-1.96<0.04<1.96


Para este caso, aceptamos la Ho y rechazamos la Ha
Como se puede observar para ambos casos el número de corridas cambia de valor haciendo que, matemáticamente, nos diga si nuestros valores son aleatorios o no.
  Conclusiones
Este tipo de test son importantes para poder saber si nuestros datos son independientes y totalmente aleatorios. Esto nos sirve para poder determinar la confiabilidad de los datos y saber que no han sido manipulados de alguna manera
Bibliografía
  • Kottegoda, N. T.  1997.  Applied statistic for civil and environmental engineers.  2ª ed.  Editorial McGraw Hill.  New york.  Pag. 267-267
  • Estadística elemental. John E. Freund, Gary A. Simon.


No hay comentarios:

Publicar un comentario en la entrada

*Utiliza Chrome o Explorer para insertar comentarios. Por alguna razón, en Firefox hay un error. Gracias!

Related Posts Plugin for WordPress, Blogger...