Todos los métodos de inferencia se basan en la suposición de que las muestras son aleatorias; no obstante, hay muchas aplicaciones en que es difícil decidir si la suposición es justificable. Esto es verdadero, particularmente, cuando tenemos poco control o ninguno sobre la selección de los datos, como es el caso, por ejemplo, cuando confiamos en cualquier registro disponible para hacer pronósticos de largo alcance sobre el clima, cuando usamos cualquier dato disponible para estimar la tasa de mortalidad como consecuencia de una enfermedad o cuando usamos los registros de ventas del mes pasado para pronosticar las ventas de una tienda de departamentos. Ninguna de estas informaciones constituye una muestra aleatoria en forma estricta.
Una condición básica en casi toda la estadística deductiva es que un sistema de datos constituye una muestra escogida aleatoria de una población homogénea dada. La condición de la aleatoriedad es esencial para cerciorarse de que la muestra es verdaderamente representativa de la población. La prueba más usada para la aleatoriedad es la Prueba de corridas (Wald-Wolfowitz).
Test de Corrida
Test de Corrida
Hay varios métodos para juzgar el azar de una muestra
con base en el orden en que se obtienen las observaciones; nos permiten
decidir, después de haber recopilado los datos, si se pueden atribuir a la
probabilidad los patrones que aparentan ser no aleatorios.
La prueba de corrida es generalmente la prueba principal
usada para verificar la dependencia. Esta prueba detecta si un patrón
inaceptable estadísticamente que se incrementa o decrece existe entre números
adyacentes en un flujo de números.
Un test de Corridas es un método que nos ayuda a evaluar el carácter de
aleatoriedad de una secuencia de números estadísticamente independientes y
números uniformemente distribuidos. Es decir dado una serie de números
determinar si son o no aleatorios. Existen dos versiones de la prueba de
corridas:
·
Prueba de corridas arriba y abajo (ascendente y
descendente).- Si tenemos una secuencia de números de tal manera que a cada uno de los
números siga otro mayor la secuencia dada será ascendente (arriba).
Si cada número va seguido por otro
menor, la secuencia será descendente (abajo).
·
Prueba de corridas arriba y abajo de la media (promedio).- El carácter no aleatorio de las secuencia se sugiere por el hecho de que
tenemos una corrida de números por encima de la media, seguida por una corrida
por debajo de la media. Es por ello que necesitamos de otro método que nos
lleva a la verdadera respuesta. Utilizando entonces el método llamado prueba de corridas
por arriba y abajo de la media.
Este último es el que más se utiliza debido a que utiliza las medias de los
datos observados. La Prueba de corridas
arriba y abajo de la media utiliza las siguientes formulas:
Donde “n” son los datos por encima
del promedio y “m” son los datos por debajo del promedio.
También se calcula un valor Z con la
siguiente formula:
Donde R es el valor de las corridas
contadas en el conjunto de datos.
Generalmente se trabaja
a un nivel de confianza de 0.05% de confiabilidad y se maneja las siguiente
hipotesis:
Ho Los datos son aleatorios
Ha Los datos no son aleatorios
El
valor tabulado de “Z”para un nivel de confianza de 0.05%, según la distribucion
normal es de 1.96; esto quiere decir que nuestro valor calculado de Z debe
estar entre este intervalo:
-1.96<
z < 1.96
De ser asi acepta la
Ho, caso contrario se acepta la Ha
Para el entendimiento de este test de corridas seguiremos el siguiente
ejemplo:
-
Prueba de corridas en las corrientes fluviales anuales. Los flujos anuales
de la Derwent en Yorkshire Bridge, Inglaterra, para el período de 1938-1967 se
tabulan a continuación en milímetros de equivalente escurrimiento sobre la zona
de captación por encima del lugar.
946
|
1058
|
1133
|
869
|
927
|
742
|
1113
|
665
|
955
|
1288
|
1074
|
838
|
815
|
910
|
1193
|
1386
|
955
|
1187
|
891
|
1302
|
867
|
837
|
1138
|
868
|
969
|
737
|
1143
|
947
|
763
|
1029
|
Ordenado los datos y realizando los
cálculos, tenemos:
·
Caso I
Valores de R (Corridas)
|
Annual flows (mm)
|
|||||
1
|
946
|
Promedio
|
985
|
|||
2
|
1074
|
Valores por encima del promedio (Rojo)
|
12
|
n
|
||
3
|
867
|
|||||
4
|
1058
|
|||||
5
|
838
|
|||||
837
|
Valores por debajo del promedio (amarillo)
|
18
|
m
|
|||
6
|
1133
|
|||||
7
|
815
|
|||||
8
|
1138
|
|||||
9
|
869
|
Valores de R (Corridas)
|
20
|
R
|
||
910
|
||||||
868
|
||||||
927
|
Ho
|
Los datos son aleatorios
|
||||
10
|
1193
|
Ha
|
Los datos no son aleatorios
|
|||
11
|
969
|
|||||
742
|
||||||
12
|
1386
|
µR
|
15.4
|
|||
13
|
737
|
|||||
14
|
1113
|
|||||
15
|
955
|
|||||
16
|
1143
|
Var[R]
|
6.653793103
|
|||
17
|
665
|
|||||
18
|
1187
|
|||||
19
|
947
|
|||||
955
|
Z
|
1.98
|
||||
891
|
Valor Critico Z al 0.05%
|
±1.96
|
||||
763
|
-1.96<1.98<1.96
|
|||||
20
|
1288
|
|||||
1302
|
||||||
1029
|
·
Caso II
Para el mismo ejemplo pero con los datos
distribuidos al azar tenemos lo siguiente:
Valores de R (Corridas)
|
Annual flows (mm)
|
|||||
1
|
946
|
Promedio
|
985
|
|||
838
|
Valores por encima del promedio (Rojo)
|
12
|
n
|
|||
2
|
1302
|
|||||
1058
|
||||||
3
|
837
|
|||||
4
|
1133
|
Valores por debajo del promedio (amarillo)
|
18
|
m
|
||
5
|
910
|
|||||
869
|
||||||
6
|
1138
|
|||||
1074
|
Valores de R (Corridas)
|
15
|
R
|
|||
7
|
815
|
|||||
868
|
||||||
927
|
Ho
|
Los datos son aleatorios
|
||||
8
|
1193
|
Ha
|
Los datos no son aleatorios
|
|||
1386
|
||||||
9
|
742
|
|||||
737
|
||||||
10
|
1288
|
|
||||
1113
|
µR
|
15.40
|
||||
11
|
891
|
|||||
12
|
1143
|
Valor Var[R] | ||||
13
|
969
|
Var[R]
|
6.653793103
|
|||
665
|
||||||
14
|
1029
|
|||||
1187
|
||||||
15
|
947
|
|||||
955
|
Z
|
0.04
|
||||
867
|
||||||
763
|
Valor Critico Z al 0.05%
|
±1.96
|
||||
955
|
-1.96<0.04<1.96
|
Para este caso, aceptamos la Ho y rechazamos
la Ha
Como se puede observar para ambos casos el número de corridas cambia de
valor haciendo que, matemáticamente, nos diga si nuestros valores son
aleatorios o no.
Conclusiones
Este
tipo de test son importantes para poder saber si nuestros datos son
independientes y totalmente aleatorios. Esto nos sirve para poder determinar la
confiabilidad de los datos y saber que no han sido manipulados de alguna manera
Bibliografía
- Kottegoda, N. T. 1997. Applied statistic for civil and environmental engineers. 2ª ed. Editorial McGraw Hill. New york. Pag. 267-267
- Estadística elemental. John E. Freund, Gary A. Simon.
No hay comentarios:
Publicar un comentario
*Utiliza Chrome o Explorer para insertar comentarios. Por alguna razón, en Firefox hay un error. Gracias!