martes, 9 de marzo de 2010

Distribuciones de Probabilidad relacionadas

Me gustaria hacer un inciso a lo dificil que resulta para ciertos alumnos (de segundo de Bachiller o de primero de carrera) entender conceptos y resultados de la estadística matemática que llevan propuestos más de dos siglos. A veces no es fácil entenderlos pq no se ha dedicado el tiempo o interés suficiente y me parece una de las ramas de las matemáticas más interesantes.

Primer resultado: Tres distribuciones.
Un primer resultado estaría en demostrar lo estrechamente ligadas que están las distribuciones más conocidas:
Binomial, la de Poisson, la normal , Student y Chi-Cuadrado.
En contra de lo que podamos pensar o nuestra primera impresión sugiera, estas distribuciones aparecen en nuestras vidas desde que nos levantamos y estamos rodeados de experimentos o variables aleatorias que tienen por distribucion alguna de estas distribuciones.
El hecho de que esten más o menos ligadas y se puedan aproximar vá en función de los parámetros utilizados.
.

Ejemplo 1:
Se dice que la Peste en europa en los siglos XIV y XV tenía un índice de mortandad de 25 por cada 100 habitantes.
Se podía decir (por desgracia) que el suceso de 'tener peste' era equiprobable cada año de esos dos siglos (se repetía el mismo índice) y además se ajustaba perfectamente a una distribución binomial de p = 25/100= 0,25.

Supongamos que pudieramos tomar un muestra de n=10 individuos de esa epoca y pintemos la curva de distribución asociada al hecho de contraer o no peste..


Grafica 1

A continuación, y siguiendo la teoría que las relaciona, pintemos la distribucion de Poisson P(k) y la Normal asociada N(u,s).
La Poisson tendrá como parámetro su media que será n*p = 2,5 y la normal tendrá por parámetros su media y varianza u = 2,5 y s = n*p*q en el resultado
que se conoce como el Teorema de Moivre.


Grafica 2
Dos siglos después la peste comenzó a erradicarse y se hablaba de un p = 0,02. Véase en el dibujo que las tres distriuciones ya se confunden..

Grafica 3


Hoy en día esta complentamete erradicada y hablamos entonces de 1 cada 10000 habitantes p = 0,0001. Se dice entonces que el suceso de 'tener peste' es 'raro' entre una población y es por ello que el buscar una distribución inicial que ajuste a este modelo es buscar una Poisson de parámetro n*p siendo n el tamaño
de la muestra escogida.

Si ahora volvemos al siglo XV y aumentamos la muestra n=35 (para que me quepa en el hoja excel) vemos que la aproximación es 'grande'.
En resumen, existe una relacion estrecha entre estas distribuciones cuando n tiende a infinito y bajo una varianza finita.
Eso es todo.
Puedes bajarte el archivo excel aqui..