Distribuciones:
Poisson, Rayleighy Student
Presentación para la Clase:
MATE 5400 –Probabilidad
Dr. Balbino García Bernard
Hiram Negrón
Ricardo Negrón
Rosa E. Padilla Torres
9 de febrero de 2012
DistribuciónPoisson
SiméonDenis PoissonFrancia, (1781 –1840),
fue un físico y matemático francés .
Trabajos en el campo de la electricidad,
también hizo publicaciones sobre la geometría
diferencial y la teoría de probabilidades.
En 1837 publico la ecuación de la Distribución
Poissonque fue resultados de un trabajo de
investigación
La distribución Poissondescribe la probabilidad
de encontrar exactamente r eventos en un
largo de tiempo si los eventos ocurren
independientes a un ritmo constante dado por
??????.
Ejemplo: Para un cable de cobre fino, se supone
que la cantidad de defectos sigue una
Distribución Poissoncon un promedio de 2.3
defectos por milímetros. Determinar la
probabilidad que exactamente se encuentre 2
defectos por 1 milímetro.
En este caso el promedio ??????= 2.3, la cantidad de
la probabilidad de defecto es r = 2.
Sustituyendo en la Ecuación obtenemos:
p??????=2;??????=2.3
=
2.3
2
??????
−2.3
2!
= 0.265
Los MomentosCentralesde la distribuciónPoisson son:
El Valor esperado:
E(x) = ??????
La Varianza:
V(x) = ??????
Tercer Momento:
??????
3= ??????
Cuarto Momento:
??????
4 = ??????( 1-3??????)
El coeficiente de “Kurtosis” es:
γ
2= 1/??????la kurtosises una medida de la
forma o
apuntamiento de las distribuciones.
Si ??????-> ∞ el “Skewness” y la “Kurtosis”
tienden han cero aproximando a una
Distribución Normal.
La función es la representación en series
de potencia de la función generadora de
probabilidad de la función masa de una
variable aleatoria.
La función esta dada por la siguiente
sumatoria:
G(z) = E(??????
??????
)=
??????=0
∞
??????
??????
??????
??????
??????
−??????
??????!
=�
−??????
Para calcular el contenido de la
Distribución Poisson necesitamos la
función acumulativa.
Utilizando la formula recursiva p(r) =
(r-1)
??????
??????
empezando con p(0) = �
−??????
podemos obtener la cumulativa.
Al final obtenemos la función
acumulativa :
P(r)=
??????=0
??????
??????
??????
??????
−??????
??????!
=1-
0
2??????
�(??????:ν=2??????+2)ⅆ??????
La suma de cualquier numero de una
variable independiente de la Distribución
Poisson es también distribuida como una
Distribución Poisson.
Para n variables con parámetro del
promedio ??????encontramos la siguiente
función característica:
∅(??????
1 + ??????
2… r
n)
=
i=1
n
exp{μ
i(e
μ
-1)}
= exp{
??????
??????
μ
i(e
μ
-1)}
Mediante el uso de la técnica acumulativa
que forma la acumulación por partida con
y utilizando la fórmula recursiva
r
rPrP
1)(
eP)0(
Un número aleatorio a partir de una
distribución de Poissonse obtiene
fácilmente utilizando un número
aleatorio uniforme entre cero y uno. Si μ
es una constante la generación, con
mucho, más rápido se obtiene si el vector
acumulativo preparado una vez por
todas.
Una alternativa es obtener, en p, un número
al azar de una distribución de Poisson
multiplicando independiente e uniforme de
números aleatorios hasta
Para valores grandes de μusar la
aproximación normal, pero ten cuidado con
el que la distribución de Poissones una
función de una variable discreta.
0i
i
e
Distribuciónde Rayleigh
La distribución de Rayleighesta dada por
para los valores positivos de la variable xy un
parámetro positivo α
La cual lleva el nombre del físico británico Lord
Rayleigh, también conocido como Barón
John William StruttRayleighde Terling.
Gano un premio Nobel de Física en 1904.2
2
2
2
);(
x
e
x
xf
Teniendo en cuenta que el parámetro alfa es
simplemente un factor de escala y que la variable
y=x/α simplificado a la distribución se obtiene
A continuación presentaremos una distribución
que tiene un modo en x = α y positivamente
sesgada.2
2
)(
y
yeyg
Los momentos algebraicos están dados
por
Tenemos una conexión con los
momentos absolutos de la distribución
de Gauss. Usando estas el resultado es
2
2
2
1
0
2
||
2
1
)(
x
exdxxfxxE
nnn
n
xE n
n
!!
2 kk
k
2
!2
Para nimpar
Para n= 2k
En concreto se observa que el valor
esperado, la varianza, y los momentos
centrales de tercera y cuarta están dadas
por
los coeficientes de asimetría son así.2
)(
xE
2
2
2)(
xV
2
3
3 3
4
34
4
2
8
63111.0
2
3
2
3
2
2
1
24509.03
2
8
2
2
4
3
2
2
La distribución acumulada, o la función de distribución, se dan por
donde hemos hecho la sustitución con el fin de simplificar la
integración. Como debe ser, vemos que y .
Con esto podemos calcular la mediana por M.
2
2
2
2
2
2
2
2
2
2
000
1
1)()(
x
xy
edzeyedyyfxF
z
xx
a 2
2
2
y
z 17741.12ln2
2
1
)( MMF 0)0(F 1)(F
Los cuartilesinferior y superior se
convierte en
Misma técnica es útil cuando la
generación de números aleatorios de la
distribución de Rayleighcomo se
describe a continuación. 75853.0ln2
4
3
1 Q 66511.14ln2
2 Q
Dado dos independientes coordenadas x
y yde la distribución normal con media
cero y el mismo la distancia se
distribuye de acuerdo a la distribución de
Rayleigh. xy ypueden ser considerados
como los componentes de velocidad de
una partícula que se mueve en un plano.2
Comenzamos escribiendo
Ya que y se distribuyen de la variable normal
estándar, la suma de sus cuadrados tiene la
distribución de chi-cuadrado con 2 grados de libertad
de la que nos encontramos2
2
2
2
2
2
yxz
w 2
)(
2
w
e
wg
2
2
2
222
2
2
)()(
z
e
zzz
g
dz
dw
wgzf
x
y
La distribución de Rayleighpuede ser
comparado con el caso de tres
dimensiones donde terminamos un poco
con la distribución de Maxwell.
Para obtener números aleatorios de la
distribución de Rayleighde una manera
eficiente que hacer la transformación
una variable de cual sigue la distribución
exponencial .Un número aleatorio a
partir de esta distribución se obtiene
fácilmente mediante la adopción de menos el
logaritmo natural de un número aleatorio
uniforme. 2
2
2
x
y y
eyg
)(
Nosotros por lo tanto podemos encontrar
un número aleatorio rpartir de una
distribución de Rayleighpor la expresión
donde ξes un número aleatorio
uniformemente distribuido entre cero y
uno.ln2r
Esto podría haber sido encontrados en
máquina mediante la distribución
acumulada
Un resultado que es idéntico ya que si e
se distribuye uniformemente entre cero y
uno también lo es 1-ξ.)1ln(21)(
2
2
2
xexF
x
Siguiendo los ejemplos anteriores es posible
que también se han utilizado dos números
aleatorios independientes de una
distribución normal estándar, y para
construir:
Sin embargo, esta técnica no es tan eficiente
como el esbozado anteriormente1z 2z 2
2
2
1
1
zzr
Distribución tde Student
La distribución tde Student está dada por:
Donde:
–nes un parámetro entero positivo
–tes una variable real
–Γ y B son las funciones usuales Gamma y Beta
22
1
2
1
2
2
1
2
2
,
1
2
1
2
1
);(
n
n
n
n
n
n
t
t
n
ntf
La función Gamma está dada por:
Si nes entero positivo, entonces:dtetz
tz
0
1
)( )!1()( nn
La distribución Beta está dada por:
Donde:
–Valor esperado:
–Varianza:11
)1(
)()(
)(
)(
ba
xx
ba
ba
xf ba
a
xE
][ 2
))(1(
][
baba
ab
xV
La siguiente gráfica muestra la
distribución tpara n = 1, 2, 5, ∞ con
distribución normal estándar idénticas:
Si cambiamos la variable y
colocamos , la distribución t se
convierte en: con
donde ksimplemente es la constante de
normalización y m es positivo “mitad entero”
(número de la forma n+ ½.n
t
x 2
1
n
m m
x
k
mxf
)1(
),(
2
2
1
2
1
2
1
2
1
,
1)(
mm
m
k
Esta distribución fue ideada u originada
por William Sealy Gosset (1876-1939).
Poseía un título en Matemáticas y
Química de Oxford.
Comenzó a trabajar para Messrs.
Trabajó en la destilería Guinnes en
Dublín.
Aplicó sus conocimientos estadísticos
para poder seleccionar las mejor
selección de variedades de cebada
utilizando pequeños ejemplos de teoría
estadística para hacer experimentos.
Debido a que la compañía no permitía a
los empleados publicar en revistas,
su trabajo sobre relación tfue
publicada bajo el seudónimo de
“Student”
La distribución tde Student es simétrica
alrededor de t=0.
Todos los momentos impares
desaparecen.
Los momentos pares son calculados
utilizando la forma f(x ; m)con
lo que implica una relación entre los
valores esperadosn
t
x )(
22 rrr
XEntE
El momento central de orden par es dado
por rentero positivo:
Sustituyendo:
Luego de manipulación algebraica,
obtenemos:
0 2
2
2
2
2
1
2
1
);( dx
x
x
kdx
x
x
dxmxfx
m
r
m
r
r 2
2
1x
x
y
y
x
1
1
1
2 y
y
x
1 22
)1(
2
x
x
dy
22
1
2
1
2
1
1
0 ,
,
)1(
2
1
2
3
n
yrm rmr
dyyk
r
El cálculo de la acumulación de la función
de distribución tpuede obtenerse
simplemente estimando la integral para
una función simétrica.
22
1
2
22
1
,1
,
1
)(
2
2
2
1
2
n
tn
t
t
t
u
t
t n
du
n
duuf
n
Para simplificar la integración para hallar
la función acumulativa, sustituimos:
Tenemos:2
un
n
x
22
1
2
1
2
1
,
2
2
n
tn
t
)(tF
22
1
2
1
2
1
,
2
2
n
tn
t
Para
Para 0x x0
La distribución en F = t² es dada por:
Se reconoce la distribución Fcon grados
de libertad n y 1.
Según como , la distribución de
Student se acerca más a la distribución
normal.
2
1
2
1
2
22
1
22
1
2
1
,,
1
2
1
)()(
n
n
nF
Fn
nf
tf
df
dt
Ff
nn
n
n
F n
Para una mejor aproximación, dividimos
por la raíz cuadrada de la varianza.
n
t
n
t
z
2
4
1
2
1
1
Recordemos:
Donde xy yson variables aleatorias
independientes distribuidas de acuerdo
con la distribución normal estándar y
distribución de Chi cuadrado con n
grados de libertad.
Función de probabilidad:
Donde:n
y
x
t
2
1
2
22
2
2
22
1
);,(
n
n
yn
x ey
enyxf
x 0y
Si cambiamos las variables a
y , la distribución tcon
y se convierte en:n
y
x
t );,(
),(
),(
);,( nyxf
ut
yx
nutf
yu t 0u
Respecto a una muestra de población
normal donde la media
es distribuida como y
Éste es un ejemplo de la distribución tde
Student con n-1grados de libertad.
Es utilizada para demostrar la hipótesis
de que
2
,N X
2
2
,
N
2
2
1
sn
n
s
n
sn
n
X
X
L
)1(
1
2
2 X
Dadas dos muestras y
de distribución normal con
igual varianza pero medias diferentes
y respectivamente.
La cantidad posee
distribución normal con y varianza
igual a
mxxx,...,,
21
nyyy,...,,
21 2
x y
yxYX 0X
nm
112
Podemos estimar la varianza agrupada
como:
Es una teoría normal estimar con
m+n-2 grados de libertad, mientras S²wa
indepediente de para una población
normal
2
2
1
2
12
nm
YyXx
S
n
i
i
m
i
i 2
X
s
nm
yx
YX
t
11
Las observaciones realizadas en parejas
para i = 1, 2, …,n.
Proporciónt:
Donde:
–y son varianzasestimadasde xy y
– esla covarianzaentre ellos
–Gradosde libertad2n-2
iiyx, xyyx CSS
dn
2
22
2
xS 2
yS xyC
Para demostrarel nivelde confianzao
comprobarunahipótesisutilizandola
distribucióntdefinimosdesde
con ngradosde libertad.
En casode unamuestranormal, se define
a comoel intervalode confianza
parant
,
1;,
,
dtntfntF
n
t 1 1,1,
22
nn
S
nn
S
tXtX
Utilizamos estadísticas tcon el fin de
probar hipótesis con respecto a la media
de una población.
En el caso de una muestra con hipótesis
nula, será y la hipótesis
alterna .
Utilizamos 00:H 01:H n
s
X
t
0
La probabilidad para rechazar la hipótesis es
verdadera y así α.
Es llamado “Error tipo I”
El “Error tipo II” implica que se acepta la
hipótesis aunque estuviese errónea y la
distribución en su lugar tiene una media .
El cálculo dependerá de la elección de α, así
comoel númerode observacionesn.
En el casode dos muestras, deseamosprobar
la hipótesisnula comparadaconyxH :
0 yxH :
1 1
Para calcular los intervalos de
probabilidad o prueba de hipótesis,
tenemos que ser capaces de calcular la
integral de la función de densidad de
probabilidad sobre ciertas regiones:
Define la cantidad para el nivel de
confidencialidad αespecífico.
1;,
,
dtntfntF
n
t nt
,
Para un npar, colocamos y
hacemos la sustitución .2
n
m n
t
x
n
n
n
t
n
t
t
n
n
dt
n
dtntf
,
2
1
2
,
1
);(1
2
2
1
n
n
t
m
x
dx
m
m
,
2
1
2
2
1
1
Utilizando tablas de integrales, para
conveniencia, sustituimos
Tenemos:
Resumiendo: Utilizamos relación
recurrente (u)y comenzamos con y n
t
x
n,
1
0u n
t
r
rr
uu
2
1
1
2
1
1
1
0
2222
2
2
1
2
1
1!2
!2
12!2
2!!1
1
m
r
r
r
m
xr
r
x
x
mm
mmm
1
0
2
1
1
2
12
1
m
r
r
n
t
n
u
Para grados de libertad impares, colocamos
y hacemos la sustitución .
Luego de manipulación algebraica, uso de
sustituciones de , y manipulación
algebraica obtenemos:2
1
n
m n
t
x
n
n
n
t
n
t
t
n
n
dt
n
dtntf
,
2
1
2
,
1
);(1
2
2
1
n
n
t
m
x
dx
m
m
,
2
1
2
2
1
2
1
1
2
1
1
1
1
2
1
2 arctan
1
1
n
r
n
t
r
n
t
n
v
1
1v n
t
r
rr
vv
2
1
1
12
1
1
Para generar números aleatorios tpara
una distribución t, necesitamos la
distribución normal y Chi cuadrado como:
Donde:
–z es la distribución normal estándar
–y
n= Chi cuadrado
–n= grados de libertadn
y
z
t
n
Utilizando Mathematica®
Microsoft Excel
Walck, Christian (2000). Hand-bookon
STATICAL DISTRIBUTIONS for
experimentalists, Universityof
Stockholm.