DISTRIBUCIONES MUESTRALES
E INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS
Vladimir Moreno Gutiérrez 17 de Septiembre de 2011
ii
Índice general
Introducción 1. ESTIMACIÓN Y DISEÑO DE
EXPERIMENTOS 1.1. INTRODUCCIÓN . . . . . . . .
. . . . . . . . . . . . . . . . . . 1.2. MUESTRAS
ALEATORIAS Y MUESTREO ALEATORIO . . . 1.3. DISTRIBUCIONES MUESTRALES . .
. . . . . . . . . . . . . . 1.3.1. INTRODUCCIÓN . . . . . . . . . . . .
. . . . . . . . . . 1.3.2. Distribuciones muestrales
. . . . . . . . . . . . . . . . . . 1.4. DISTRIBUCIONES MUESTRALES ASOCIADOS
CON LA DISTRIBUCIÓN NORMAL
. . . . . . . . . . . . . . . . . . . . . . . 1.4.1. DISTRIBUCIÓN CHI-CUADRADO. . . . . . . . . . . .
VII
ÍNDICE GENERAL
Prefacio
This is the preface. It is an unnumbered chapter. The TeX …eld at the beginning of this
paragraph sets the correct page heading for the Preface portion of the
document. The preface does not appear in the table of contents.
v
vi
ÍNDICE GENERAL
Introducción
The introduction is entered using the usual chapter tag. Since the introduction
chapter appears before the mainmatter TeX
…eld, it is an unnumbered chapter. The primary di¤erence between
the preface and the introduction in this shell document is that the
introduction will appear in the table of contents and the page headings for the
introduction are automatically handled without the need for the markboth
TeX…eld. You may use either or both methods to create chapters at the
beginning of your document. You may also delete these preliminary chapters.
vii
viii
INTRODUCCIÓN
Capítulo 1
ESTIMACIÓN Y DISEÑO DE EXPERIMENTOS
1.1. INTRODUCCIÓN
En esta sección estudiaremos la distribución de probabilidad de
varios estadisticos muestrales tal como la media muestral y la varianza
muestral, y aprenderemos sobre su uso.
1.2.
MUESTRAS ALEATORIAS Y MUESTREO ALEATORIO
Cuando se hace una investigación estadística se siguen ciertos
pasos, como se hace en toda investigación; después de
de…nir el modelo estadístico relativo al problema en estudio y
antes de recolectar los datos es necesario decidir de que forma se van a
recolectar estos datos, es decir que procedimientos se van a emplear para
obtener la muestra, de manera que sea posible aprender algo acerca de la
población sustentados estadisticamente en los datos extraídos de
una parte de ella. Las razones por las cuales se utiliza el muestreo y no toda
la población (censo) son varias: en las últimas décadas los
grandes avances hechos en la teoría del muestreo, hacen posible medir
algunas propiedades de una población obteniendo resultados
…dedignos de métodos y procedimientos de muestreo correctos; por
otra parte las poblaciones bajo estudio pueden ser in…nitas, en cuyo caso
el muestreo es el único procedimiento posible, incluso en el caso de
poblaciones …nitas lacantidad de sus elementos puede ser millones o miles
de millones, y su enumeración sería imposible en términos
practicos. Ademas, en algunas investigaciones, la medición de las
propiedades o características de los elementos de la muestra conllevan a
una destrucción de éstas, caso en el cual un censo
implicaría la destrcción de la población. 1
2
CAPÍTULO 1. ESTIMACIÓN Y DISEÑO DE EXPERIMENTOS
En la practica, para hacer inferencias solamente se toma una muestra, e
independientemente del
tamaño de ésta un hecho seguro es que sus características
no son exactamente las de la población. ¿Cómo podemos,
entonces, estar seguros sobre el grado de con…anza
de nuestras conclusiones? La resupuesta es simple: la aleatoriedad de la
muestra. La medición objetiva de los errores por muestreo requiere que
la muestra sea al azar, para de esta manera aplicar las leyes de la
probabilidad. TIPOS DE MUESTREO Los modelosde muestreo pueden
agruparse en al azar y no al azar. El muestreo al azar también se
conoce como
muestreo probabilistico. El muestreo no al azar (juicio de expertos u otras
consideraciones) es un proceso de selección de
muestras sin el uso del
azar, es decir se selecciona una muestra sobre una base de consideracioens
distintas de probabilidad. En el caso de muestreo no al azar, la probabilidad
de que cada individuo de la población sea extraído de la
población es desconocida y la …delidad de sus resultados no es objeto
deanalisis probabilístico, sino que consecuentemente
debera depender del juicio de los expertos. Los
distintos tipos de muestreo se resumen a continuación: 8 8 8 Con
reemplazo > > > > > > Simple > > > > > >
Sin > > > > 8 reemplazo > > > > > > > > <
Proporcional > > > > > > > > > > > > No
proporcional Estrati…cado > > < > > : > > > >
Cruzado Único > > > > 8 < > > > > Una etapa
< > < > Azar > > Agrupado (conglomerados) Dos etapas Muestreo
> > > > : > > > > > > Múltiples etapas
> > > > > > : > > > > Sistematico >
> > > > > > Doble > > > > > > > >
> Múltiple > > > > : > > Secuencial > > : No
al Azar (Juicio de espertos) MUESTREO ALEATORIO SIMPLE (M.A.S.) A partir de una
población de N unidades se selecciona una, dando igual probabilidad a
todas las unidades, con ayuda de una tabla de números aleatorios (o
algún método matematico para generarlos). Si el muestreo
simple se hace con reemplazo, entonces se toma la información relevante
de la unidad seleccionada y se regresa a la población donde se mezcla
con las demas. Si este procedimiento se repite
n veces, se obtiene una M.A.S. de n unidades. Si cada una de las n unidades
seleccionadas, una a una, se separa de la población (no se retorna)
entonces se tendra una M.A.S. sin reemplazo. De…nición 1.1
Si de una población de tamaño N se selecciona un tamaño de
muestra n, de manera que cada muestra tenga la misma probabilidad de ser
seleccionada, el procedimiento de muestreo se denominamuestreo aleatorio
simple. A una muestra obtenida de esta manera se denomina
muestra aleatoria simple.
1.2. MUESTRAS ALEATORIAS Y MUESTREO ALEATORIO
3
El número de muestras de tamaño n tomadas aleatoriamente de una
población N N de tamaño N , sin
reemplazo es igual a = n!(N ! n)! n El número
de muestras de tamaño n tomadas aleatoriamente de una población
de tamaño N , con reemplazo es igual a N n Ventajas de este
procedimiento: 1) Es sencillo y de facil comprensión. 2) Es de
calculo rapido de medias y varianzas. 3)
Existen paquetes computacionales para analizar los datos. Desventajas: 1)
Requiere que se enumere a toda la población (por tanto se recomienda
para poblaciones pequeñas) 2) Si se trabaja con muestras
pequeñas, se corre el riesgo de que no representen a las
población adecuadamente. Ejemplo 1.1 Una población esta
conformada por las unidades A; B; C; D; E; Hacer un listado de todas las
muestras de tamaño 2 que se peuden seleccionar aleatoriamente de la
población. En este caso N = 5; n = 2, por tanto
el número de muestras de tamaño 2 5 5! es
= 2!3! = 10, el listado de estas muestras es AB; AC; AD; AE; BC, 2 BD; BE; CD;
CE; DE: ¿ Cual es el número de muestras aleatorias de
tamaño 3, con repetición que se pueden sacar de esta
población ¿ Cual es el
número de muestras aleatorias de tamaño 2, si el muestreo simple
se hace sin reemplazo? ¿ Cual es el
número de muestras aleatorias de tamaño 3, si el muestreosimple
se hace sin reemplazo? MUESTREO ESTRATIFICADO Si la población es
heterogénea y las consideraciones de costo limitan el tamaño de
la muestra, podría ser imposible obtener un estimador
lo su…cientemente preciso tomando una muestra aleatoria simple de toda la
población. La idea es dividir la población de manera que se
reduzca, considerablemente, la variación dentro de los subconjuntos en
que ésta se dividió, para hacer una mejor estimación de la
característica o propiedad en estudio de la población. El proceso de estrati…cación requiere que la
población sea dividida en grupos o clases, llamados estratos. Entocnes se toma una muestra de cada estrato por métodos
simples al azar y la muestra resultante se denomina muestra estrati…cada.
Una muestra estrati…cada puede ser porporcional o no
proporcional. En el muestreo estrati…cado
proporcional el número de unidades extraídas de cadaestrato es
proporcional al tamaño de éste. Ejemplo 1.2 Si la
población se divide en cuatro estratos, de tamaños 15 %, 20 %, 25
% y 40 % de la población, y ha de extraerse una muestra de tamaño
4
CAPÍTULO 1. ESTIMACIÓN Y DISEÑO DE EXPERIMENTOS
1000, entonces la muestra proporcional deseada se debera obtener de la
siguiente manera: Estrato Tamaño de la muestra I 1000 15 % = 150
unidades II 1000 20 % = 200 unidades . III 1000 25 % =
250 unidades IV 1000 40 % = 400 unidades Tamaño de la muestra
estrati…cada 1000 unidades El muestreo estrati…cadono proporcional
incluye los procedimientos de tomar un número igual de unidades de cada
estrato, sin tener en cuentasu tamaño, ode dar solo una pequeña
rpresentación a uno o mas estratos cuyos miembros son demasiado
costosos de investigar pero que resulta valioso incluirlos. Este tipo de
muestreo es e…ciente con poblaciones heterogéneas o altamente
asimétricas, estrati…cando la población de manera que
dentro de cada estrato haya la mayor homogeneidad posible, y entre
losdistintosestratos las diferencias sean lo
mas grande posibles. MUESTREO POR CONGLOMERADOS.
Este método de muestreo consiste en dividir la
población en en grupos o regiones, y extraer una muestra de ellos
pararepresentar la población. Cuando los grupos
o regiones (que son las unidades primarias) son extraídos, se peuden
incluír en la muestra todas las unidades elementales de las unidades
primarias, o tomar una muestra de cada unidad primaria para construir la
muestra de…nitiva. En el caso de tener en cuenta todas las
unidades elementales de las undiades primarias, se dice que se ha realizado un muestreo por conglomerados en una sola etapa, y cuando se
toma una muestra de cada unidad primaria entonces se ha desarrollado un
muestreo por conglomerados en dos etapas, o un submuestreo. En
ambos diseños la muestra se toma simple y al azar. MUESTREO
SISTEMATICO. Este tipo de muestreo se consigue enumerando las unidades
de muestreo de la población progresivamentede 1 a N , determinar la
longitud del intervalo de muestreo, k = N , entonces se selecciona un
número a al azar en el primer inn tervalo de muestreo, el que va de 1 a
[k], entonces la muestra de tamaño n tendra como sus unidades a
los miembros cuyos números de serie correspondientes a a; a + k; a + 2k;
a + 3k; : : : ; a + (n 1)k: Ejemplo 1.3 De una población de tamaño
100000 se queire tomar una muestra sistematica de tamaño 500.
entonces procedemos a determinar la longitud del intervalo de muestreo: k =
100000 = 200, Después escogemos un número al azar 500 entre 1 y
200, digamos que es 85, entonces la muestra sistematica comenzara
con el miembro número 85 de la población numerada y se
escogera cada 200 un nuevo miembro, es decir la muestra
sistematica correspondera a los miembros cuya etiqueta ordinal
es: 85; 285; 485; 685; 885; 1085 : : ; 99885:
MUESTREO DOBLE, MULTIPLE Y SECUENCIAL. Los anteriores métodos de
muestreo se concoen como
muestreos únicos, ya que cada método se empela para obtener un
sola muestra, de la cual se hara una estimación o prueba de
hipótesis.
1.3. DISTRIBUCIONES MUESTRALES
5
El muestreo doble es el proceso mediante el cual se toma una muestra
pequeña y de acuerdo con algún criterio, previamente establecido,
se toma ladecisión de aceptar, rechazar o tomar una segunda muestra. El
muestreo múltiple realiza una serie de muestras pequeñas tal que el número acumulado de alguna
característicase compara con algún criterio para aceptar o
rechazar luego de extraida cada muestra hasta que …nalmente pueda tomarse
una decisión. En el muestreo secuencial, se inspeccionan las unidades
una a una y se decide si aceptar o rechazar la muestra de acuerdo con los
resultados obtenidos en cada unidad. Ejemplo 1.4 Para un muestreo doble
de…nimos la siguiente regla de decisión: Escoja una muestra al
azar de 50 unidades, si se encuentran 3 o menos unidades defectuosas se acepta
la muestra ( o lote), si se encuentran 5 o mas
unidades defectuosas se rechaza la muestra, pero si se encuentran exactamente 4
unidades defectuosas se toma una segunda muestra de 30 unidades, el total
muestreado es de 80 unidades.
1.3
1.3.1.
DISTRIBUCIONES MUESTRALES
INTRODUCCIÓN
Las distribuciones muestrales juegan un papel muy
importante en analisis estadístico y toma de decisiones.
Empezaremos el estudio de este tema analizando la
distribución de un estadístico calculado de una muestra
aleatoria. En la sección anterior al tomar una muestra
aleatoria de una población cada unidad de la muestra fue tomada
aleatoriamente, de esta manera cada unidad de una muestra corresponde a la
realización de una variable aleatoria. En este sentido una muestra
es un conjunto de variables aleatorias X1 ; X2 ; X3 ; : : : ; Xn , por tanto un
estadístico muestral, que es una función de la muestra aleatoria,
también es una variable aleatoria. La distribución deprobabilidad
de un estadístico muestral se llama su
distribución muestral. Las distribuciones muestrales son los instrumento
de enlace entre la teoría de probabilidad y la inferencia
estadística. La capacidad paradeterminar la distribución de un estadístico es una etapa crítica en la
construcción y evaluación de modelos o procedimientos
estadísticos. Es importante observar que existe diferencia entre la
distribución de la población, de la cual la muestra se
tomó, y la distribución del estadístico muestral.
En general una población tiene una distribución que usulamente es
desconocida, mientras que un estadístico tiene
una distribución muestral, que usualmente di…ere de la
distribución poblacional. La distribución muestral de un estadístico provee de un modelo teórico del histograma de frecuencias relativas para los posibles
valores del estadístico que uno
podría observar a través del
muestreo repetido.
6
CAPÍTULO 1. ESTIMACIÓN Y DISEÑO
DE EXPERIMENTOS
1.3.2.
Distribuciones muestrales.
En muchas situaciones realizar un censo (estudio de
todos los elementos de la población) resulta imposible y altamente
costoso, es preferible llevar a cabo un muestreo (instrumento para obtener un
subconjunto represetativo de la poblacion) para obtener información de
toda la población. Ahora bien, un muestreo solamente permitira
conseguir información de una parte de la población y por tanto es
de esperar un error de precisión enla información obtenida en la
muestra respecto a la caracterisica de la población que se quiere medir,
es decir en todo muestreo existe un error de muestreo. De…nición
1.2 Una muestra es un conjunto de variables aleatorias observables X1 ; X2 ; X3
; : : : ; Xn :El número n se llama el tamaño de la muestra. Si
cada variable aleatoria Xj tiene la misma distribución de probabilidad
entonces se dice que las variables aleatorias X1 ; X2
; X3 ; : : : ; Xn se distribuyen identicamente. De…nición 1.3 Una
muestra aleatoria de tamaño n de una población es un conjunto de
n variables aleatorias independientes e identicamente distribuidas (iid) X1 ;
X2 ; X3 ; : : : ; Xn : De…nición 1.4 Una función T de las
variables aleatorias X1 ; X2 ; X3 ; : : : ; Xn , que no depende de algún
parametro desconocido, se llama un estadístico. Es decir un estadístico es una medidade descripción
numérica de una muestra, mientras que un parametro es una medida
de descripción numérica de una población.
Ejemplo 1.5 Dada X1 ; X2 ; X3 ; : : : ; Xn una muestra aletoria de una
población, n X 1 Xj , y la varianza muesentonces la media muestral
esta de…nida por X := n
j=1
tral por S 2 :=
1 n 1
que inclusive con muestras aleatorias, existe una variabilidad muestral o
error, es decir si seleccionamos diferentes muestras de la misma
población, un estadístico tomara diferentes valores en las
diferentes muestras.
n X j=1
Xj
X , son ejemplos deestadísticos. Observemos
2
De…nición 1.5 La distribución de probabilidad de un estadístico muestral se llama distribución
muestral. Ejemplo 1.6 Consideremos una población
…nita compuesta por cinco unidades f1; 2; 3; 4; 5g. Hallar todas las posibles muestras consistentes de tres unidades
seleccionadas aleatoriamente, sin reemplazo, de la población. Obtener la distribución de la media muestral.
1.3. DISTRIBUCIONES MUESTRALES Como no importa el orden de las unidades
seleccionadas, entonces existen
7
5 = 3 10 muestras de tamaño 3. Éstas son: f1; 2; 3g, f1; 2; 4g,
f1; 2; 5g, f1; 3; 4g, f1; 3; 5g, f1; 4; 5g, f2; 3; 4g, f2; 3; 5g, f2; 4; 5g,
f3; 4; 5g. Calculamos las medias para cada una de las diez muestras, y
obtenemos la distribución muestral de X:
7 8 10 11 x 2 3 4 3 3 3 3 1 2 2 2 1 1 1 P (x) 10 10 10 10 10 10 10 2 Por
ejemplo P 10 = P X = 10 = 10 porque las dos muestras f1; 4; 5g y 3 3 f2; 3; 5g
ambas dan un promedio x = 10 , que es un estimado de la media pobla3 cional, .
El siguiente resultado establece que si se selecciona una muestra aleatoria de
una población con media y varianza entonces
se peude obtener la media y desviación estandar del estadistico X en terminos de la media y
la desviación estandar de la población, sin importar la forma de
la distribución poblacional.
Teorema 1.1 Sea X1 ; X2 ; X3 ; : : : ; Xn , una muestra aleatoria de
tamaño n de 2 una población con media y varianza 2 , entoncesE X
= y V ar X = n : Se denotara E X =
X
y V ar X
2 X
2
=
2 , X
por tanto del teorema anteri-
or se tendra X = y = n : X se llama el error estandar de la
media. Notemos también que la variaza de cada una de las variables
aleatorias X1 ; X2 ; X3 ; : : : ; Xn , es 2 , mientras que la varianza de la
media muestral X es 2 2: n , que es menor que la varianza de la
población para n En el caso de poblaciones …nitas se tienen
formulas para las medias y varianzas poblacionales y las correspondientes
medias y varianzas muestrales, como se establece a continuación. Sea fc1 ; c2 ; : : : ; cN g una población …nita.
Entonces la media y varianza poblaN N X X 2 1 1 cional son = N cj ; 2 = N (cj ) , respectivamente. En el siguiente
j=1 j=1
teorema se establece la relación entre las medias y varianzas muestrales
con las poblacionales.
Teorema 1.2 Si X1 ; X2 ; X3 ; : : : ; Xn , es una muestra de tamaño n,
seleccionada sin reemplazo de una población de tamaño N ,
entonces E X = ; y V ar X =
2
n
N N
n 1
:
Observaciones: En el teorema no se exige que la muestra sea aleatoria, y las
variables aleatorias XJ no son iid. El factor N n es
frecuentemente llamado el factor de corrección para población N 1
…nita. Aunque el muestreo sin reemplazo en poblaciones
…nitas causa dependencia de las variables aleatorias Xj , cuando el
tamaño de la muestra es pequeño (respecto del tamaño de la
población), este factor decorrección es aproximadamente igual a
1. Por consiguiente emplearemos, para poblaciones …nitas, la varianza
muestral con este factor igual a 1.
8
CAPÍTULO 1. ESTIMACIÓN Y DISEÑO
DE EXPERIMENTOS
Ejemplo 1.7 Hallar la media y la varianza de X en el ejemplo 1.6.
Solución 1.1 Este ejemplo corresponde a una población …nita
de cinco unidades, 1 1 8 con media poblacional = 3, y 2 = 2. Entonces E X = 2
10 + 7 10 + 3 3
2 10
+3
2 10 2 10
+ 10 3
2 10 2 10
+ 11 3
10 2 3
1 10
+4
2 10 2
1 10
= 3, y E X
1 2 10 + 4 2 = 28 3
2
= 22
1 840 10 = 90 1 32 = 3 ,
1 10
+
7 2 3
1 10
+
8 2 3
+ 32
+
+
11 2 3
=
28 3 ,
entonces,
E X la varianza es V ar X = E X a la sexta parte de la varianza poblacional.
que corresponde
Proposición 1.1 Si X1 ; X2 ; X3 ; : : : ; Xn , es una muestra de
tamaño n, seleccionada de una población con media y varianza 2 ,
entonces la varianza muesPn 2 tral S 2 := n 1 1 i=1 Xi X satisface E[S 2 ] = 2
: Esta proposición signi…ca que el estadístico S 2 es
e…ciente ya que su valor esperado es exactamente igual al
parametro población que se pretende estimar.
Ejemplo 1.8 Supongamos que la población de interés consiste de
cinco jugadores de un equipo de atletismo, que se llamaran A, B, C, D y
F. La característica de interés es su altura, la siguiente tabla
lista estos valores: Atleta A B C D E estatura(cm) 172
180 165 175 170 a) Obtenerla distribución muestral de la media muestral
para muestras detamaño 2. b) Emitir concepto estadístico respecto
del
error muestral cuando altura media de una muestra aleatoria de tamaño
dos se utiliza para estimar la altura media poblacional. c) Hallar la
probabilidad de que, para una muestra de tamaño dos, el error muestral
al estimar la media poblacional por la media muestral sea de 2cm o menos, es
decir determine la probabilidad de que x se encuentre a 2cm de . 5 X
Calculemos la media poblacional: = i=1 = 172+180+165+175+170 = 171;4 5 5 a)
Dado que la población es pequeña, entonces podemos listar todas
las muestras de tamaño dos en una tabla: Muestra Estaturas Media
176 168.5 173.5 171
172.5 177.5 175
167.5 167.5 172.5
1.3. DISTRIBUCIONES MUESTRALES
9
B) De esta tabla podemos deducir que ninguna de las muestras de tamaño
dos tiene una estatura promedio igual a la estatura media de la
población, por tanto el muestreo aleatorio simple da liugar a un error,
en este caso el error de muestreo va desde 0.4 hasta 6.1. C) Las muestras
aleatorias de tamaño 2 que se encuentran a 2cm o menos de la estatura
media poblacional son: {, , }, por tanto la probabilidad de que
la estatura media muestral se encuentre a 2cm o menos de 3 la estatura
mediapoblacional es de 10 = 0;30 = 30 % Ejercicio 1 Supongamos que la
población de interés consiste en los principales jugadores de
fútbol de la selección española, que alcanzó el
campeonato en el año 2010. Llamaremos a estos jugadores A, B, C, D, E,
F, G, H, L, M, N, O, P, Q, R, S, T, U. Supongamos que las
características de interés son: estatura, peso, edad. En la siguiente tabla se listan los jugadores y los valores de las
tres características. Jugador Estatura (cm) Peso (kg) Edad
(años) A 182 85 29 B 190 85 28 C 192 85 23 D 178 78 32 E 183 81 24 F 182
79 28 G 189 83 22 H 175 69 23 I 168 66 30 J 170 65 26 K 177 67 24 L 169 68 23 M
185 69 26 N 175 69 29 O 182 76 31 P 190 86 22 Q 195 90 25 R 182 78 32 Emplear
el programa R para desarrollar los siguientes puntos. a) Obtener la
distribución muestral de la media muestral para muestras de
tamaño 2, para cada una de las características: estatura, peso,
edad. b) Hallar la probabilidad de que, para una muestra de tamaño dos,
el peso medio muestral se encuentre a mas de 2 kg del peso medio
poblacional. c) Hallar la probabilidad de que, para una muestra de
tamaño dos, la edad media muestral se encuentre a mas de 5
años de la edad media poblacional.
1.4
DISTRIBUCIONES MUESTRALES ASO-
10
CAPÍTULO 1. ESTIMACIÓN Y DISEÑO DE EXPERIMENTOS
CIADOS CON LA DISTRIBUCIÓN NORMAL
Proposición 1.2 Sean X1 ; X2 ; X3 ; : : : ; Xn , variables alestorias
independientes tales que Xj sedistribuye normal con media j y varianza 2 , para
cada j, j n X j = 1; 2; : : : ; n, entonces la distribución de la
variable aleatoria Y = aj Xj
j=1
es normal con media
Y
=
n X j=1
aj
j
y varianza
2 Y
=
n X j=1
a2 j
2 j.
Proposición 1.3 Si X1 ; X2 ; X3 ; : : : ; Xn , es una muestra de
tamaño n, seleccionada de una población normal con media y
varianza 2 , entonces X = n X 2 1 2 Xj se distribuye normal con media X = y
varianza X = n : n
j=1
Ejemplo 1.9 Un estudio pediatrico a…rma que la edad promedio para
la cual bebés niñas empiezan a caminar es de 11; 4 meses. Veinte
bebés niñas, seleccionadas aleatoriamente, se han encontrado que
empiezan a caminar a una edad media de 11; 5 meses, con una desviación
estandar de 2 meses, ¿ coincide con la a…rmación del estudio
pediatrico Supongaque la la
muestra aleatoria proviene de una población normal.
Solución 1.2 Denotemos con X la variable aletoria .ed ad en que una
bebé niña empieza a caminar', entonces por la
proposición inmediatamente anterior X se 2 4 distribuye normal con media
= 11 y una varianza n = 20 = 0; 20: Entonces
11;4 0;1 1 = 0; 69146246 = P Z P X 11; 5 = P X 0;20 0;2 = 0; 5 2 69;15 %. No es
posible estar de acuerdo con la conclusión del estudio ya que es probable que un
signi…cativo número de bebés niñas (un poco
mas del
30 %) empeice a caminar luego de los 11; 5 meses.
1.4.1
DISTRIBUCIÓN CHI-CUADRADO.
Unadistribución chi-cuadrado se utiliza en muchos
problemas de inferencia, por ejemplo en aquellos que tienen que ver con la
varianza. Esta distribución es un caso
especial de la distribución Gamma, con = n y = 2. Si n es un númnero 2 entero positivo, entonces se llama
grados de libertad. Sin embargo, si n no es un entero
positivo pero = 2, todavía nos referiremos a esta distribución como chi - cuadrado. La
media y la varianza de una distribución chi-cuadrado son = n y 2 = 2n,
respectivamente. Una variable aleatoria chi-cuadrado con n grados de libertad
se simboliza mediante 2 (n). Proposición 1.4 La suma de k variables
aleatorias chi-cuadrado, independientes, X1 ; X2 ; X3 ; : : : ; Xk donde Xj se
distribuye 2 (nj ) es una variable aleatoria chi-cuadrado con n = n1 + n2 + : :
: + nk grados de libertad.
1.4. DISTRIBUCIONES MUESTRALES ASOCIADOS CON LA DISTRIBUCIÓN NORMAL11
Proposición 1.5 Sean X1 ; X2 , variables aleatorias independientes X1
chi-cuadrado, con n1 grados de libertad y Y = X1 + X2 chi-cuadrado con n2
gradosde libertad, entonces la variable aleatoria X2 es una distribución
chi-cuadrado con n2 grados de libertad. Proposición 1.6 Si X es una
variable aleatoria Gamma con parametros y , entonces la variable
aleatoria Y = 2X se distribuye chi-cuadrado 2 (2 ) : Proposición 1.7 Si
X es una variable aleatoria normal estandar entonces X 2 es una variable
aleatoria chi-cuadrado con un grado de libertad.