ESTADÍSTICA
1.
INTRODUCCIÓN
El actual desarrollo científico-tecnológico de la sociedad, en casi todos sus
niveles, exige permanentemente el manejo de una gran masa de datos que por
su extensión hace prácticamente imposible el proceso de manipulación de ellos y
por tanto se dificulta enormemente los estudios y conclusiones que deben
obtenerse en cada situación concreta.
El método estadístico es uno de los procesos que utilizamos para tratar de
resolver tales situaciones y así poder efectuar el tipo de generalizaciones que
nos
permitan la comprensión de un fenómeno económico,
social, físico, político, etc.
La industria precisa de la información estadística para poder tomar decisiones
en
materia de inversión, planeación, ventas, producción, etc.
El estado utiliza este instrumento para estimar la recaudación de impuestos,
para
control de precios y de productos, para proyectar la construcción de obras de
infraestructura, para investigaciones en materia económica que le permitan
aplicar nuevas y mejoras políticas ajustadas a sus propósitos y metas. La
medicina, la química, la física, las ciencias sociales, en fin todas las áreas
de la
ciencia, precisan de los conceptos y técnicas estadísticas para su desarrollo.
1.1
POBLACIÓN Y MUESTRA
Población es el conjunto mayor de personas o cosas cuyo estudio nos
interesa o acerca de los cuales se desea información. Los elementos de
este conjunto se denominan datos u observaciones.
La población puede ser infinita, y por tanto, es imposible tener una
información completa sobre ella o si la población es
numerosa y no sea
posible estudiar todos y cada uno de sus elementos, se acude a la
información proporcionada por una parte finita de dicha población
llamada muestra.
En términos matemáticos: Población es el universode la teoría de
conjuntos y muestra es un subconjunto propio finito de
la población.
1.2
ESTADÍSTICA
Disciplina que nos proporciona un conjunto de métodos y procedimientos
que nos permitan recopilar, clasificar, presentar y describir datos en
forma adecuada para tomar decisiones frente a la incertidumbre o
65
Matemática II
TECSUP - PFR
predecir o afirmar algo acerca de la población a partir de los datos
extraídos de la misma.
Esta definición nos permite distinguir la Estadística
Descriptiva de la
Inferencial.
ï‚· Estadística Descriptiva trata de la
recopilación, clasificación,
presentación y descripción de los datos.
ï‚· Estadística Inferencial nos proporciona la
teoría necesaria para
afirmar algo acerca de la población o tomar decisiones generales a
partir de los datos bajo estudio.
1.3
CICLO METODOLÓGICO DE UN TRABAJO ESTADÍSTICO
Cuando no sea posible obtener una información completa de la población
se extraen muestras representativas de dicha población mediante las
técnicas de muestreo, y en base al estudio o información obtenidas de los
datos muestrales se afirma algo acerca de la población total o se toman
decisiones generales confiables con ayuda de la Estadística Inferencial.
Este ciclo se cumple en la mayoría de las veces del quehacer estadístico
-
POBLACIÓN
Estadística
Descriptiva
(Técnicas de muestreo)
MUESTRA
MUESTRA
Estadística
Inferencial
1.4
VARIABLES
La estadística se interesa fundamentalmente en el estudio de ciertas
variables llamadas aleatorias, cuyo comportamiento lo veremos luego. Por
ahora se especificará que existen dos tipos de variables estadísticas, a
saber
Variables discretas: aquellas que solo pueden tomar valores enteros. Por
ejemplo, el número de hijos de una familia, el número de objetos
producidos por una máquina, etc.,pueden ser descritos
mediante una
variable del
tipo discreto:
66
TECSUP - PFR
Matemática II
x = 1, 2, 3, 4, etc.
Variables continuas: aquellas cuyo campo de variación o conjunto de
valores a tomar son números reales pertenecientes a cierto intervalo. Por
ejemplo, pesos de individuos, estaturas, medidas de longitud, diámetros
de piezas producidas por una o varias máquinas pueden ser descritos
mediante variables del
tipo continuo. Así, si 1 ï‚£ x ï‚£ 2; x es una variable
que puede tomar cualquier número real comprendido entre 1 y 2 incluidos
ambos.
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva se ocupa de la recopilación, clasificación,
presentación y
descripción de los datos.
2.1
RECOPILACIÓN
Los datos pueden recopilarse de dos maneras fundamentales
a) Si se consideran todos los elementos de la población y se registran
sus características se denomina censo.
b) Si se seleccionan algunos elementos de la población, pero no todos
se denomina muestra y la información obtenida por este
procedimiento se llama por muestreo; si la recopilación de los
elementos muestrales se efectúa al azar se dice que el muestreo es
aleatorio y la muestra se denomina muestra aleatoria.
Un ejemplo de una recopilación completa o censo es el
Censo Poblacional
del Perú realizado en el año 1993.
2.2
CLASIFICACIÓN
Los datos obtenidos por observación o medición suelen ser registrados en
el orden en que se recopilan. Para facilitar
su interpretación y el análisis
correspondiente deben ser clasificados y esto equivale a que los datos
deben ser organizados de alguna manera sistemática o particionado en
clases bien definidas y una manera sencilla de hacerlo es ordenar los
datos según su magnitud o agruparlos de acuerdo a sus características.
2.3
PRESENTACIÓN DE DATOS
Una vez recolectados los datos y optadopor su posible clasificación es
necesario presentarlos en forma tal que se facilite su
comprensión y su
posterior análisis. Para ello se ordenan en cuadros numéricos llamados
TABLAS (Tablas de frecuencias) y luego se
presentan mediante GRÁFICAS
67
Matemática II
TECSUP - PFR
(de barras, sectores circulares, histograma, polígono de frecuencias, ojiva,
pictograma, etc.).
Haremos algunas definiciones en base a un ejemplo:
Clasificar los
siguientes datos recopilados del
número de cabezas de ganado vacuno
que posee cada una de las 40 familias de las comunidades campesinas de
la Sierra Central del Perú, tomados al azar.
1
4
0
5
2
3
0
4
0
3
4
6
3
5
9
8
5
12
0
11
1
10
1
0
0
4
3
1
8
3
13
3
1
0
1
8
2
10
3
0
ï‚· Alcance (A): es el intervalo definido por los datos de mayor y menor
valor.
En el ejemplo:
A  ï›0; 13 ï
ï‚· Intervalos de clase ( Ii ) y Límites de clase ( Li ): clasificar los
datos en k grupos equivale a particionar el alcance A en k clases o k
intervalos Ii ,donde: i=1, 2, ,k
y determinar cuántos datos
pertenecen a cada uno.
I i  ï› Li , Li 1 , i=1, 2, ,k
Los intervalos semi-abiertos por la derecha Ii se denominan intervalos de
clase.
Los Li , i=1, 2, ,k+1 se denominan los límites de
clase.
El valor entero de k, fundamentalmente, depende del estadístico y/o
investigador, pero es recomendable utilizar la regla de Sturges para
determinar un valor aproximado de k
k  1  3,3logn
Donde “n” es el número total de datos disponibles.
La fórmula es un poco conservadora y nos da un número
de intervalos
un poco menor del
que se utiliza en la práctica. Cuando el número de
datos es menor que 100, el número de intervalos se debe tomar menor
que 10. Para un número de datos
bastante grande, el número de
intervalos es mayor que 10,la práctica aconseja los
siguientes límites: 5
ï‚£ k ï‚£ 15 .
En el ejemplo
k = 1 + 3,3 log(40) = 6,286
68
TECSUP - PFR
Matemática II
Luego k podrá tomar valores enteros: 5, 6 o 7
Tomemos:
k=7.
ï‚· Ancho de Clase ( Wi ): es la longitud de un
intervalo de clase.
Wi  l ( I i )  Li 1 ï€ Li
Para conseguir anchos de clase iguales (W ), como es deseable; se usa
la siguiente relación:
W 
l ( A)
, donde l ( A) es la longitud del alcance.
k
En el ejemplo:
W 
13
1
,857
7
 tomamos W = 2
ï‚· Frecuencia Absoluta (ni ): una vez decidido el valor de k y calculado
el ancho de clase. Mediante la tabulación se determina el número de
datos contenidos en cada clase y este número entero se denomina
frecuencia absoluta( ni )
ni : frecuencia absoluta de i – ésima clase .
ï‚· Distribución de Frecuencias Absolutas:
Cabezas de ganado
Tabulación
Ns de familias por
clases
Frecuencias Absolutas: ni
Intervalos de clase o
clases: Ii
[0; 2>
14
[2; 4>
9
[4; 6>
7
[6; 8>
1
[8; 10>
4
[10; 12>
3
[12; 14>
2
TOTAL
40
Tabla 1
En el ejemplo: n = 40
,k=7
69
Matemática II
TECSUP - PFR
Se verifica que:
ï‚£n ï‚£
i
1
14
k
 ni  n1  n2  n3  n4  n5  n6  n7  14  9  7 
1  4  3  2  40  n
i 1
n3= 3, se lee: “la frecuencia absoluta de la tercera clase es”
Los intervalos de clase son:
I1  0;2 , I2   2; 4 , I3  ï› 4; 6  , I4  ï› 6;8  , I5
 ï›8;10  , I6  ï›10;12  , I7  ï›12;14 


Los límites de clase son:
L1  0, L 2  2, L3  4, L 4  6, L5  8, L 6  10, L7  12, L8
 14
Cabezas
de ganado
Ns de
familias
Marcas
de clase
Frecuencias
relativas
Frecuencias
relativas
acumuladas
Frecuencias
absolutas
acumuladas
Frecuencias
relativas
porcentuales
Frecuencias
relativas
acumuladasporcentuales
Clases
[0; 2>
ni
14
xi
1
hi
0,350
Hi
0,35
Ni
14
100hi%
35
100Hi%
35
[2; 4>
9
3
0,225
0,575
23
22,5
57,5
[4; 6>
7
5
0,175
0,750
30
17,5
75
[6; 8>
1
7
0,025
0,775
31
2,5
77,5
[8; 10>
4
9
0,100
0,875
35
10
87,5
[10; 12>
3
11
0,075
0,950
38
7,5
95
[12; 14>
2
13
0,050
1
40
5
100
TOTALES
40
1
100
Tabla 2
Sigamos con las definiciones, observando la Tabla 2:
ï‚· Marcas de Clase ( xi ): son los puntos medios de los intervalos de
clase.
xi 
Li  Li 1
2
i = 1, 2, .., k
;
L  L2 0  2
x1  1

1
2
2
70
TECSUP - PFR
Matemática II
L  L3 2  4
x2  2

3
2
2
;
x3 = 5 , se lee: “la marca de clase del tercer intervalo de clase es 5 ”
 Frecuencias Relativas ( hi ): se define: hi 
ni
n
; i = 1, 2, .., k
n
14
h1  1 
 0,350
n
40
n
9
h2  2 
 0, 225
n
40
; ..
Se verifica que:
0 ï‚£ hi ï‚£ 1
k
 hi  h1  h2  h3  h4  h5  h6  h7  0,350  0,225 
0,175  0,025  0,100  0,075  0, 050  1
i 1
h3= 0,175, se lee: “la frecuencia relativa de la tercera clase es 0,175”
ï‚· Frecuencia Relativa Porcentual (100 hi%)
Nos permite contestar preguntas del siguiente tipo: sQué
porcentaje
de familias, de las 40 bajo estudio, tienen 4 ó 5 cabezas de ganado?
Respuesta: 17 %
ï‚· Frecuencia Absoluta Acumulada ( Ni ):
Se define:
Ni = n1 + n2 + . + ni
;
En el ejemplo:
N1  n1  14
N2  n1  n2  14  9  23
N3  30,. N7  40
Se verifica:
0 ï‚£ Ni ï‚£ 40
Nk  N7  40
71
i = 1, 2, .., k
Matemática II
TECSUP - PFR
N 4  31, se lee: “la frecuencia absoluta acumulada hasta la cuarta
clase es 31”
ï‚· Frecuencia Relativa Acumulada( Hi ):
Se define:
H i  h1  h2   hi
ó
Hi 
Ni
; i  1, 2, , k
n
H1  h1  0,350
H2  h1  h2  0,575
H3  0,750,.. H7  1
Se verifica
0 ï‚£ Hi ï‚£ 1
Hk  H7  1
H 2  0,575, se lee: “la frecuencia relativa acumulada hasta la
2da.clase es 0,575”
ï‚· Frecuencia Relativa Acumulada Porcentual (100 Hi%):
Nos permite contestar preguntas del siguiente tipo: sQué porcentaje
de familias, de las 40 bajo estudio tienen menos de 8 cabezas de
ganado?
Respuesta: 77 %
Gráficas
Las distribuciones de frecuencias pueden ser representadas gráficamente
mediante:
a) Histogramas
Son gráficas de barras o rectángulos cuyas bases representan los
intervalos de clase y las alturas las frecuencias absolutas o relativas.
Ii
vs. ni
ó
72
Ii
vs. hi
(Fig. Ns 2)
TECSUP - PFR
Matemática II
b) Polígonos de frecuencias
x
,n ó
x
,h
i
i
i
i
Son polígonos construidos uniendo los puntos
mediante segmentos de recta, o uniendo los puntos medios de los
“techos” de los rectángulos del
histograma. (Figura 3.)
ni
ni
Histograma
15
Polígono de Frecuencias
15
Fig. N°2
Fig. N°3
10
10
5
5
0
2
4
6
8
10
12
14
Ii
0
2
4
6
8
10
12
14
Ii
c) Diagramas escalonados o funciones escalonadas
Son gráficas de barras o rectángulos cuyas bases representan los
intervalos de clase y las alturas las frecuencias absolutas o relativas
acumuladas.
Ii
vs. N i
ó
Ii
vs. H i
(Fig. Ns 4)
d) Ojivas
Son poligonales asociadas a distribuciones de frecuencias absolutas o
relativas acumuladas construidas como aparece en la Figura Ns5
73
Matemática II
TECSUP - PFR
Ni
Función Escalonada
Ni
Ojiva
40
40
30
30
20
20
10
10
0
2
4
6
8
10
1214
Ii
0
2
4
6
Fig. N°4
8
10
12
14
Fig. N°5
PROBLEMAS PROPUESTOS
1. Los accidentes en una planta de papas fritas se
clasifican de acuerdo con la parte
del cuerpo
lesionada.
Dedos: 17
Brazos: 2
Ojos: 5
Piernas: 1
Trace un diagrama de barras
2. Los siguientes datos son velocidades (en Km/h) de 30 carros que pasaron por un
punto de control de velocidad. Clasificar estos datos
convenientemente. Hallar las
tablas de frecuencias, graficar el histograma y la ojiva correspondiente a las
frecuencias absolutas.
Los siguientes datos constituyen las vidas útiles en horas de una
muestra aleatoria
de 60 bombillas de luz de 100 watts:
74
Ii
TECSUP - PFR
807
660
881
766
1056
832
Matemática II
811
753
872
787
1076
863
620
1050
869
923
958
852
650
918
841
792
970
788
815
850
863
799
765
968
725
876
842
937
896
817
743
1027
851
816
740
678
703
889
837
758
891
865
844
878
822
817
1075
759
907
890
811
753
1074
923
a) Constrúyase una distribución de frecuencias con anchos de clases iguales
b)
Trácese el polígono de frecuencias sobre un Histograma de intervalos de
clases vs. frecuencias relativas.
c)
Trácese la ojiva asociada a la función escalonada representando intervalos de
clases vs. frecuencias absolutas acumuladas.
4. La siguiente tabla muestra la distribución de los empleados de una compañía
aseguradora por sueldos mensuales en nuevos soles (año 2001
Clases
menos de 450
450 a menos de 900
900 a menos de 1350
1350 a menos de 1800
1800 a menos de 2500
2500 a menos de 4250
4250 a más
TOTAL
Frecuencias
32
47
75
89
126
38
10
417a) sQué porcentaje de empleados ganan sueldos mensuales inferiores a 900
nuevos soles?. sQué porcentaje ganan 2500 nuevos soles o más?
b) sQué porcentaje de empleados ganan entre 1350 y 4250 nuevos soles?
c) Determinar los anchos y las marcas de clase.
Nota Se averiguó que el máximo haber percibido en la
compañía es de 5500
nuevos soles. Si no se tiene ninguna información se asume un
máximo valor
de acuerdo al problema en cuestión; así como se
supondrá cero, como
el
haber mínimo.
5. Para un estudio sobre resistencia
de un metal, se han realizado cien experiencias
de rotura frente a la carga de un hilo del mismo grosor, y han
sido anotados los
pesos límites en cada caso.
75
Matemática II
TECSUP - PFR
Cargas de rotura de un hilo en gramos
711
915
853
789
941
862
873
700
790
909
851
926
885
753
784
912
864
857
910
882
922
800
844
847
859
791
931
907
784
903
825
722
917
936
925
935
774
786
706
704
895
903
820
758
792
758
925
930
887
888
890
763
892
914
889
925
805
893
794
791
895
796
915
931
782
768
759
890
701
713
869
916
888
772
724
892
853
865
935
868
895
789
909
887
842
912
943
931
880
892
850
712
710
933
905
920
764
798
905
792
a) Reagrupar estos datos en 7 intervalos de clase de igual longitud.
b) Trácese el histograma y el polígono de frecuencias.
c) Trácese la ojiva correspondiente, y conteste
sQué porcentaje presentan una carga no menor de 770 gramos?
sQué porcentaje presentan una carga entre 800 y 900 gramos?
6. Las distribuciones cualitativas o por categorías se suelen presentar en
diagramas
de sectores en la que un círculo aparece dividido en sectores proporcionales en
su
abertura a las frecuencias de las categorías que representan:
a) Construir undiagrama de sectores para trasmitir la información de que (según
las cifras más recientes disponibles) en el Perú el número total de botellas de
vino consumidas provienen el 69% de ICA, el 18% de otras partes del país, el
5% se importan de Francia y el resto de otros países.
b) Dibujar un diagrama de sectores para mostrar que en un hospital de una gran
ciudad la distribución de su presupuesto es como sigue: 73% de sueldos,
honorarios profesionales médicos y bonificaciones a los empleados; 13% en
suministros y equipo médico y quirúrgico; 8% en mantenimiento, alimentación
y energía y el 6% en gastos administrativos.
7. En 1972, la población activa de Francia estaba compuesta de:
11,1% de agricultores,
10,6% de patronos,
16,5% de ejecutivos,
16,7% de empleados,
38,6% de obreros,
6,5% de personal de servicios y otras categorías.
Representar esta distribución mediante el gráfico que parezca
más adecuado.
76
TECSUP - PFR
Matemática II
8. Las pérdidas en una fábrica de papel (en miles de dólares) debidas a
rasgaduras
pueden dividirse según el producto
Papel higiénico: 132
Servilletas: 43
Toallas desechables: 85
Otros: 12 productos
a) Trace un diagrama en barras.
b) sQué porcentaje de las pérdidas ocurre en la elaboración de papel higiénico
c) sQué porcentaje de las pérdidas ocurre en la elaboración de papel higiénico
o
toallas desechables?
9. Los pesos de ciertos especimenes minerales, dados en la décima más cercana
de
una onza, se agrupan en una tabla con los intervalos: 10,5 – 11,4; 11,5 – 12,4;
12,5 – 13,4; y 13,5 – 14,4 onzas.
a) Determine las marcas de clase.
b) sEs posible determinar a partir de los datos agrupados cuántos especimenes
minerales pesan
ï‚·
ï‚·
ï‚·
ï‚·
ï‚·
Menos de 11, 5 onzas.
Más de 11 onzas.
Al menos 12 onzas.
Cuando mucho 12 onzas.
sDe 11 a 13,5 onzas?10. La siguiente tabla muestra
el número de jóvenes que obtuvieron los puntajes
señalados en una prueba de ingreso.
Puntaje
Número de Jóvenes
10
ï› 10 ï€ 15
ï› 15 ï€ 20
ï› 20 ï€ 25
ï› 25 ï€ 30
ï› 30 ï€ 35
15
28
20
17
Siendo A el porcentaje de jóvenes con puntaje mayor a 20, B el porcentaje de
jóvenes con puntaje menor a 15. Señale el valor de A-B
11. Dado el tablero incompleto de la distribución de frecuencias de las
notas de 50
alumnos. Completar el tablero, con un ancho de clase
constante e igual a 2.
Señale: sCuántos alumnos sacaron un puntaje menor de
10? y sQué porcentaje de
alumnos obtuvieron 12 ó más de 12 pero menos de 16?
77
Matemática II
TECSUP - PFR
ï›
ï›
ï›
ï›
ï›
ï›
Ii
xi
ni
Ni
hi %
9
,
22%
,
11
,
12
,
7
,
6%
,
12. Dada la siguiente tabla incompleta, de las frecuencias de las edades de 80
empleados:
Ii
xi
ï› 26 ,
ï›
ï›
ï›
ï›
ni
Ni
hi %
8,75%
20
,
20
,
,
44
,
18,75%
Siendo el ancho de clase constante, encontrar:
a) sCuántos empleados tienen más de 30 años?
b) sQué porcentaje del
total de empleados poseen menos de 42 años?
13. En cierta fábrica se hizo un estudio sobre la edad
de los trabajadores con el fin de
establecer un plan de seguro grupal. Los resultados fueron los siguientes
25
54
43
32
23
22
47
60
63
52
37
42
39
29
21
39
20
35
49
58
45
43
47
48
38
41
57
42
28
21
33
41
36
57
67
26
38
49
43
41
59
26
19
27
23
58
38
49
40
36
30
50
32
23
28
49
51
28
55
60
39
27
33
37
40
52
36
48
41
37
a) Construya una distribución de frecuencias apropiada para estos datos.
b) Conteste lassiguientes preguntas, a partir de la tabla obtenida en a):
 sCuál el ancho de clase común?
78
TECSUP - PFR
Matemática II
sCuál es el límite inferior de la tercera clase? L3 =
sCuál es la frecuencia absoluta de la cuarta clase? n4 =
sCuál es la frecuencia relativa de la segunda clase? h2 =
sCuántos trabajadores tienen menos de 50 años? sY qué
porcentaje
representan?
 sCuántos trabajadores tienen 50 años o más? sY qué porcentaje
representan?
 sQué porcentaje de trabajadores tienen entre 30 a 45
años?
Trácese el polígono de frecuencias y la ojiva
correspondiente.
Los siguientes datos son las velocidades (en km/h) de 80 carros que
pasaron por
un punto de control de velocidad:
60
30
31
60
45
20
34
29
35
20
40
54
38
35
27
45
40
55
45
60
49
49
85
83
30
40
46
105
29
38
102
60
80
35
28
60
82
72
63
36
70
60
31
65
34
73
68
81
65
80
25
70
108
26
24
27
40
75
43
85
120
45
39
83
65
72
46
62
43
63
60
70
100
55
50
63
64
65
61
69
Clasifique estos datos convenientemente y:
a) Muestre el histograma y el polígono de frecuencias correspondiente.
b) Diseñe la función escalonada y la ojiva respectiva.
c) Los carros con velocidades mayores a 80 km/h, son
multados por exceso de
velocidad. sQué porcentaje serán multados?
d) Los carros con velocidades entre 45 y 70 km/h, van a ser considerados en
premios organizados por una compañía. sQué porcentaje serán
premiados?
15. El gráfico muestra el impuesto mensual (en soles) que debe pagar una
persona
según su sueldo mensual (en soles):
IMPUESTO
900
360
120
1000
2200
3400
79
4000
SUELDO
Matemática IITECSUP - PFR
sCuánto de impuesto mensual paga una persona que gana s/.1500?. sCuánto gana
una persona que paga mensualmente s/.300 de impuesto?
16. La siguiente tabla de frecuencias muestra los haberes mensuales de 200
obreros
de cierta fábrica, en nuevos soles (año2000).
Haberes mensuales
Número de obreros
Menores a 500
4
ï› 500 , 700
ï› 700 , 900
ï› 900 , 1100
ï› 1100 ,1300
ï› 1300 ,1500
ï› 1500 ,1700
60
40
48
24
14
8
más de 1700
2
TOTAL
200
Con referencia a esta tabla, contestar:
a) sQué porcentaje de obreros tienen haberes inferiores a s/.1000 mensuales?
b) sQué porcentaje de obreros tienen haberes superiores a
s/.1100 mensuales?
c) sQué porcentaje de obreros tienen haberes entre 1000 a 1500 soles
mensuales?
d) Graficar el histograma, el polígono de frecuencias y la ojiva
correspondientes.
2.4
DESCRIPCIÓN DE DATOS
En esta etapa nos ocuparemos del cálculo y estudio de los
estadígrafos.
Estadígrafos Son números que describen alguna
característica de la
muestra y se obtienen a partir de los datos muestrales o experimentales.
Existen básicamente dos tipos de estadígrafos
a) Estadígrafos de Posición: Localizan el “centro” de la distribución
de frecuencias. Se denominan también medidas de tendencia
central
o de localización. Ejemplos: media, mediana, moda, cuarteles, etc.
80
TECSUP - PFR
Matemática II
b) Estadígrafos de Dispersión: Nos indican como están dispersos
los
datos con respecto a algún estadígrafo de posición. Miden el grado de
variabilidad de los datos alrededor de alguna medida de tendencia
central, por esta razón, se les denomina también estadígrafos de
variabilidad. Ejemplos: rango, la desviación media, varianza,
desviación típica, etc.
2.4.1
MEDIA ( x )
Llamada también media aritmética o promedio aritmético es un
estadígrafo que localizael “centro” de la distribución en base a
su “centro de gravedad” y se obtiene a partir de las siguientes
fórmulas.
ï‚· Para datos no clasificados:
Sean x1 , x2 ,, xn las variables matemáticas que representan
n
los datos muestrales, entonces:
x
x
i 1
i
n
ï‚· Para datos clasificados:
k
x
xn
i i
i 1
k
x   xi hi
o
n
i 1
Donde:
k : número de clases
x1 , x2 ,, xk : marcas de clase
n: número total de datos n1 , n2 ,, nk : frecuencias absolutas
h1 , h2 ,, hk : frecuencias relativas.
ï‚· Media Ponderada:
k
x
x P
i 1
k
i i
P
i 1
i
Siendo
P , P2 ,, Pk pesos asociados
1
x1 , x2 ,, xk respectivamente.
81
a
las
variables
Matemática II
TECSUP - PFR
ï‚· Media global:
Si una muestra de tamaño n se particiona en k submuestras
y
x1 , x 2 ,, x k son las medias de las k submuestras de
tamaños n1 , n 2 ,, n k respectivamente.
k
Entonces: x 

i 1
ni xi
n
se denomina la media global de la
muestra particionada.
Ejemplos:
ï‚· Media de datos no clasificados:
x1  9 ,
x2  5 ,
x3  3 ,
x4  10 ,
x5  8
5
 xi
x  x2  x3  x 4  x5 9  5  3  10  8
x  i 1  1

7
5
5
5
ï‚· Media de datos clasificados:
Halle la velocidad media de los 30 carros que pasaron por un
punto de control de velocidad, del problema 2.
Use las fórmulas que incluyen frecuencias absolutas y
relativas.
Intervalos de clase
ni
xi
xi ni
hi
xi hi
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total
4
12
7
4
2
1
30
18
34
50
66
82
98
72
408
350
264
164
98
1356
0,133
0,400
0,233
0,133
0,067
0,033
1
2,394
13,600
11,650
8,778
5,494
3,234
45,15
Tabla 3
82
TECSUP - PFR
Matemática II
 xini
1356
i 1x

 45, 2
n
30
o
x   xihi  45,15
i 1
ï‚· Media ponderada:
Notas
xi
Pi
xi Pi
05
13
1
3
5
39
4
Ex. Parcial
Ex. Final
Pesos
44
Tabla 4
k
 xiPi
44
x  i 1

 11
k
4
 Pi
i 1
ï‚· Media Global:
Si una muestra de tamaño 60 se particiona en 5 submuestras de tamaños 8, 18,
12, 9, 13 con medias
15,14,12,8,11 respectivamente. Entonces, la media global
será
 xini
8 * 15  18 * 14  12 * 12  9 * 8  13 * 11 731
i 1
x


 12,18
n
60
60
2.4.1.
MEDIANA
(Xm)
La mediana es un valor que divide a un conjunto de
observaciones ordenadas en forma ascendente o descendente
en dos grupos de igual número de observaciones.
ï‚· Para datos no clasificados
Sean
x1 , x 2 ,, x n los datos
x1 ï‚£ x 2 ï‚£ ï‚£ x n . Entonces
83
muestrales
tales
que
Matemática II
TECSUP - PFR



Xm  ïƒ



x n 1
; si n es impar
2
1
( xn  xn  2 )
2 2
2
; si n es par
En palabras: una vez ordenados los datos en orden creciente
(o decreciente) de sus magnitudes:
Si n es impar, la mediana es el valor del dato que equidista
de los extremos.
Si n es par, la mediana es el promedio aritmético de dos
datos consecutivos equidistantes de los extremos.
Ejemplos:
Hallar la mediana de los siguientes conjuntos de datos:
Previamente ordenamos los datos:
x1  3
x2  6
x3  9
x 4  10
x5  14
como n es impar ( n = 5 )
X m  x 5  1  x3  9
2
Previamente ordenados los datos:
x1  5
x2  10
x3  17
x 4  21 x5  29
como n es par ( n = 6 ) Xm  19
ï‚· Para datos clasificados:
Está dada por la fórmula:
n

 ï€ N m ï€1 

X m  Lm  Wm  2
 nm





84
x6  43
TECSUP - PFR
Matemática II
donde:
Lm
: Límiteinferior de la clase mediana (*)
n
: Número total de datos
N m ï€1 : Frecuencia
absoluta
acumulada
hasta
la
clase
inmediata
m ï€1
anterior a la clase mediana
N m ï€1   n i
i 1
nm
: Frecuencia absoluta de la clase mediana.
Wm
: Ancho de clase de la clase mediana
Wm  Lm 1 ï€ Lm
Clase Mediana
Es el intervalo de clase que contiene el dato que ocupa la
posición media o central. Se identifica observando las
frecuencias acumuladas absolutas o relativas y es aquella que
n
hasta ese nivel acumuló la mitad del
número total de datos
ó 0,5) o superó por primera vez a la mitad.
Clase mediana=
[ Lm , Lm 1 ;
X m  [ Lm , Lm 1 
Ejemplo:
Velocidades en Km/h
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total
ni
4
12
7
4
2
1
30
Ni
4
16
23
27
29
30
Hi
0,133
0,533
0,766
0,899
0,966
1
Tabla 5
n 30

 15
2
2
La frecuencia absoluta acumulada correspondiente a la segunda
clase (N2 = 16), supera por primera vez a 15; o la frecuencia
relativa acumulada a la segunda clase (H2 = 0,533), supera por
primera vez a 0,5.
85
Matemática II
TECSUP - PFR
Luego la clase mediana es [26 >.
Lm  26
n = 12
Wm  16
nm  12
N m ï€1  4
 30

ïƒS 2 ï€ 4ïƒs
Xm  26  16 ïƒS
ïƒs  40,67
ïƒS 12 ïƒs
ïƒS
ïƒs


Ni
30
25
20
15
10
5
10
26
42
58
74
90
106
Ii
MEDIANA COMO UNA MEDIDA DE TENDENCIA CENTRAL
MÁS REPRESENTATIVA
La media es un estadígrafo bastante sensible a los valores
extremos y como medida del “centro de gravedad” de la
distribución tiende a inclinarse a los datos de mayor valor. Si
existen valores extremos que difieren considerablemente del
resto no localiza como
se debe el “centro” de la distribución. En
tanto que la mediana por no ser sensible a los valores extremos
ylocalizar el “centro” de la distribución en base a la posición
central que ocupa resulta siendo mejor que la media o más
representativa en el sentido que localiza mejor el “centro” de la
distribución; pero, en general, la media es más representativa
que la mediana, como estadígrafo de localización:
Ejemplo:
Un empleador dice que el promedio mensual de salario pagado
a los ingenieros de su firma es de 3 500, esto sugiere que esta
86
TECSUP - PFR
Matemática II
firma paga bien. Sin embargo, un examen posterior
indica que
se trata de una pequeña compañía que emplea 5 jóvenes
ingenieros con 1 000 soles de haber mensuales c/u y la renta
del ingeniero
Jefe es de 16 000 soles mensuales.
sUd. puede seguir afirmando
que la firma paga bien?. No.
Halle la
mediana y compare, scuál de los estadígrafos es más
representativo?
X  3500;
x1  1000,
x2  1000,
x3  1000,
x 4  1000,
x5  1000,
x6  16 000
X m = 1000
En este caso, la mediana es la más representativa en el sentido
que localiza mejor que la media el “centro” de los datos bajo
consideración.
Existe un valor extremo bastante discrepante o exagerado
( x6  16 000).
USOS DE LA MEDIA ARITMÉTICA
ï‚· La media de la muestra se usa cuando se necesita
una
medida de tendencia central que no varíe mucho entre una y
otra muestra extraída de la misma población, esta es la
razón para preferirla cuando se desea la máxima
confiabilidad en la estimación de la media poblacional.
ï‚· También se usa la media cuando la
distribución de
frecuencias de los datos es simétrica o tiene poca asimetría.
ï‚· Se calcula la media cuando en un estudio también
se debe
calcular la varianza o la desviación estándar.
USOS DE LA MEDIANA
ï‚· Se prefiere a la mediana como medida de concentración,
cuando en los datos existen valores extremos muy grandes o
muy pequeños, osea, valores muy altos o muy bajos que
obligan a la media aritmética a desplazarse a la derecha o
izquierda del punto medio de la distribución. En cambio la
Mediana siempre señala al punto que divide a los datos en
dos partes iguales: 50% a un lado y 50% al otro, sin
importar donde se halle
ese punto.
ï‚· Cuando simplemente necesitamos conocer si los datos que
nos interesan están dentro de la mitad superior o inferior de
87
Matemática II
TECSUP - PFR
la distribución de los datos y no tiene importancia saber
particularmente su alejamiento con respecto al centro de la
distribución.
2.4.2
MODA (
Mo )
La moda es un valor de la variable que tiene la más alta
frecuencia, esto es, es el valor más frecuente de la distribución.
Si la distribución de frecuencias tiene un solo máximo
(máximo
absoluto), se dice que la distribución es unimodal; en cambio si
tiene más de un máximo (máximos relativos), se dice que la
distribución es multimodal.
Si todas las frecuencias son iguales se dice que la distribución
no tiene moda y se trata de una distribución uniforme.
a) Para datos no clasificados
ï‚· Determinar la moda del
siguiente conjunto de datos
2, 2, 3, 4, 5, 5, 6, 7, 7, 7, 9, 9, 12.
La moda es el número 7 porque es el dato más repetido
(3 veces).
Esta distribución se llama unimodal porque sólo posee
una moda.
ï‚· El siguiente conjunto de datos no tiene moda.
Porque ninguno de ellos está repetido
ï‚· 3.-La siguiente distribución es bimodal es decir, tiene dos
modas
8, 9, 9, 13, 13, 13, 18, 20, 24,24,24, 33, 59, 78, 78.
Mo = 13 y también Mo = 24
ï‚· La siguiente distribución es trimodal
4, 8, 8, 8, 8, 15, 15, 15, 20, 20, 21, 21, 21, 21,32, 40,
40,40, 40, 80, 80, 90.
Mo = 8, Mo = 21, Mo = 40 Tiene tres modas.
88
TECSUP - PFR
Matemática II
b) Para datosclasificados
 ï„1
M o  Li  W i 
ïƒ§ï„ ï€«ï„
2
 1




I i  [ Li , Li 1  : clase modal, es aquella
que tiene la
frecuencia máxima
Li : límite inferior de la clase modal.
Wi : ancho de la clase modal
ï„ 1  ni ï€ ni ï€1 : exceso de la frecuencia modal sobre la
frecuencia de la clase contigua inferior.
ï„ 2  ni ï€ ni  exceso de la frecuencia
modal sobre la
frecuencia de la clase contigua superior.
Ejemplo
Determinar la moda de la siguiente distribución de
frecuencias:
Ii
ni
[12,5
[20,5
20,5
28,5
1
8
[28,5
[36,5
[44,5
[52,5
36,5
44,5
52,5
60,5
22
26
20
12
[60,5 68,5
[68,5 76,5
TOTALES
6
5
Tabla 6
La clase modal será: I = [36,5; 44,5 
Además es una distribución unimodal.
ï„1 =
26 -22 = 4
ï„2 =
26 -20 = 6
89
Matemática II
TECSUP - PFR
 ï„1 
 4 
Mo  36,5  W 
  36,5  8 
  39,7
4 6
 ï„1  ï„2 
ni
25
20
15
10
5
12,5 20,5 28,5 36,5 44,5 52,5 60,5 68,5 76,5
39,7
2.4.2
CUARTILES (QI)
Son medidas de posición que dividen en cuatro partes iguales al
conjunto de valores ordenados en una distribución de
frecuencias. Estas medidas son: el primer Cuartil Q1, el segundo
Cuartil Q2 y el tercer Cuartil Q3
25%
Q1
25%
Q2
Q3
75%
Las fórmulas para calcular los cuartiles se derivan de la fórmula
utilizada para calcular la mediana y los pasos para el cálculo
son los mismos:
Para el primer cuartil:
Para el tercer cuartil:
n

 ï€ N i ï€1 

Q1  Li  Wi  4
 ni





 3n

ï€ N i ï€1 


Q3  Li  Wi  4
ni






90
Ii
TECSUP - PFR
Matemática II
Ejemplo
A partir de la siguiente tabla determinar el 25% inferior y el
25% superior.
Altura en
pulgadas
[60, 63
ni
Ni
Hi
5
5
0,05
[63, 66
18
23
0,23[66, 69
42
65
0,65
[69, 72
27
92
0,92
[72, 75
8
100
1
TOTALES
Tabla 7
Para determinar el 25% inferior debemos
calcular el primer
cuartil.
Para determinar el 25% superior debemos calcular el tercer
cuartil
Cálculo de Q1 :
n 100

 25
4
4
.Luego tomamos la clase: I = [66; 69 
Luego:
 100

 4 ï€ 23 
Q1  66  3 
  66,14
42






Cálculo de Q3 :
3n 3x100

 75
4
4
.Luego tomamos la clase: I = [69; 72  
Luego:
 3x100

 4 ï€ 65 
Q3  69  3 
  70,11
27






91
Matemática II
TECSUP - PFR
2.4.3.
DECILES ( DI )
Son medidas de posición que dividen en 10 puntos iguales al
conjunto de los valores ordenados de una distribución de
frecuencias. Estas medidas son: el primer decil D1, el segundo
decil D2 y así sucesivamente hasta el noveno decil D9.
El primer decil distribuye al lado izquierdo el 10% de los datos y
al otro lado el 90%, es decir, ocupa la posición n/10.
En igual forma para los demás deciles hasta el noveno decil
9n/10 que deja a la izquierda el 90% de los datos y a la
derecha el 10%.
30%
D1
D2
D3
D4
10%
D5
D6
D7
D8
D9
90%
ï‚· Entre cada dos deciles consecutivos debe encontrarse
comprendido el 10% del
número de datos.
La fórmula para calcular deciles es
 rn

 ï€ N i ï€1 

Dr  Li  Wi  10

ni





Donde:
Dr = el decil buscado.
Li = límite inferior del intervalo donde se halla el
decil buscado
r = indica el decil. Por ejemplo si queremos el tercer decil  r
= 3.
rn
 indica la situación del
decil, es decir, la clase donde está el
10
decil
Los demás signos: n , Ni-1 , Wi , ni tienen los mismos
significados que para el caso de la mediana.
Ejemplo
Se presenta la distribución de frecuencias de los puntajesobtenidos por 250
alumnos en una prueba de rendimiento de
92
TECSUP - PFR
Matemática II
Física. Determinar qué puntajes deben tener los que se hallen
en el 20% inferior y cuáles puntajes los que se encuentren en
el décimo superior.
Intervalos
ni
4
14
18
32
25
57
46
103
53
156
37
193
29
222
18
240
10
Totales
4
10
ï›40; 45
ï›45; 50
ï›50; 55
ï›55; 60
ï›60; 65
ï›65; 70
ï›70; 75
ï›75; 80
ï›80; 85
ï›85; 90
Ni
250
250
Tabla 8
Primero debemos determinar el segundo decil a fin de
determinar el 20% inferior.
Cálculo de D2:
2n 2x250

 Luego el segundo decil está en la clase: I
10
10
= [55, 60 
 50 ï€ 32 
  58, 6
 25 
Por fórmula: D  55  5 
Para hallar los que se encuentran en el décimo
superior
calculamos el noveno decil.
Cálculo de D9:
9n 9x250

 225 ; Luego el noveno decil está en la clase: I
10
10
= ï›80; 85 
 225 ï€ 222 
  80,83
18


Por fórmula: D  80  5 
93
Matemática II
TECSUP - PFR
CARACTERÍSTICAS DE DISPERSIÓN
Las dos siguientes series de datos:
95
50
97
75
100
100
103
125
105
150
Tienen la misma media aritmética y la misma mediana (100).
Sin embargo difieren profundamente. Lo que las hace
diferentes es lo que, en estadística, se llama dispersión; la
segunda serie es mucho más dispersa que la primera.
Es pues importante resumir una serie estadística no sólo por
características de tendencia central, sino por características de
dispersión. Veremos de dos tipos: las ligadas a la media
desviación típica; las ligadas a la mediana: intervalo
intercuartílico, intervalo interdecílico.
2.4.3
MEDIDAS DE DISPERSIÓN
2
ï‚· Varianza ( S x ó V( x ) )
Se define:
V( x )
 n
2
  ( xi ï€ x)
 i 1

2
n
 Sx  ïƒ k
  ( xi ï€ x) 2 ni
 i 1
n

, datos no clasifcados
, datos clasificados
Se interpreta como la media aritmética de los cuadrados de
las desviaciones de las xi con respecto a x .
A menudo el cálculo de la varianza es muy laborioso, sobre
todo si la media no es entera, para facilitar los cálculos
podemos usar una segunda forma:
k
V( x ) 
n x
2
i i
i 1
n
2
ï€ x ; datos clasificados
ï‚· Desviación Típica
S x 
S x  V( x )
Una idea sencilla del significado de la desviación típica se
obtiene cuando se comparan dos series de la misma
94
TECSUP - PFR
Matemática II
naturaleza: la que posee una desviación típica más alta es la
más dispersa.
ï‚· Coeficiente de variación (C.V.
C.V . ½
Sx
x
Generalmente se expresa en porcentajes. Es útil para la
comparación en términos relativos del grado de
concentración en torno a la media de dos distribuciones
distintas.
ï‚· Rango o extensión (e
Indica la extensión del
intervalo en donde se halla toda la
población estudiada.
e = Lk – L1 =l(A)
Por ejemplo de la Tabla Ns8, tenemos e = 90 - 40 = 50
ï‚· Rango interdecílico = D9 – D1
ï‚· Rango intercuartílico = Q3 – Q1
Por ejemplo, a partir de la tabla Ns8, tenemos:
Rango intercuartil = 74,26 – 60.97 = 13,99
Rango interdecílico = 80,83 – 53,06 = 27,77
ASIMETRÍA
Es la deformación horizontal de las curvas de frecuencias.
Cuando la curva está inclinada o alargada hacia la derecha se
denomina asimetría a la derecha o asimetría positiva (Fig.1).
Observamos que la media aritmética queda hacia el lado más
largo (el derecho) y que x  X m  M o .
Cuando la curva está inclinada o alargada al lado izquierdo
se
denomina asimetría a la izquierda o negativa (Fig.2). Notamos
que la media aritmética está del
lado más largo (el izquierdo) y
que x  X m  M o .
95
Matemática II
TECSUP - PFR
En laFig. 3 observamos que la curva está igualmente
inclinada
a los dos lados por eso se llama curva simétrica. En este caso
x  Xm  Mo
Fig. 1
Fig. 2
Mo Md x
Fig. 3
x Md Mo
x
Md
Mo
Primer coeficiente de Asimetría de Pearson
AS1 
Media ï€ Moda
desviación estándar
AS1 
x ï€ Mo
Sx
Notar que el valor del Primer coeficiente de Asimetría de
Pearson nos indica el tipo de asimetría que tendrá la curva.
Ejemplo
Considerando la tabla del Problema 1,
calcular: la varianza, la
desviación típica, el coeficiente de variación, el rango, el rango
intercuartil, el rango interdecílico y con ayuda del primer
coeficiente de Pearson indicar que tipo de asimetría presenta al
curva.
xi ï€ X 2 ni
ï›10; 26
ï›26; 42
ï›42; 58
ï›58; 74
ï›74; 90
ï›90;106
Tabla 9
96
ni xi2
TECSUP - PFR
Matemática II
11852,8
V(x) 
 395,09
30
S x  395,09  19,88
Sx
19,88
C.V. 

 0, 44
45,2
X
73144
V(x) 
ï€ 45, 22  395,09
30
1356
X
 45, 2
30
 8 
M0  26  16 
  35,85
8 5
e  l(A)  105 ï€ 10  95
 30

 4 ï€4
Q1  26  16 
  30,67
 12 




 90

 4 ï€ 16 
Q3  42  16 
  56,86
7






RIQ  Q3 ï€ Q1  56,86 ï€ 30, 67  26,19
 30

 10 ï€ 0 
D1  10  16 
  22
 4 




 270

 10 ï€ 23 
D9  58  16 
  74
4






RID  D9 ï€ D1  74 ï€ 22  52
AS1 
AS1 
X ï€ Mo
Sx
45, 2 ï€ 35,85
 0, 47
19,88
Asimetría a la derecha o positiva.
97
Matemática II
TECSUP - PFR
PROBLEMAS PROPUESTOS
1.
Si el salario promedio semanal de n obreros es de 150 soles y cada obrero
recibe
un aumento general de 7,5 soles semanales y una bonificación semanal del 1,5%
del salario incrementado.
sCuál es el salario promedio actual semanal de los obreros?
En unafábrica trabajan 20 mujeres y 45 hombres, el salario promedio semanal
de las mujeres es de 100 soles y el de los hombres 120 soles.
sCuál es el promedio del salario semanal de todos los
trabajadores de la fábrica?
Para los siguientes datos:
55.31
81.47
64.90
70.88
86.02
77.25
76.76
84.21
84.92
90.23
78.01
88.05
73.37
87.09
57.41
85.43
74.76
86.51
86.37
76.15
88.64
84.71
66.05
56.02
83.91
a)
b)
4.
Calcular la mediana antes de clasificar los datos.
Agrupar los datos en una tabla de frecuencias cuyas marcas de clase sean
60, 70, etc. y calcular la desviación típica y la mediana.
El salario medio semanal pagado a los trabajadores de una compañía es de 300
soles. Los salarios medios semanales pagados a hombres y mujeres de la
compañía son 315 y 240 soles respectivamente. Determinar el
porcentaje de
hombres y mujeres que trabajan en la compañía.
Un estudio final realizado determinó que existen 800
trabajadores, sCuántos son
hombres?
En una sección de matemática 24 estudiantes llevan el curso por primera vez, 6
llevan por segunda vez y 2 por tercera vez. Se sabe que 12 es el promedio de
notas de los que llevan por primera vez y que las notas de los que llevan por
segunda vez en promedio son superiores en un 10% de
los que llevan por
primera vez.
Calcular el promedio de notas de los que llevan el curso por tercera vez si la
suma total de las notas es de 390.
Se tiene la siguiente información sobre la distribución de frecuencias de 100
elementos de un material sometido a prueba de ruptura (en kg/cm2).
La longitud de los intervalos de clase es constante:
98
TECSUP - PFR
Matemática II
Ii
ï›
ï›
ï›
ï›
ï›
ï›
ni
Ni
xi
30
,
ni xi2
600
800
,
46
,
,
xi ni
700
34
880,120
,
TOTALES
a) Determinar la media, la mediana y los cuartiles de la distribución.
b) El Ns de datos que estima pertenezcan al intervalo [media, mediana].
c) La desviación estándar.
d) El intervalo interdecílico. Precisar el significado del resultado
obtenido.
100 elementos de un material determinado fueron sometidos a prueba de ruptura
por compresión (obteniéndose los resultados en kg/cm2).
Cuando se acudió a la tabla de cálculos que el operador debió confeccionar se
encontró solamente lo siguiente
Ii
ï› ,
ï› 12.5 ,
ï› ,
ï› ,
ï› , 72.5
ni
Ni
xi
10
xi ni
ni xi2
180
42
30
360
750
98
120
TOTALES
a) Determinar la media, la moda y el valor mediano.
b) El coeficiente de variación.
c) El primer coeficiente de Pearson. sQué puede afirmar
acerca de la asimetría?
d) El intervalo intercuartílico. Precisar el significado del resultado
obtenido.
99
Matemática II
8.
TECSUP - PFR
Una máquina llena automáticamente paquetes de tabaco. Se extrae una
muestra
de la producción; tras su pesado, se obtiene
Pesos de los paquetes de tabaco
Pesos en gramos
menos de 38
menos de 39
menos de 39,5
menos de 40
menos de 40,5
menos de 41
menos de 41,5
menos de 42
menos de 42,5
menos de 43
menos de 44
Cantidades
0
3
8
18
31
51
69
84
95
99
100
más de 44
0
a) Trazar el histograma de esta serie estadística.
b) Construir una nueva tabla, dando las frecuencias por clases de amplitud 2
gramos. Trazar el histograma representativo. sQué se puede deducir de la
comparación de los dos histogramas?
c) Calcular la media, la mediana y la desviación típica de la distribución de
los
pesos de los paquetes de tabaco.
d) Utilizando los datos agrupados por clases de amplitud 2 (b), repetir los
mismos cálculos. sQué se puede deducir de ello?
9.
Sea lasiguiente distribución de lados X en mm medidos en 10 piezas: 1,20 – 2,40
– 6,00 – 7,20 – 12,00 – 13,20 – 16,80 – 21,60 – 22,80 y 25,20 mm.
a) Determinar la media x y la desviación típica Sx de la variable X.
b) Tras emplear el cambio de variable Y  5 X ï€ 54  / 6 determinar la
media y y
la desviación típica Sy de la nueva variable Y.
10
Los siguientes datos son las temperaturas registradas en grados Farenheit:
415
510
460
475
420
490
480
450
435
485
470
465
500
455
435
100
TECSUP - PFR
Matemática II
Encontrar x y Sx a partir de los datos.
11
Dada la siguiente gráfica de la distribución de salarios básicos de 90
trabajadores
de una fábrica, donde el haber básico mínimo es de 650 soles y el haber básico
máximo es de 3150 soles. Determinar
a) La moda, la desviación típica.
b) El coeficiente de variación.
c) El coeficiente de Pearson.
d) El decil D4 y el cuartil Q3.
Ni
90
90
83
72
75
60
45
45
30
15
9
Ii
650
12.
1150
1650
2150
2650
3150
La siguiente tabla muestra la distribución de salarios de 150 trabajadores de
TECSUP durante el mes de Abril del año 2001.
Haberes
Número de
trabajadores
15
24
29
38
24
20
ï› 600 , 900 
ï› 900 , 1400 
ï› 1400 , 1700 
ï› 1700 , 2100 
ï› 2100 , 2400 
ï› 2400 , 2600

Por incremento del costo de vida se plantean dos alternativas de aumento para
el
mes siguiente. La primera propuesta consiste en un
aumento general de 350
soles mensuales.
101
Matemática II
TECSUP - PFR
La segunda propuesta consiste en un aumento del 30% de los salarios de Abril a
los trabajadores que ganan menos de 2100 soles y del 5% a los trabajadores que
ganan más de 2100 soles y un aumento adicional de 100 soles para todos los
trabajadores.
a) sCuál de las propuestasconvendría a los trabajadores?
b) Para los trabajadores que ganan menos de
2100 soles sQué propuesta les
convendría?
13
El ingreso percápita anual de un país es de 9000 dólares. El sector obrero que
1
constituye el 60% de la población percibe 5 del ingreso total.
Calcular el ingreso
percápita del
sector no obrero.
14.
La producción de la fábrica A es el triple de la de B y la de ésta 18% inferior
a la
de C. Si los costos unitarios correspondientes, todos inferiores en 20% de sus
respectivos precios de venta son:
200, 240 y 260. Se pide calcular el precio medio de venta.
15
Se da la clasificación de un grupo de niños por estaturas:
Estatura (en cm)
ni
80 a menos de 90 cm
90 a menos de 95 cm
95 a menos de 100 cm
100 a menos de 105 cm
105 a menos de 110 cm
110 a menos de 120 cm
TOTALES
3
15
22
18
12
5
ni xi2
xi ni
xi
a) Calcular la media y la desviación típica S de la distribución de los niños
por
estaturas.
b) Determinar la mediana de estas observaciones.
c) sCuál es la moda de la distribución?
d) sCuál es la proporción de niños que tienen una estatura comprendida entre
x ï€ 2S y x  2S ?
16
Sea la distribución de
salarios (en nuevos soles) de 20 trabajadores de una
compañía (año 2000)
xi
150
300
420
570
ni
3
11
4
2
102
TECSUP - PFR
Matemática II
Hallar x y S x
17.
Se tiene la siguiente tabla de frecuencias de los pesos de 200 objetos de
similar
confección, cuya distribución es simétrica: sCuántos objetos tienen pesos
comprendidos entre 15 y 20Kg?
Pesos
ï› 10 ,
ï› ,
ï› ,
ï› ,
ï› 18 ,
ï› ,
ni
Ni


100 hi %
13%
a


b
142


c
TOTALES
sCuánto resulta a+b-c?
Nota el ancho de clase es constante
3.
ANÁLISIS DE DATOS BIVARIADOS
Hemos estudiado ahora datosprovenientes de una sola variable, sin embargo
con frecuencia es necesario analizar respecto a la relación entre dos
variables. La
relación entre dos variables puede darse de la siguiente manera:
Cualitativa vs cualitativa
Cualitativa vs cuantitativa
Para el segundo caso “cualitativa vs cuantitativa” puede trabajarse la variable
cuantitativa con sus datos originales o puede elaborarse intervalos y
analizarlo
como el primer caso “cualitativa vs cualitativa”.
Cualitativa vs cualitativa
Supongamos que se toma una muestra de tamaño “n” de una población que se
está investigando.
Sean X e Y las variables a estudiar, tal que los datos obtenidos son:
( X1,Y1 ),( X2,Y2), ….,( Xn,Yn).
103
Matemática II
TECSUP - PFR
Distribución conjunta y marginal
La tabla de frecuencia que agrupa a esta información
se conoce “tabla de
contingencia“. Por ejemplo, para el caso de dos variables cualitativas con dos
modalidades o categorías, la tabla sería
Y
Categoría 1 Categoría 2
Total
Celda
Celda
Total marginal
f11
f12
f1.
Celda
Celda
Total marginal
f21
f22
f2.
Total
Total
Total de
marginal
marginal
individuos
f.1
f.2
n
Categoría 1
Categoría 2
Total
Distribución Marginal
Cuando sólo interesa conocer la frecuencia de ocurrencia de cada una de las
variables por separado se habla de Frecuencia Marginal de la variable.
Por ejemplo:
SEXO
HábitosdeFum
ar
SI
NO
Total
VA
RON
MU
JER
DIS IBU
TR CION
C
ONJUN
TA
DISTR CION
IBU
MA INA
RG L
Total
DIS IBU
TR CION
MA
RGINA
L
Tam
año
de
m
uestra
sCuántas variables tenemos?
………………………………………………………………………………………………………..
104
TECSUP - PFR
Matemática II
sCuáles son?
………………………………………………………………………………………………………..
Ejemplo 1:
Frecuencia absoluta: conjunta y marginal
SEXOSI
VARON
Hábitos de Fumar
NO
Total
800
2000
3000
1800
Total
2000
1000
MUJER
1200
3200
5000
Frecuencia relativa: conjunta y marginal
Categoría
variable X
Categoría
variable X
Total
Categoría
Categoría
variable Y
variable Y
f11
f12
n
n
f21
f22
n
n
Total
X/Y
Total
Total de
marginal
marginal
indivíduos
f.1/n
f.2/n
n/n
Total
Total
marginal
f1./n
Total
marginal
f2./n
105
Matemática II
TECSUP - PFR
H itosd um r
áb
eF a
S
I
N
O
0.16
0
.24
0.20
0
.40
0.36
0
.64
SEX
O
VR N
AO
M JE
U R
To
tal
To
tal
0.40
0.60
1
Frecuencia Condicional
Cuando se “pregunta” por la frecuencia relativa de una de las variables, digamos
X, restringida a los elementos observados de una clase dada de la otra; esto
es,
estudiar el comportamiento de una variable dado un valor fijo de la otra.
Y
Categoría
Categoría
variable Y
variable Y
Categoría 1
f1 / f.1
f12/f.2
Categoría 2
f21/f.1
f22/f.2
Total
1
1
EJERCICIO
En la ciudad de Lima
se ha incrementado durante los últimos cinco años el
número de restaurantes de comida rápida. Debido a esto
los expertos la empresa
de investigación de mercado Consultores-ECE se pregunta. sLa preferencia de un
cliente por la comida rápida tiene que ver la edad? La empresa eligió una
muestra aleatoria de 500 clientes de comida rápida mayores de 16 años y se les
preguntó su restaurante favorito, obteniéndose los siguientes datos
Grupo de
edad
16 - 21
21 - 30
30 - 49
50 a más
Kentuky
75
89
54
21
Restaurant
McDonalds Burger-King
34
10
42
19
52
28
25
7
Otro
6
10
18
10
sCuáles serán las conclusiones que llegarán los expertos de la empresa
Consultores-ECE?
106