Estadística
La Estadística es la ciencia que trata de
los métodos y procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar datos, así como de
realizar inferencias a partir de ellos, con la finalidad de ayudar a
la toma de decisiones y en su caso formular predicciones.
Podemos por tanto clasificar la Estadística en: ïµï‚ Descriptiva o deductiva,
que tiene por objeto la recogida, recopilación, y reducción de datos, su
organización en tablas y gráficos y el cálculo de unos valores que representen
al conjunto de datos. ïµï‚ Inferencial o inductiva tiene
por objeto establecer previsiones o conclusiones sobre una población basándose
en los resultados obtenidos de una muestra Definiciones de términos
estadísticos ïµï‚ Población: es el conjunto de elementos,
individuos o entes sujetos a estudio y de los cuales queremos obtener un
resultado.ïµï‚ Variable: es la característica que estamos
midiendo.Existen dos tipos de variables:Variable cualitativa: Es
aquella que expresa un atributo o característica, ejemplo: Rubio, moreno,
etc.Variable cuantitativa: Es aquella que podemos expresar numéricamente:
edad, peso, etc. Esta a su vez la podemos subdividir en:Variable
discreta, aquella que entre dos valores próximos puede tomar a lo sumo un
número finito de valores. Ejemplos: el número de TSE de una familia, el de
obreros de una fabrica, el de alumnos de launiversidad, etc.Variable
continua la que puede tomar los infinitos valores de un
intervalo. En muchas ocasiones la diferencia es más teórica que práctica, ya
que los aparatos de medida dificultan que puedan existir todos los valores del
intervalo. Ejemplos, peso, estatura, distancias, etc.La variable se denota por
las mayúsculas de letras finales del alfabeto castellano. A su vez
cada una de estas variables puede tomar distintos valores ,
colocando un subíndice, que indica orden.X = (X1,
X2 , Xn µï‚ Muestra: Conjunto
de elementos que forman parte de población . La muestra representa a esta
población.ïµï‚ Tamaño muestral: Es le número de elementos u
observaciones que tomamos. Se denota por n ó N.ïµï‚ Dato: Cada
uno de los individuos, cosas, entes abstractos que integran una población o
universo determinado. Dicho de otra forma, cada valor
observado de la variable. Frecuencias
absolutas, relativas y acumuladas.ïµï‚ Frecuencia
absoluta: Llamaremos así al número de repeticiones que presenta una
observación. Se representa por ni.ïµï‚ Frecuencia relativa: Es la
frecuencia absoluta dividida por el número total de datos, se suele expresar en
tanto por uno:
La
suma de todas las frecuencias relativas, siempre
debe ser igual a la unidad.ïµï‚ Frecuencia absoluta acumulada: es la suma
de los distintos valores de lafrecuencia absoluta tomando como referencia un individuo dado. La última
frecuencia absoluta acumulada es igual al ns de casos: N1 = n1N2 = n1+ n2Nn
= n1 + n2 + . . . . . . + nn-1 + nn= n ïµï‚ Frecuencia
relativa acumulada: es el resultado de dividir cada frecuencia absoluta
acumulada por el número total de datos, se la suele representar con la
notación: Fi Tabla de frecuencias para una variable discreta. |
xi | ni | Ni | fi | Fi |
x1 | n1 | N1 | f1 | F1 |
x2 | n2 | N2 | f2 | F2 |
x3 | n3 | N | f3 | 1 |
| ï“ni=N | | 1 | |
|
EJEMPLO 1s Queremos hacer un estudio estadístico del número de
Técnicos Superiores en Electricidad (TSE) que existen en las empresas
eléctricas de una determinada ciudad. Para ello se ha encuestado a
50 empresas y se han obtenido los siguientes datos: 2
| 4 | 2 | 3 | 1 | 2 | 4 | 2 | 3 | 0 | 2 | 2 | 2 | 3 | 2 | 6 | 2 | 3 | 2 | 2 | 3
| 2 | 3 | 3 | 4 |
3 | 3 | 4 | 5 | 2 | 0 | 3 | 2 | 1 | 2 | 3 | 2 | 2 | 3 | 1 | 4 | 2 | 3 | 2 | 4 |
3 | 3 | 2 | 2 | 1 |
Se pide: a) sCuál es
la población objeto de estudio?b) sQué variable estamos estudiando?c) sQué tipo
de variable es?d) Construir la tabla de frecuencias?e) sCuál es el número
de empresas que tiene como máximo 2 TSE?f)
sCuántas empresas tienen más de 1 TSE, pero como máximo
3?g) sQué porcentaje de empresas tiene más de
3 TSE ?SOLUCIÓN:a) La población objeto deestudio
es las empresas de electricidad de una ciudad.b) La variable que
estamos estudiando es el número de TSE por empresa.c) El
tipo de variable es discreta ya que el número de TSE solo puede tomar
determinados valores enteros.d) Para construir la tabla de frecuencias tenemos
que ver cuantas empresas tienen un determinado número de TSE.
Podemos ver que el número de TSE, toma los valores existentes entre
0 TSE, los que menos y 6 TSE, los que más y tendremos: xi | ni
| Ni | fi | Fi |
0 | 2 | 2 | 0.04 | 0.04 |
1 | 4 | 6 | 0.08 | 0.12 |
2 | 21 | 27 | 0.42 | 0.54 |
3 | 15 | 42 | 0.30 | 0.84 |
4 | 6 | 48 | 0.12 | 0.96 |
5 | 1 | 49 | 0.02 | 0.98 |
6 | 1 | 50 | 0.024 | 1 |
| N = 50 | | 1 | |
e) El número de empresas que tienen dos o menos TSE
es: 2+4+21 = 27f) El número de empresas que tienen más de un TSE
pero tres como máximo es: 21 + 15 = 36Por último el porcentaje de empresas que
tiene más de tres TSE, son aquellos que tienen 4; 5 y 6 es decir 6+1+1= 8El
porcentaje será el tanto por uno multiplicado por cien es decir, la frecuencia
relativa de dichos valores multiplicado por 100: ( 0.12+0.02+0.02)* 100 = 0,16
+ 100 = 16 % Marca de Clase |
Cuando nos encontramos con una distribución con un gran número de variables, se
se suelen agrupar en intervalos para facilitar la comprensión de los datos Se
indica por Li-1 al extremo inferior del intervalo y porLi al extremo
superior. Cerramos el intervalo por la izquierda y abrimos por la derecha, pero
se puede hacer al contrario; [Li-1 ,
Li) Para operar utilizaremos la marca de clase, el
punto medio de un
intervalo ïµï‚ Amplitud
del intervalo: la longitud del intervalo, se representa
por: a = Li - Li-1ïµï‚ Ns de
intervalos: A partir de la raíz cuadrada del número de datos, decidimos,
redondeando el número de intervalos.ïµï‚ Recorrido: Valor mayor, menos
valor menor de los datos. Re= xn-x1ïµï‚ Amplitud: División entre el
Recorrido y el número de intervalos que hayamos decidido. EJEMPL0 2s
Se desea hacer un estudio estadístico del precio de un pequeño interruptor
eléctrico de la marca Interelec, en las tiendas de material eléctrico de una
ciudad. Para ello se
conocen los precios en 40 tiendas de esa ciudad. Los datos
obtenidos en euros son: 3,9 | 4,7 | 3,7 | 5,6 | 4,3 | 4,9 | 5,0 | 6,1 |
5,1 | 4,5 |
5,3 | 3,9 | 4,3 | 5,0 | 6,0 | 4,7 | 5,1 | 4,2 | 4,4 | 5,8 |
3,3 | 4,3 | 4,1 | 5,8 | 4,4 | 4,8 | 6,1 | 4,3 | 5,3 | 4,5 |
4,0 | 5,4 | 3,9 | 4,7 | 3,3 | 4,5 | 4,7 | 4,2 | 4,5 | 4,8 |
Se pide:a) sCuál es la población objeto de estudio?b) sQué variable estamos
estudiando?c) sQué tipo de variable es?d) sQué problema plantea la construcción
de la tabla de frecuencias?e) sCuántas tiendas tienen un precio entre 3,25
y 3,75 euros?f) sCuánto tiendas tienen un precio superior
a4,75 euros?g) sQué porcentaje de tiendas tienen precios menores
de 4,25 euros?SOLUCION:a) La población objeto de estudio
son las tiendas dematerial eléctrrico de una ciudadb) La
variable que estamos estudiando es el precio de un interruptor de la
marca Interelec.c) El tipo de variable es continua.d) El problema
que plantea es que existen muchos valores diferentes para por tanto
es conveniente agrupar la serie en intervalos.La manera de hacerlo
sería la siguiente: primero, calculamos el recorrido Re = xn– x1= 6.1
–3.3 = 2.8Cuando no se nos dice nada el ns de intervalos, se obtiene
calculando la raíz cuadrada del ns de datos observado. Veremos que la raíz
cuadrada de 40 es igual a 6.32 por lo tanto tomaremos 6 intervalos.Como el
recorrido es 2.8 si lo dividimos por el ns de intervalos tendremos la amplitud
de cada uno de ellos y así: 2 /6 =
0,46.Importante: La amplitud es de 0,46 por lo que además de no ser muy
fácil operar, puede que no cubra el rango de la variable. Lo podemos evitar,
tomaremos un valor superior, en este caso 0,5: [Li-1,, Li) | ni | Ni | fi
| Fi |
[3,25, 3,75) | 3 | 3 | 0.075 | 0.075 |
[3,75, 4,25) | 8 | 11 | 0.2 | 0.275 |
[4,25, 4,75) | 14 | 25 | 0.35 | 0.625 |
[4,75, 5,25) | 6 | 31 | 0.15 | 0.775 |
[5,25, 5,75) | 4 | 35 | 0.1 | 0.875 |
[5,75, 6,25) | 5 | 40 | 0.125 | 1 |
| N= 40 | | | |
e) 3f) 15g) %=F2*100=0.275*100=27.5 |