ar condiciones
regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en
forma aleatoria o condicional. Sin embargo, la
estadística es más que eso, es decir, es el vehículo que permite llevar a cabo
el proceso relacionado con la investigación científica.
Distribución normal
Es transversal a una amplia variedad de disciplinas, desde la física hasta
las ciencias sociales, desde lasciencias de la salud hasta
el control de calidad. Se usa para
la toma de decisiones en áreas de negocios o
instituciones gubernamentales.
La estadística se divide en dos grandes áreas
La estadística descriptiva, se dedica a la descripción, visualización y
resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente.
Ejemplos básicos deparámetros estadísticos son: la media y
la desviación estándar. Algunos ejemplos gráficos son: histograma,pirámide poblacional, gráfico circular, entre otros.
La estadística inferencial, se dedica a la generación de los modelos,
inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en
cuenta la aleatoriedad de las observaciones. Se usa
para modelarpatrones en los datos y extraer inferencias acerca de
la población bajo estudio. Estas inferencias pueden
tomar la forma de respuestas a preguntas si/no (prueba de hipótesis),
estimaciones de unas características numéricas
(estimación), pronósticos de futuras observaciones, descripciones de
asociación (correlación) o modelamiento de relaciones entre variables (análisis
de regresión). Otrastécnicas
de modelamiento incluyenanova, series de
tiempo y minería de datos.
bas ramas (descriptiva e inferencial) comprenden
la estadística aplicada. Hay también una disciplina
llamadaestadística matemática, la que se refiere a las bases teóricas de la
materia. La palabra «estadísticas» también se refiere al resultado de
aplicar un algoritmo estadístico a un conjunto de
datos, como
en estadísticas económicas, estadísticas criminales, entre otros.
La estadística inferencial es una parte de
la estadística que comprende los métodos y procedimientos para
deducir propiedades de una población estadística, a partir de unapequeña
parte de la misma. La estadística inferencial comprende como aspectos importantes
La toma de muestras o muestreo.
La estimación de parámetros o variables estadísticas.
El contraste de hipótesis.
El diseño experimental.
La inferencia bayesiana.
Los métodos no paramétricos
Planteamiento del problema
Un problema de inferencia estadística suele iniciarse con una fijación de
objetivos o algunas preguntas del
tipo
scuál será la media de esta población respecto a tal característica?
sSe parecen estas dos poblaciones?
sHay alguna relación entre
En el planteamiento se definen con precisión la población, la característica a
estudiar, las variables, etc
Elaboración de un modelo
Se establece un modelo teórico de comportamiento de la variable de estudio. En
ocasiones no es posible diseñar el modelo hasta realizar un
estudio previo.
Los posibles modelos son distribuciones de probabilidad.
[editar]Extracción de lamuestra
Se usa
alguna técnica de muestreo o un diseño experimental para obtener
información de una pequeña parte de la población.
[editar]Tratamiento de los datos
En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los
datos y se calculan los valores que serán necesarios en pasos posteriores, como
la media muestral, la varianza muestral
Los métodos de esta etapa están definidos por la estadística descriptiva.
[editar]Estimación de los parámetros
Con determinadas técnicas se realiza una predicción sobre cuáles
podrían ser los parámetros de la población
Contraste de hipótesis
Artículo principal: Contraste de hipótesis.
Los contrastes de hipótesis son técnicas que permiten
simplificar el modelo matemático bajo análisis. Frecuentemente
el contraste de hipótesis recurre al uso
de estadísticos muestrales.
[editar]Conclusiones
Se critica el modelo y se hace un balance. Las
conclusiones obtenidas en este punto pueden servir
para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este
momento, en un proceso cíclico que permite conocer cada vez mejor la población
y características de estudio.
La estadística descriptiva es una gran parte de
la estadística que se dedica a recolectar, ordenar, analizar y
representar un conjunto de datos, con el fin de
describir apropiadamente las características de ese conjunto. Este análisis es muy básico. Aunque hay tendencia a
generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculandouna serie
de medidas de tendencia central, para ver en qué medida los datos se
agrupan o dispersan en torno a un valor central. Esto es lo que
podria ser un concepto aproximado.
Estadística y Los Conceptos.
La Estadística es la ciencia que se encarga de recolectar los datos de
población o muestra. Los conceptos estadísticos se han trabajado intuitivamente
desde la antigüedad, las primeras culturas recopilaban datos poblacionales por
medio de censos como los realizados Egipto y por Moisés (según consta la
Biblia) y el empadronamiento por el efectuado por los romanos en Judea, solo a
partir del siglo pasado Adolfo Quetelec (1796-1874) creo las reglas o leyes con
los cuales se realizaban observaciones con el fin de determinar alguno datos
que regulan algunos fenómenos.
Muestreo
Muestreo puede referirse a
En estadística existe la noción de muestreo en una
población. Existen varias técnicas de muestreo, pero las más
conocidas son muestreo aleatorio y estratificado.
En música existe la noción de muestreo o sampleo, que consiste
en la inserción de un fragmento sonoro previamente
grabado en una nueva composición musical.
En telecomunicaciones y procesamiento digital
de señales, el muestreo es uno de los pasos
para digitalizar una señal analógica, el otro es
la codificación.
También hay muestreo en cosas de química para tomar muestras del agua, etc.
En biología, específicamente en ecología de
poblaciones, se utiliza el muestreo en poblaciones finitas con
diferentes fines; por ejemplo, para estimar el tamaño poblacional cuando no
sepuede censar una población.
La probabilidad mide la longitud y fuerza con la que se obtiene un resultado (o conjunto de resultados) luego de llevar a
cabo un experimento aleatorio, del
que se conocen todos los resultados posibles, bajo
condiciones suficientemente estables. La teoría de la
probabilidad se usa
extensamente en áreas como
la estadística, la física, la matemática, lasciencias y
la filosofía para sacar conclusiones sobre la probabilidad discreta
de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos.
Equiprobabilidad
Se dice que dos sucesos posibles de un experimento son equiprobables cuando
la probabilidad de ocurrencia de ambos sucesos es la misma. Matemáticamente
Siendo E y B resultados posibles de un mismo experimento.
TAMAÑO DE LA MUESTRA
En estadística el tamaño de la muestra es el número de
sujetos que componen la muestra extraída de una población,
necesarios para que los datos obtenidos sean
representativos de la población.
Muestra estadística
En estadística una muestra estadística (también
llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población
estadística.
Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir
esta característica la inclusión de sujetos en la muestra debe seguir
una técnica de muestreo. En tales casos, puede obtenerse una
información similar a la de un estudio exhaustivo con
mayor rapidez y menor coste (véanse las ventajas de la elecciónde una muestra,
más abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio
de toda la población porque el manejo de un menor
número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los
sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la
población, pero suficiente para que la estimación de los parámetros
determinados tenga un nivel de
confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso
recurrir a su cálculo.
Población estadística
Población estadística, en estadística, también
llamada universo o colectivo, es el conjunto de elementos de
referencia sobre el que se realizan unas de las observaciones.
Demografía
Mapa de la población mundial por países.
La demografía (del griego δI®μος dA“mos 'pueblo'
y γραφI¯α grafía 'trazo, descripción'
–estudio de la población–) es la ciencia que tiene como objetivo el estudio de
las poblaciones humanas y que trata de su dimensión, estructura, evolución
y características generales.
La demografía estudia estadísticamente la estructura y la dinámica de
las poblaciones, así como los procesos concretos que
determinan la formación, la conservación y la desaparición de
las poblaciones. Tales procesos, en su forma más
agregada, son los
de fecundidad, mortalidad y migración -emigración einmigración-.1
Histograma
Histograma.
En estadística, un histograma es una
representación gráfica de una variable en forma de barras,
donde lasuperficie de cada barra es proporcional a la frecuencia de
los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables, normalmente señalando las
marcas de clase, es decir, la mitad del intervalo en el que están agrupados
los datos.
Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.
Se utiliza cuando se estudia una variable continua, como franjas de
edades o altura de la muestra, y, por comodidad, sus valores se agrupan en
clases, es decir, valores continuos. En los casos en los que los datos son
cualitativos (no-numéricos), como sexto grado de acuerdo o nivel
de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales,
humanas y económicas que en ciencias naturales y exactas. Y permite la
comparación de los resultados de un proceso.
Contenido ocultar] 1 Tipos de
histograma2 Construcción de un histograma3 Véase
también4 Enlaces externos |
Tipos de histograma
Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la
barra la cual es proporcional a la frecuencia simple de la categoría que
representa.
Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble
entrada o sea a partir de dos variables, las cuales se representan así; la
altura de la barra representa la frecuencia simple de las modalidades o
categorías de la variable y esta altura es proporcional a lafrecuencia simple
de cada modalidad.
Diagramas de barras agrupadas
Se usa
para representar la información de una tabla de doble entrada o sea a partir de
dos variables, el cual es representado mediante un conjunto de barras como se clasifican
respecto a las diferentes modalidades.
Polígono de frecuencias
Es un gráfico de líneas que de las frecuencias
absolutas de los valores de una distribución en el cual la altura del punto asociado a un
valor de las variables es proporcional a la frecuencia de dicho valor.
Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando
se quiere representar el rango porcentual de cada valor en una distribución de
frecuencias.
En los gráficos las barras se encuentran juntas y en la tabla los números
poseen en el primer miembro un corchete y en el segundo un paréntesis, por
ejemplo: [10-20
Construcción de un histograma
Paso 1
Determinar el rango de los datos. Rango es igual al dato
mayor menos el dato menor.
Paso 2
Obtener los números de clases, existen varios criterios para determinar el
número de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores
recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y
cuántos sean. Un criterio usado
frecuentemente es que el número de clases debe ser aproximadamente a la raíz
cuadrada del
número de datos. Por ejemplo, la raíz cuadrada de 30 ( número
de artículos) es mayor que cinco, por lo que se seleccionan seis clases.
Paso 3
Establecer la longitud de clase: es igual al rangodividido por el número de
clases.
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango
de los datos en relación al resultado del PASO 2 en intervalos iguales.
Paso 5
Graficar el histograma: En caso de que las clases sean
todas de la misma amplitud, se hace un gráfico de barras, las bases de las
barras son los intervalos de clases y altura son la frecuencia de las clases.
Si se unen los puntos medios de la base superior de los rectángulos se obtiene
el polígono de frecuencias.
El histograma de una imagen representa la frecuencia relativa de los niveles de
gris de la imagen. Las técnicas de modificación del
histograma de una imagen son útiles para aumentar el contraste de imágenes con
histogramas muy concentrados.
Sea u una imagen de tamaño NxN, la función de distribución del
histograma es:
Ejemplos de otros tipos de representaciones gráficas: Hay histogramas donde se
agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta)
hay en cada una de ellas. En algunas variables (variables cualitativas) las
clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o
grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las
clases hay que definirlas explícitamente (intervalos
de clase).
Se representan los intervalos de clase en el eje de abscisas
(eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas
(eje vertical).
A veces es más útil representar las frecuencias acumuladas.
O representar simultáneamente los histogramas de unavariable en dos situaciones
distintas.
Otra forma muy frecuente, de representar dos histogramas de
la misma variable en dos situaciones distintas.
En las variables cuantitativas o en las cualitativas
ordinales se pueden representar polígonos de frecuencia en lugar de
histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva.
Distribución de frecuencias
(Redirigido desde «Tabla de frecuencias»)
En estadística, se le llama distribución de frecuencias a la
agrupación de datos en categorías mutuamente excluyentes que indican el número
de observaciones en cada categoría.1 Esto proporciona un valor añadido a
la agrupación de datos. La distribución de frecuencias presenta las observaciones
clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de
tablas.
Contenido [ocultar] 1 Características2 Tipos de
frecuencias2.1 Frecuencia absoluta2.2 Frecuencia relativa2.3 Frecuencia
acumulada2.4 Frecuencia relativa acumulada2.5 Distribución de
frecuencias agrupadas3 Referencias |
Características
Una distribución de frecuencias es un formato tabular en la que se
organizan los datos en clases, es decir, en grupos de valores que describen una
característica de los [datos] y muestra el número de observaciones del conjunto
de datos que caen en cada una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo
de dato numérico. En principio, en la tabla de frecuencias se
detalla cada uno de los valores diferentes en el conjunto de datos junto con
elnúmero de veces que aparece, es decir, su Frecuencia. Se puede
complementar la frecuencia absoluta con la denominada frecuencia relativa,
que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte
la frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representarse gráficamente en un histograma(Diagrama De Barras). Normalmente
en el eje vertical se coloca las frecuencias y en el horizontal los intervalos
de valores.
La distribución de frecuencias o tabla de frecuencias es una ordenación en
forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.
[editar]Tipos de frecuencias
Véase también: Frecuencia estadística.
[editar]Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico. Se representa por ni. La suma de las frecuencias absolutas es igual al número
total de datos, que se representa por N. Para indicar resumidamente estas sumas
se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.
[editar]Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por fi.
La suma de las frecuencias relativas es igual a 1.
[editar]Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. Se representa por Ni editar]Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada
de un determinado valor y el número total de datos. Se puede
expresar en tantos por ciento. Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29,
29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable
ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera
anotamos la frecuencia absoluta.
xi ni Ni fi Fi
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
Este tipo de tablas de frecuencias se utiliza con variables discretas.
[editar]Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea
si las variables toman un número grande de valores o
la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A
cada clase se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está
delimitada por el límite inferior de la clase y el límite superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de
la clase. Lamarca de clase es el punto medio de cada
intervalo y es el valor que representa a todo el intervalo para el cálculo de
algunos parámetros.
Construcción de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Se localizan los valores menor y mayor de la distribución.
En este caso son 3 y 48.
Se restan y se busca un número entero un poco mayor
que la diferencia y que sea divisible por el número de intervalos queramos
establecer.
Es conveniente que el número de intervalos oscile entre 6 y
15.
En este caso, 48 - 3 = 45, incrementamos el número hasta
5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite
inferior de una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.2775
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1
Total: 40 1
ï‚· CON UNA RECOLECCION DE DATOS CONSTRUYAUNA TABLA DE FRECUENCIAS.
Situación: En un curso de 50 alumnos, se le pidió a un profesor que pesará a
todos los alumnos, los datos obtenidos son los siguientes
Intervalos (peso en kg.) | ns de alumnos | Porcentaje (%) |
35 - 39 | 2 | 4 |
40 - 44 | 0 | 0 |
45 - 49 | 1 | 2 |
50 - 54 | 1 | 2 |
55 - 59 | 2 | 4 |
60 - 64 | 3 | 6 |
65 - 69 | 8 | 16 |
70 - 74 | 6 | 12 |
75 - 79 | 11 | 22 |
80 - 84 | 6 | 12 |
85 - 89 | 4 | 8 |
90 - 94 | 4 | 8 |
95 - 99 | 2 | 4 |
pPolígono de frecuencia es el nombre que recibe una clase de
gráfico que se crea a partir de un histograma de frecuencia. Estos
histogramas emplean columnas verticales para reflejar frecuencias): el
polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas
columnas.
Es decir, por tanto, podríamos establecer que un
polígono de frecuencia es aquel que se forma a partir de la unión de los
distintos puntos medios de las cimas de las columnas que configuran lo que es
un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que
son columnas de tipo vertical y porque nunca debe haber
espacios entre lo que son unas y otras.
En las ciencias sociales, en las ciencias naturales y también en las económicas
es donde con más frecuencia se hace uso de estos
mencionados histogramas ya que se emplean para llevar a cabo lo que es la
comparación de los resultados de un proceso determinado.
Se conocecomopolígonos de frecuencia para datos agrupados a aquellos que se desarrollan mediante la marca de
clase que tiene coincidencia con el puntomedio de las distintas columnas del histograma. En
el momento de la representación de todas las frecuencias que forman
parte de una tabla de datos agrupados, se genera el histograma
de frecuencias acumuladas que posibilita la diagramación del
polígono correspondiente.
Un polígono de frecuencia, por ejemplo, permite
reflejar las temperaturas máximas promedio de una ciudad en un
determinado periodo temporal. En el eje X (horizontal), deben
indicarse los meses del año (enero, febrero, marzo,
abril, etc.). En el eje Y (vertical), en cambio, se registran las
temperaturas más altas promedio de cada mes (28s, 26s,
22s…). El polígono de frecuencia se creará al unir, mediante un segmento,
las diversas temperaturas más elevadas promedio.
Los polígonos de frecuencia se suelen usar cuando se
pretende retratar varias distribuciones distintas o la clasificación cruzada de
una variable cuantitativa continua con una cualitativa o cuantitativa discreta
en el mismo dibujo.
El punto de más altura de un polígono de frecuencia
equivale a la mayor frecuencia, mientras que el área que se sitúa debajo de la
curva incluye todos los datos que existen. Cabe recordar que la frecuencia es
la repetición mayor o menor de un evento, o el
número de veces que un acontecimiento periódico se reitera en una unidad
temporal.
Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar
que estos se pueden confeccionar de una manera muy sencilla y rápida. En
concreto, se da la oportunidad de acometerlos mediante un
programa informático que se ha convertido en uno de losejes claves del funcionamiento de
cualquier empresa. Nos estamos refiriendo al software conocido como
Excel.
Este es un programa, de Microsoft Office, que se
confeccionó con el claro objetivo de que sususuarios pudieran trabajar con
lo que son hojas de cálculo. Por tal motivo, es lógico
que también permita la posibilidad de crear polígonos de frecuencia a la hora
de comparar cifras y tomar decisiones en base a las mismas.
En concreto, para conseguir crear los mismos con Excel se tiene que partir de
la existencia de una serie de gráficos que se hayan confeccionado previamente
para seguidamente desarrollar un conjunto de acciones
que den lugar a aquellos.
Ojiva (estadística
Ojiva (estadística)
Para otros usos de este término,
véase ojiva.
una ojiva secante de foco
En estadística
La ojiva es la distribución de frecuencias, es decir, que en ella se permite
ver cuántas observaciones se encuentran por encima o debajo de ciertos valores,
en lugar de solo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el
dato que se está comparando tendrá una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente
positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta
se obtiene de aplicar parcialmente la misma técnica a una distribución
acumulativa y de igual manera que éstas, existen las ojivas mayor que y las
ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y lospolígonos de
frecuencias (y por esto la aplicación de la técnica es parcial):
Un extremo de la ojiva no se toca al eje horizontal, para la ojiva 'mayor
que' sucede con el extremo izquierdo; para la ojiva 'menor que',
con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase
se colocan las fronteras de clase. Para el caso de la ojiva
mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la 'mayor que',
a la derecha la 'menor que', utilizando los datos que se usaron para
ejemplificar el histograma:
La ojiva 'mayor que' (izquierda) se le denomina de esta manera porque
viendo el punto que está sobre la frontera de clase “4:00″ se ven las
visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones
temporales se diría, sin errores de gramática: después de las 4:00). De forma análoga, en la ojiva 'menor que' la frecuencia
que se representa en cada frontera de clase son el número de observaciones menores
que la frontera señalada (en caso de tiempos sería el número de observaciones
antes de la hora que señala la frontera).
Curtosis
En teoría de la probabilidad y estadística,
la curtosis es una medida de la forma. Así, las medidas de
curtosis tratan de estudiar la proporción de la varianza que se explica por la
combinación de datos extremos respecto a la media en contraposición con datos
poco alejados de la misma. Una mayor curtosis implica una mayor concentración
de datos muy cerca de la media de la distribución coexistiendo al mismo tiempo
con unarelativamente elevada frecuencia de datos muy alejados de la misma. Esto
explica una forma de la distribución de frecuencias con colas muy elevadas y un con un centro muy apuntado.
[editar]Definición de curtosis
El coeficiente de apuntamiento de uso más extendido es el basado en el cuarto
momento con respecto a la media y se define como
donde es el 4s momento centrado o con respecto a la media
y es la desviación estándar.
En ocasiones se emplea esta otra definición del coeficiente de curtosis
donde al final se ha sustraido 3 (que es la curtosis de la Normal) con objeto
de generar un coeficiente que valga 0 para la Normal y tome a ésta como
referencia de apuntamiento:
Tomando, pues, la distribución normal como referencia, una distribución puede
ser:
más apuntada y con colas más anchas que la normal –leptocúrtica.
menos apuntada y con colas menos anchas que la normal-
platicúrtica.
la distribución normal es mesocúrtica.
En la distribución normal se verifica que ,
donde es el momento de orden 4 respecto a la media y la
desviación típica.
Así tendremos que:
Si la distribución es leptocúrtica y
Si la distribución es platicúrtica y
Si la distribución es mesocúrtica y
Otra forma de medir la curtosis se obtiene examinando la fórmula de la curtosis
de la suma de variables aleatorias. Si Y es la suma
de n variables aleatorias estadísticamente independientes, todas
con igual distribución X, entonces ,
complicándose la fórmula si la curtosis se hubiese definido como .
Varianza
En teoría de probabilidad, la varianza (que suelerepresentarse como
de una variable aleatoria es una medida de
dispersión definida como
la esperanza del
cuadrado de la desviación de dicha variable respecto a su media.
Está medida en unidades distintas de las de la variable.
Por ejemplo, si la variable mide una distancia en metros, la
varianza se expresa en metros al cuadrado. La desviación estándar,
es la raíz cuadrada de la varianza, es una medida de dispersión alternativa
expresada en las mismas unidades de los datos de la
variable objeto de estudio. La varianza tiene como valor mínimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por
los valores atípicos y no se aconseja su uso
cuando las distribuciones de las variables aleatorias tienen colas pesadas. En
tales casos se recomienda el uso de otras medidas de
dispersión más robustas.
El término varianza fue acuñado por Ronald Fisher en un artículo de 1918 titulado The Correlation
Between Relatives on the Supposition of Mendelian Inheritance.
Desviación estándar
La desviación estándar o desviación típica (denotada con el
símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es
una medida de centralización o dispersiónpara variables de razón (ratio o
cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como
la raíz cuadrada de la varianza. Junto con este
valor, la desviación típica es una medida (cuadrática) que informa de la media
de distancias que tienen los datos respecto de su media aritmética,
expresada en las mismas unidades que la variable.
Para conocer con detalle unconjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer también la desviación que
presentan los datos en su distribución respecto de la media aritmética de dicha
distribución, con objeto de tener una visión de los mismos más acorde con la
realidad al momento de describirlos e interpretarlos para la toma de
decisiones.
Interpretación y aplicación
La desviación estándar es una medida del grado de
dispersión de los datos con respecto al valor promedio. Dicho
de otra manera, la desviación estándar es simplemente el 'promedio' o
variación esperada con respecto a la media aritmética.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14)
y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar
muestrales son 8 ; 5,77 y 1,15respectivamente.
La tercera muestra tiene una desviación mucho menor que las otras dos porque
sus valores están más cerca de 7.
La desviación estándar puede ser interpretada como una medida
de incertidumbre. La desviación estándar de un
grupo repetido de medidas nos da la precisión de éstas.
Cuando se va a determinar si un grupo de medidas está
de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de
vital importancia: si la media de las medidas está demasiado alejada de
la predicción (con la distancia medida en desviaciones estándar),
entonces consideramos que las medidas contradicen la teoría. Esto es coherente,
ya que las mediciones caen
fuera del
rango de valores en el cual sería razonable esperar que ocurrieran si
el modelo teórico fueracorrecto. La desviación estándar es uno de
tres parámetros de ubicación central; muestra la agrupación de los datos alrededor
de un valor central (la media o promedio).
Error Estándar
A la desviación estándar de la distribución muestral de un
estadístico se le denomina error estándar del estadístico en cuestión.
Así, cuando el muestreo se hace con reemplazo el error estándar de la
media es
El error estándar de la proporción es
El error estándar de la diferencia de medias es:
.
El error estándar de la diferencia de
proporciones es:
.
También se puede hablar del
error estándar de la varianza (), o de la mediana (), así como de otros estadísticos.
Error estándar Calculadora
ERROR ESTÁNDAR DE ESTIMACIÓN.
Es aquel que mide la dispersión de los valores observados con respecto a la
recta de regresión.
El error estándar de estimación se obtiene aplicando
cualquiera de las siguientes fórmulas.
Calculadora de Error estándar es una herramienta de estadísticas en línea
programada para calcular el Error estándar o el método de medición o la
estimación de la desviación estándar de la distribución de muestreo asociada con
el método de estimación
Definición
El Error estándar es el término utilizado para referirse a una
estimación de la desviación estándar, derivado de una muestra especial
utilizada para calcular la estimación en las estadísticas. En la más común,
error estándar es un proceso de estimación de la
desviación estándar de la distribución de muestreo asociada con el método de
estimación
Cada estadística tieneun error estándar asociado. Una medida
de la precisión de la estadística puede deducir que el error estándar de 0
representa que la estadística tiene ningún error aleatorio y el más grande
representa menos preciso de las estadísticas. Error
estándar no es constantemente informados y no siempre fáciles de calcular.
Tiempos de espera es uno de los ejemplo bien para
Fórmula de error estándar
El error estándar de la media (SEM) es la desviación estándar de la estimación
promedio de muestra de una media de la población. La calculadora de Error
estándar utiliza la fórmula para calcular que el error estándar de la media
es ,
i.e., la desviación estándar dividida por la raíz cuadrada del tamaño de la
muestra
Donde
SExÌ„ = Error estándar de la media
s = Desviación estándar de la media
n = Número de observaciones de la muestra
La colección de herramientas emplea el estudio de métodos y procedimientos
utilizados para que recopilar, organizar y analizar datos para comprender la
teoría de la probabilidad y estadística. El conjunto de ideas que pretende
ofrecer la manera de hacer la implicación científica de tales como resultado datos
resumidos. En muchas aplicaciones es necesario calcular el error estándar para un conjunto de datos con cantidades variables. Con esta
calculadora en línea de error estándar sin esfuerzo puede hacer el cálculo para
el conjunto de teniendo en cuenta las observaciones
Moda (estadística
Para otros usos de este término,
véase Moda (desambiguación).
En estadística, la moda es el valor con una
mayor frecuencia en unadistribución de datos.
Hablaremos de una distribución bimodal de los datos adquiridos
en una columna cuando encontremos dos modas, es decir, dos datos que tengan la
misma frecuencia absoluta máxima. Una distribución
trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay
moda.
El intervalo modal es el de mayor frecuencia
absoluta. Cuando tratamos con datos agrupados antes de definir la moda,
se ha de definir el intervalo modal.
La moda, cuando los datos están agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo,
que verifiquen que:
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de
los intervalos anterior y posterior, respectivamente, al intervalo modal.
Mediana (estadística
Para otros usos de este término,
véase mediana.
En el ámbito de la estadística, la mediana, representa el valor de la
variable de posición central en un conjunto de datos
ordenados. De acuerdo con esta definición el conjunto de datos menores o
iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la
muestra. La mediana coincide con el percentil 50, con el
segundo cuartil y con el quinto decil. Su
cálculo no se ve afectado por valores extremos.
Medidas de tendencia central
Al describir grupos de observaciones, con frecuencia es conveniente resumir la
información con un solo número . Este número que, para
tal fin, suelesituarse hacia el centro de la distribución de datos se
denomina medida o parámetro de tendencia central o de
centralización. Cuando se hace referencia únicamente a la posición de estos
parámetros dentro de la distribución, independientemente de que ésta esté más o
menos centrada, se habla de estas medidas como medidas de
posición.1 En este caso se incluyen también los cuantiles entre
estas medidas. Se debe tener en cuenta que existen variables cualitativas y
variables cuantitativas, por lo que las medidas de posición o medidas
de tendencia se usan de acuerdo al tipo de variable que se está
observando, en este caso se observan variables
cuantitativas.
Entre las medidas de tendencia central tenemos
Media .
Media ponderada.
Media geométrica.
Media armónica.
Mediana.
Moda.
La media aritmética (o simplemente media
Medidas de Distibución - Asimetría y Curtosis
Las medidas de distribución nos permiten identificar la forma en que
se separan o aglomeran los valores de acuerdo a su representación gráfica.
Estas medidasdescriben la manera como los datos tienden a reunirse
de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las
características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y
la Curtosis.
Coeficiente de Pearson
El índice numérico más común usado para medir una correlación es el
“coeficiente de Pearson”. El coeficiente de Pearson (también llamado
coeficiente de correlación del producto-momento), serepresenta con el símbolo
‘r’ y proporciona una medida numérica de la correlación entre dos variables.Es
útil reconocer la fórmula usada para calcular el coeficiente de Pearson (es
posible que vea documentos en que se haga referencia a ella). Le entregamos la fórmula en una nota al pie de esta página.
No deje que la fórmula lo intimide. No necesita comprender la fórmula para
comprender el concepto de correlación. Aunque si hace un esfuerzo va a
comprender la fórmula en poco tiempo y con claridad.Recuerde que al describir
la relación entre dos variables, necesitamos responder al menos cuatro preguntas:(1) sEstán relacionadas las variables entre
sí? Si los cambios en el valor de una de las variables van acompañados de
cambios en el valor de la otra, las variables parecen estar relacionadas.(2) Si
las variables parecen estar relacionadas, squé tan fuerte es la relación entre
las variables? En otras palabras, sestán estrechamente o sólo levemente
relacionadas?(3) sLa relación entre las variables es ‘positiva’ o
‘negativa’?(4) sCuál es la relación causal entre las variables?El
coeficiente de Pearson no entrega respuestas a tres de estas cuatro preguntas:
(1) sobre la pregunta uno, nos indica si dos variables parecen estar
correlacionadas o no; (2) con respecto a la pregunta dos, el coeficiente de
Pearson indica la fuerza de la aparente relación; y (3) el coeficiente, por
último, nos indica si la aparente relación es positiva o negativa. Como ya sabemos, el análisis de correlación no puede responder a la
última pregunta.
El coeficiente de correlación dePearson (r) se mide en una escala de 0 a 1,
tanto en dirección positiva como negativa. Un
valor de “0” indica que no hay relación lineal entre las variables. Un valor de “1” o “–1” indica, respectivamente, una
correlación positiva perfecta o negativa perfecta entre dos variables.
Normalmente, el valor de se ubicará en alguna parte entre 0 y 1 o entre 0 y
–1.En las ciencias sociales en general y en educación en particular, donde la
mayoría de las variables son simultáneamente afectadas por una gran multitud
factores, una correlación positiva de 0,7 o una correlación negativa de –0,7 se
considera muy fuerte. (Por último, tenga en mente el
coeficiente de Pearson mide sólo relaciones lineales entre variables, y no es
útil para medir relaciones que no son lineales.)Cuadro 15. El coeficiente de Pearson de correlación. Valor del
Coeficiente de Pearson | Grado de Correlación
entre las Variables |
r = 0 | Ninguna correlación |
r = 1 | Correlación positiva perfecta |
0 < r < 1 | Correlación positiva |
r = -1 | Correlación negativa perfecta |
-1 < r < 0 | Correlación negativa |
Nótese que una correlación negativa no es menos fuerte que una correlación
positiva. Así, por ejemplo, un de 0 es tan ‘grande’
o fuerte como
un de –0,5. Los signos positivos y negativos sólo indican si el valor de una
variable aumenta o disminuye, respectivamente, con el aumento en el valor de la
otra variable. Como usted sabe, cuando los aumentos (disminuciones) de una variable
producen aumentos (disminuciones) en la otra, la relación es positiva. Es negativacuando los aumentos (disminuciones) de una variable
producen disminuciones (aumentos) en la otra.
Según su opinión, slas calificaciones profesionales de los maestros
están correlacionadas en forma positiva o negativa con el rendimiento de los
estudiantes? sQué sucede con el tamaño de la clase? sY el
gasto en educación? |
Coeficiente de correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es un índice que mide la relación lineal entre
dos variables aleatorias cuantitativas. A
diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como
un índice que puede utilizarse para medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas.
Definición
En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población estadística; el
coeficiente de correlación de Pearson se simboliza con la letra , siendo
la expresión que nos permite calcularlo:
Donde:
es la covarianza de
es la desviación típica de la variable
es la desviación típica de la variable
De manera análoga podemos calcular este coeficiente sobre un estadístico
muestral, denotado como a:
Interpretación
El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta. El índice indica
una dependencia total entre las dos variables denominada relación directa:
cuando una de ellas aumenta, la otra también lo haceen
proporción constante.
Si 0 < r < 1, existe una correlación
positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente
implica que las variables son independientes: pueden existir todavía relaciones
no lineales entre las dos variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica
una dependencia total entre las dos variables llamada relación inversa:
cuando una de ellas aumenta, la otra disminuye en
proporción constante.
Karl Pearson
Karl Pearson.
Karl Pearson (Londres 27 de marzo de 1857- Londres, 27
de abril de 1936) fue un prominente
científico, matemático y pensador británico, que estableció la disciplina de
la estadística matemática. Desarrolló una intensa
investigación sobre la aplicación de los métodos estadísticos en
la biología y fue el fundador de la bioestadística.
Fue un positivista radical, en la tradición
de Berkeley y Ernst Mach. Era partidario de la eugenesia1 y
un se dice que fue llevado entre los parientes puritanos que tenía
en York, y que supuestamente tuvo un hijo ilegítimo.
La familia de Karl era disidente y de tendencia puritana. A la edad de 22, Karl
rechazó el cristianismo y adoptó el librepensamiento como
una fe no religiosa que estaba fundada en la ciencia, aunque distinguió sus
pensamientos de los librepensadores tradicionales.
”Carl” se convirtió en ”Karl” inadvertidamente cuando la Universidad de
Heidelberg cambió la manera de escribir su nombre cuando se matriculó
en 1879, aunque usó ambas variantes de sunombre
hasta 1884 cuando finalmente adoptó “Karl” – presuntamente
por Karl Marx, a quien conoció en vida – y con el tiempo llegó a ser
conocido universalmente como “KP”.
Pearson fue también un
exitoso historiador y germanista. Estuvo gran
parte de la década de 1880 en Berlín, Viena, Saig bai Lenzkirch y
Brixlegg. Escribió acerca de religión, Goethe, Werther,
así como temas
relacionados con sexo, como
por ejemplo, Olive Schreiner.
En 1890 se casó con Maria Sharpe, quien estaba relacionada a las
familias Kenrick, Reid, Rogers y Sharpe. Estas familias eran no-conformistas de
fines del siglo XVIII
y de gran parte del
siglo XIX, muy asociadas con Londres. Entre los numerosos miembros de la
familia se encontraban personajes bien conocidos, como el poeta Samuel Rogers,
el abogado Sutton Sharpe, el filántropo Samuel Sharpe, y John Kenrick.
Karl y María se conocieron en el Men and Women’s Club, cofundado por Karl,
y cuya finalidad era permitir libre discusión entre hombres y mujeres. Karl y María tuvieron dos hijas. Se
llamaron Sigrid Loetitia Pearson y Helga Sharpe Pearson. También
tuvieron un hijo llamado Egon Sharpe Pearson. María
murió en 1928 y al año siguiente Karl se casó con Margaret Child, una
colega de la Universidad de Londres.
Contenido ocultar] 1 Educación y
sus primeros trabajos2 Einstein y el trabajo de Pearson3 Véase
también4 Bibliografía5 Referencias |
Educación y sus primeros trabajos
Karl Pearson tuvo educación privada en la University College
School. Luego, fue al
colegio polivalente Rauli en Cambridge a estudiar
matemática.Posteriormente, invirtió parte de 1879 y 1880
estudiando literatura alemana medieval y del siglo XVI en
las universidades de Berlín y Heidelberg. Se volvió suficientemente
conocido en esta área y se le ofreció un puesto
de estudios germánicos en Cambridge.
Su nueva movida de carrera fue en la asociación profesional de I Temple,
donde estudió derecho hasta 1881, aunque nunca ejerció la
profesión de abogado. Después de esto, volvió a la matemática como
profesor en el King’s College en Londres, en 1888. En 1891, se
convirtió en profesor de Geometría en el Gresham College, donde
conoció a Walter Frank Raphael Weldon, un zoólogo que tenía unos interesantes
problemas que requerían soluciones. La colaboración que Pearson le prestó
en biometría y teoría evolucionaria dio muchos frutos y
duró hasta que Weldon murió en 1906.
Weldon había presentado a Pearson a Francis Galton, primo de Charles
Darwin, quien estaba interesado en los aspectos de la evolución, como
la herencia y la eugenesia. Pearson se
convirtió en el protegido de Galton. Luego de la muerte de Galton
en 1911, Pearson se embarcó en la producción de la biografía de Galton —un trabajo de tres volúmenes de narrativa, cartas,
genealogías, comentarios y fotografías—, publicada
en 1914, 1924 y 1930, con mucho del financiamiento personal de Pearson para
la impresión. La biografía, según Pearson, hecha “para satisfacerme a mí mismo
y sin observancia a los estándares tradicionales, la necesidad de las
editoriales o los gustos del público”, exaltaba la vida de Galton, su trabajo y
su herencia personal.Pearson predijo que Galton, en vez de Charles Darwin,
sería recordado como el nieto más prodigioso de Erasmus Darwin.
Cuando Galton murió, este dejó parte de su herencia a
la Universidad de Londres para un puesto de investigación en
eugenesia. En concordancia con los deseos de Galton, Pearson fue el primer
ocupante de este puesto, donde formó, con apoyo financiero de la Drapers’
Company, un departamento de estadística aplicada, en el que Pearson incorporó
el laboratorio biométrico y el laboratorio Galton. Pearson
permaneció en el departamento hasta su retiro en 1933, y continuó
trabajando hasta su muerte en 1936.
[editar]Einstein y el trabajo de Pearson
Cuando Einstein -de 23 años- comenzó un grupo de estudio,
la Academia Olimpia, con sus dos amigos más jóvenes, Maurice
Solovine y Conrad Habicht, él sugirió que el primer libro a leer
debía ser La Gramática de la Ciencia, de Pearson. Este
libro trataba sobre varios temas que más tarde se convirtieron en parte de las
teorías de Einstein y otros científicos. Pearson aseveró que las leyes
de la naturaleza son relativas a la habilidad perceptiva del observador. La
irreversibilidad de los procesos naturales, decía Pearson, es puramente una
concepción relativa. Un observador que viaja a
exactamente la velocidad de la luz vería un eterno momento, o una ausencia de
movimiento. Él especuló que un observador que viaje
más de la luz podría ver el tiempo al revés, de manera similar a una película
de cine puesta al revés. Pearson también discutió la antimateria,
la cuarta dimensión y arrugas en el
tiempo.Su relativismo está basado en un idealismo,
en el sentido de ideas o imágenes para una mente.
Probabilidad
La probabilidad mide la longitud y fuerza con la que se obtiene un resultado (o conjunto de resultados) luego de llevar a
cabo un experimento aleatorio, del
que se conocen todos los resultados posibles, bajo
condiciones suficientemente estables. La teoría de la
probabilidad se usa
extensamente en áreas como
la estadística, la física, la matemática, lasciencias y
la filosofía para sacar conclusiones sobre la probabilidad discreta
de sucesos potenciales y la mecánica subyacente discreta de sistemas complejos.
Proporción |
|
La proporción muestra los tamaños relativos de dos o más valores.
Las proporciones pueden mostrarse de diferentes maneras.
Usando el ':' para separar los valores, o como un solo número
dividiendo un valor para el total.
Ejemplo: si hay un niño y tres niñas la proporción podría escribirse así
1:3 (por cada niño hay 3 niñas)
1/4 son niños y 3/4 son niñas
0.25 son niños (dividiendo 1 por 4)
25% son niños (0.25 como porcentaje) |
Población estadística
(Redirigido desde «Población (estadística)»)
Población estadística, en estadística, también
llamada universo o colectivo, es el conjunto de elementos de
referencia sobre el que se realizan unas de las observaciones.
Población
Para otros usos de este término, véase Población
(desambiguación).
Mapa de países por población absoluta.
La población mundial ha pasado de los casi 1.000 millones en el
año 1800 a más de 6.000 millones en el año 2000 y de 7.000
millonesen2011.1 2
Población humana, en sociología y biología, es el grupo
de personas que vive en un área oespacio geográfico. Para
la demografía, centrada en el estudio estadístico de las poblaciones
humanas, la población es un conjunto renovado en el que entran nuevos
individuos -pornacimiento o inmigración- y salen otros -por muerte o emigración-.3 La
población total de un territorio o localidad se determina por procedimientos
estadísticos y mediante el censo de población.
La evolución de la población y su crecimiento o decrecimiento,
no solamente están regidos por el balance de nacimientos y muertes, sino
también por el balance migratorio, es decir, la diferencia
entre emigración e inmigración; la esperanza de vida y
el solapamiento intergeneracional.4 Otros aspectos del comportamiento humano
de las poblaciones se estudian en sociología, economía y geografía,
en especial en la geografía de la población y en la geografía
humana.
Conceptos de población
El concepto de población no solamente es distinto para cada disciplina teórica,
incluso para una misma disciplina el concepto de población admite muchas
definiciones.5
Concepto de población en demografía
En demografía la población puede ser entendida como objeto de análisis o como
mero volumen poblacional contabilizado en un determinado momento.5
Población como sistema reproductivo
La población se entiende como una estructura con continuidad en el tiempo
compuesto por personas de las cuales se estudian las características y
comportamientos que condicionan dicha permanencia, esdecir, las características
de su supervivencia previa al fallecimiento y el modo de sustitución de las
personas que mueren por nuevos individuos.5
Massimo Livi Bacci, define la población de la siguiente
manera:6 7
Por población se entiende un conjunto de individuos, constituido de forma
estable, ligado por vínculos de reproducción e identificado por
características territoriales,políticas, jurídicas, étnicas o religiosas
Una población, pues, se definirá como tal si tiene continuidad en
el tiempo y si esta continuidad está asegurada por vínculos de
reproducción que ligan padres e hijos y garantizan la sucesión de las
generaciones. Finalmente, una población se define también por las
características que trazan su perfil y sus límites. Los límites y fronteras de
las distintas poblaciones son tales que los agregados así definidos asumen su
propia autonomía y estabilidad, reproduciéndose y conservándose en el tiempo.6
Población como volumen poblacional en un instante
La población es el número de personas en un momento y lugar o país dados.
[editar]Concepto de población en otras disciplinas
Para disciplinas como la antropología, la biología,
la sociología, la estadística, las ciencias actuariales, el
concepto de población es distinto y remite, en general, a grupos de población
estudiados por algunas de sus características previamente determinadas para ser
objeto de estudio. Aunque algunas de las técnicas de estas
disciplinas, sobre todo estadísticas, son utilizadas por la demografía, su
objeto es otro.
OJIVA
OJIVA
Muestraestadística
En estadística una muestra estadística (también
llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población
estadística.
Las muestras se obtienen con la intención de inferir propiedades de la
totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir
esta característica la inclusión de sujetos en la muestra debe seguir
una técnica de muestreo. En tales casos, puede obtenerse una
información similar a la de un estudio exhaustivo con
mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra,
más abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio
de toda la población porque el manejo de un menor
número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los
sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la
población, pero suficiente para que la estimación de los parámetros
determinados tenga un nivel de
confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso
recurrir a su cálculo.
Otras definiciones relacionadas
Espacio Muestral
El espacio muestral del
que se toma una muestra concreta está formado por el conjunto de todas las
posibles muestras que se pueden extraer de una población mediante una
determinada técnica de muestreo.
[editar]Parámetro o Estadístico muestral
Un parámetro estadístico o simplemente un estadístico muestral es
cualquier valor calculado apartir de la muestra, como por ejemplo
la media, varianza o una proporción, que describe a una
población y puede ser estimado a partir de una muestra. Valor
de la población.
[editar]Estimación
Una estimación es cualquier técnica para conocer un
valor aproximado de un parámetro referido a la población, a partir de los
estadísticos muestrales calculados a partir de los elementos de la muestra.
[editar]Nivel de confianza
El nivel de confianza de una aseveración basada en la inferencia
estadística es una medida de la bondad de la estimación realizada a partir
de estadísticos muestrales.
[editar]Ejemplo
La descripción de una muestra, y los resultados obtenidos sobre ella, puede ser
del tipo
mostrado en el siguiente ejemplo
Dimensión de la población: ej. 222.222 habitantes
Probabilidad del evento: ej. Hombre o Mujer 50%
Nivel de confianza: ej. 96%
Desviación tolerada: ej. 5% Resultado ej. 196
Tamaño de la muestra: ej. 270
La interpretación de esos datos sería la siguiente
La población a investigar tiene 222.222 habitantes y queremos saber
cuántos son hombres o mujeres.
Estimamos en un 50% para cada sexo y para el propósito
del estudio
es suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5.
Generamos una tabla de 270 números al azar entre 1 y 222.222 y en un censo numerado comprobamos el género para los
seleccionados.
[editar]Ventajas de la elección de una muestra
El estudio de muestras es preferible, en la mayoría de los casos, por las
siguientes razones
Sila población es muy grande (en ocasiones, infinita, como ocurre en determinados experimentos
aleatorios) y, por tanto, imposible de analizar en su totalidad.
Las características de la población varían si el estudio se
prolonga demasiado tiempo.
Reducción de costos: al estudiar una pequeña parte de la población, los
gastos de recogida y tratamiento de los datos serán menores que si los
obtenemos del
total de la población.
Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se
consigue mayor rapidez.
Viabilidad: la elección de una muestra permite la realización de estudios
que serían imposible hacerlo sobre el total de la población.
La población es suficientemente homogénea respecto a la característica medida,
con lo cual resultaría inútil malgastar recursos en un
análisis exhaustivo (por ejemplo, muestras sanguíneas).
El proceso de estudio es destructivo o es necesario consumir un
artículo para extraer la muestra (ejemplos: vida media de una bombilla, carga
soportada por una cuerda, precisión de un proyectil, etc.).
[editar]Descripción matemática de una muestra
aleatoria
El uso de muestras para deducir fiablemente
características de la población requiere que se trate con muestras
aleatorias. Si la muestra estadística considerada no
constituye una muestra aleatoria las conclusiones basadas en dicha muestra no
son fiables y en general estarán sesgadas en algún aspecto.
En términos matemáticos, dada una variable aleatoria X con
una distribución de probabilidad F, una muestra aleatoria de
tamaño N es un conjunto finitode N variablesindependentes,
con la misma distribución de probabildad F.1
Otra forma más intuitiva, de entender una muestra es considerar que una muestra
es una sucesión de N experimentos independientes de una misma
cantidad. Es importante diferenciar una muestra de tamaño N, o más
exactamente un muestreo de tamaño N, del resultado concreto de de los N experimentos
(que como
conjunto de valores fijos, en sí mismo, no es una muestra). El
concepto de muestra incluye de alguna manera el procedimiento escogido para obtener
los datos (es decir, si las variables aleatorias consideradas son
independientes entre sí, y si tienen la misma distribución).
En general, resulta muy difícil comprobar si una determinada
muestra es o no aleatoria, cosa que sólo puede hacerse considerando otro tipo
de muestreos aleatorios robustos que permitan decir si la primera muestra era
aleatoria o no.
[editar]
Evento estadístico
En estadística, un evento o suceso es
un subconjunto de un espacio muestral, es decir, un conjunto de
posibles resultados que se pueden dar en un experimento
aleatorio.
Formalmente, sea Ω un espacio muestral, entonces
un evento es un subconjunto ,
donde son una serie de posibles resultados.
Se dice que un evento A ocurre, si el resultado del experimento aleatorio
es un elemento de A.
Tipos de eventos
Evento simple o suceso elemental
Un suceso o evento simple es un subconjunto
del espacio muestral que contiene un único elemento.
Ejemplos de espacios muestrales y sucesos elementales:
Si se trata de contar objetos y el espacio muestral S = (los números naturales), entonces los sucesos elementales son cada
uno de los conjuntos , donde k N.
Si se lanza una moneda dos veces, S = , donde (c
representa 'sale cara' y s, 'sale cruz'), los sucesos
elementales son , , y .
Si X es una variable aleatoria normalmente
distribuida, S = (-∞, +∞), los números reales, los
sucesos elementales son todos los conjuntos , donde x
Los sucesos elementales pueden tener probabilidades que son
estrictamente mayores que cero, cero, no definidas o cualquier combinación de
estas. Por ejemplo, la probabilidad de cualquier variable aleatoria
discreta está determinada por las probabilidades asignadas a los sucesos
elementales del
experimento que determina la variable. Por otra parte,
cualquier suceso elemental tiene probabilidad cero en cualquier variable
aleatoria continua. Existen distribuciones mixtas que no son
completamente continuas, ni completamente discretas,
entre las que pueden darse ambas situaciones.
[editar]Otros sucesos
Un evento compuesto es un subconjunto .
Los eventos triviales son el conjunto
universal Ω y el conjunto vacío. Al
primero se le llama también evento seguro o cierto, y al
segundo, evento imposible.
Sean dos eventos A y B, si ambos
son conjuntos disjuntos, entonces ellos son eventos excluyentes.
Un evento con elementos infinitos pero numerables se
llama σ-álgebra (sigma-álgebra), y un evento con elementos
finitos se llama álgebra de sucesos de Boole.
[editar]Propiedades
Dados dos eventos y , entonces:
El evento ocurresi y ocurren a la vez.
El evento ocurre si por lo menos
ocurre , o ambos.
ï‚· sQUÉ ES LA MEDIA ARITMETICA, LA MODA, LA MEDIANA, LA DESVIACIÓN MEDIA Y LA
DESVIACIÓN ESTANDÁR?
Son valores que tipifican una muestra y en torno de los
cuales se agrupan la mayoría de los datos, estos se denominan estadígrafos.
A continuación definiremos cada uno de estos.
MEDIA ARITMETICA: Corresponde a la suma de todos los datos dividido por el
numero total de ellos. Es lo que se conoce como
'promedio'. La media aritmética es uno de los estadígrafos más
usados, por el hecho de ser de muy fácil cálculo.
MODA: Corresponde al valor que mas se repite, ésta sirve para describir una
distribución si sólo se desea tener una idea aproximada y rápida de donde está
la mayor concentración de observaciones. También se la
utiliza para describir la forma de algunas distribuciones. Puede ocurrir
que en un conjunto de datos no haya moda, como en: 3; 4; 7; 9; 10;
11; 13. O también que haya varios valores con la mayor frecuencia, en estos
casos la moda queda indeterminada.
MEDIANA: La mediana es aquel valor que ocupa el lugar central, de modo que la
mitad de los casos queda por debajo de ese valor y la
otra mitad por encima. Por ejemplo si consideramos: 2; 3; 5; 7; 11; 13;
16; 18; 25. La mediana es M = 11. Si el conjunto de valores es un número par, entonces se calcula la media aritmética a los
dos valores del
centro.
DESVIACION MEDIA: Corresponde a la diferencia numérica entre una medida individual
o número y la media aritmética de una serie completa de tales medidas o
números. Por ejemplo,si la media de alturas de todos los alumnos de un curso es
1,51 m y uno de ellos mide 1,63m, la desviación media de su altura con respecto
a la media es de +0.12 metros.
DESVIACIÓN ESTANDAR: Es un dato que representa la
variabilidad existente en un conjunto de datos, ya que por ejemplo dos
conjuntos de datos pueden presentar la misma media aritmética, pero poseer
distinta variabilidad, por eso este estadígrafo nos permite saber acerca de la
variabilidad o dispersión de los datos. Matemáticamente se define como 'la
raíz cuadrada del promedio de los cuadrados de las desviaciones medias de cada
valor de la variable con respecto de la media aritmética'
Intervalos de confianza |
|
|
| I- Concepto de Intervalo de Confianza.En el contexto de estimar un parámetro
poblacional, un intervalo de confianza es un rango de valores (calculado en una
muestra) en el cual se encuentra el verdadero valor del parámetro, con una
probabilidad determinada. |
|
Intervalo de confianza
Las líneas verticales representan 50 construcciones diferentes de intervalos de
confianza para la estimación del valor μ.
En estadística, se llama intervalo de confianza a un par de
números entre los cuales se estima que estará cierto valor desconocido con una
determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de
una muestra, y el valor desconocido es un parámetro poblacional. La
probabilidad de éxito en la estimación serepresenta con 1 - α y
se denomina nivel de confianza. En estas
circunstancias, α es el llamado error aleatorio o nivel
de significación, esto es, una medida de las posibilidades de fallar en la
estimación mediante tal intervalo.1
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de
forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor
nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una
estimación más precisa, aumentan sus posibilidades de error.
Para la construcción de un
determinado intervalo de confianza es necesario conocer
la distribución teórica que sigue el parámetro a
estimar, θ. Es habitual que el parámetro presente
una distribución normal. También pueden construirse
intervalos de confianza con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - α por ciento para la
estimación de un parámetro poblacional θ que sigue una
determinada distribución de probabilidad, es una expresión del tipo
[θ1, θ2] tal que P[θ1 ≤
θ ≤ θ2] = 1 - α, donde P es la función
de distribución de probabilidad de θ.
ï‚· sA QUE SE LLAMA 'MARCA DE CLASE'?
Se le llama marca de clase a los valores representativos de todos los valores
incluidos en el intervalo respectivo; equivale a la semisuma de los límites
inferior y superior de un intervalo.
La marca de clase es el punto medio de cada intervalo.
La marca de clase es el valor que representa a todo
el intervalo para el cálculo de
algunos parámetros como la media artmética o
la desviación típica.
Se representa por ci o xi.Ejemplo
| xi | fi | xi · fi | xi2 · fi |
[10, 20) | 15 | 1 | 15 | 225 |
[20, 30) | 25 | 8 | 200 | 5000 |
[30,40) | 35 | 10 | 350 | 12 250 |
[40, 50) | 45 | 9 | 405 | 18 225 |
[50, 60) | 55 | 8 | 440 | 24 200 |
[60,70) | 65 | 4 | 260 | 16 900 |
[70, 80) | 75 | 2 | 150 | 11 250 |
| | 42 | 1 820 | 88 050 |
Intervalo de clase
Los intervalos de clase se emplean si las variables toman un número
grande de valores o la variable es continua.
Se agrupan los valores en intervalos que
tengan la misma amplitud denominados clases. A cada clase se le asigna sufrecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de
la clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre
el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de
cada intervalo y es el valor que representa a todo
el intervalo para el cálculode algunos parámetros.
Construcción de una tabla con Intervalos de clase
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1s se localizan los valores menor y mayor de la distribución.
En este caso son 3 y 48.
2s Se restan y se busca un número entero un poco mayor
que la diferencia y que sea divisible por el número de intervalos de queramos
poner.
Es conveniente que el número de intervalos oscile entre 6 y
15.
En este caso, 48 - 3 = 45, incrementamos el número hasta
5 = 10intervalos.
Se forman los intervalos teniendo presente que el límite
inferior de una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.
| ci | fi | Fi | ni | Ni |
[0, 5) | 2.5 | 1 | 1 | 0.025 | 0.025 |
[5, 10) | 7.5 | 1 | 2 | 0.025 | 0.050 |
[10, 15) | 12.5 | 3 | 5 | 0.075 | 0.125 |
[15, 20) | 17.5 | 3 | 8 | 0.075 | 0.200 |
[20, 25) | 22.5 | 3 | 11 | 0.075 | 0.2775 |
[25, 30) | 27.5 | 6 | 17 | 0.150 | 0.425 |
[30, 35) | 32.5 | 7 | 24 | 0.175 | 0.600 |
[35, 40) | 37.5 | 10 | 34 | 0.250 | 0.850 |
[40, 45) | 42.5 | 4 | 38 | 0.100 | 0.950 |
[45, 50) | 47.5 | 2 | 40 | 0.050 | 1 |
| | 40 | | 1 | |
CONSTRUYE 10 INTERVALOS DE CLASE CON LOS DATOS PROPORCIONADOS Y ELABORA LA
TABLA DE FRECUENCIAS CORRESPONDIENTE.
Se organizan los datos de menor a mayor.
810 810 815 815 816 830 830 830 831 833 833 835 835 835 836 836 837 837
839 840 840 840 844 844 844 849 849 853 853 856 856 858 858 860 869 873
873 881 881 883 884 884 888 888 888 888 889 889
2 Se saca el rango.
Xn (núm. mayor 889
X1 (núm. menor)= 810
Rango: Xn-X 1 = 79
3.- Se divide el rango entre el número de intervalos (K) que se piden. En este caso son 10.
79/10= 7.9 ----- ----- ------------ se
redondea a 8.
Se construirán intervalos cuya amplitud es igual a
8 y se comenzará con un número anterior al primer intervalo.
No. INTERVALOS LIMITES DE CLASE INTERVALO DE CLASE FRECUENCIA ABSOLUTA (fi)
FRECUENCIA ABSOLUTA ACUMULADA
(Fi) FRECUENCIA RELATIVA
(hi) FRECUENCIA RELATIVAACUMULADA
(Hi)
1 809 817 809-817 5 5 0.104166667 0.104166667
2 818 826 818-826 0 5 0 0.104166667
3 827 835 827-835 9 14 0.1875 0.291666667
4 836 844 836-844 11 25 0.229166667 0.520833333
5 845 853 845-853 4 29 0.083333333 0.604166667
6 854 862 854-862 5 34 0.104166667 0.708333333
7 863 871 863-871 1 35 0.020833333 0.729166667
8 872 880 872-880 2 37 0.041666667 0.770833333
9 881 889 881-889 11 48 0.229166667 1
10 890 898 890-898 0 48 0 1
48 1 [continua]
Límites de clase
Cada clase está delimitada por el límite inferior de
la clase y el límite superior de la clase.
En una distribución de frecuencias agrupadas el límite
inferior de una clase pertenece al intervalo, pero
el límite superiorno pertenece intervalo, se cuenta en el siguiente
intervalo.
Ejemplo
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
| ci | fi | Fi | ni | Ni |
[0, 5) | 2.5 | 1 | 1 | 0.025 | 0.025 |
[5, 10) | 7.5 | 1 | 2 | 0.025 | 0.050 |
[10, 15) | 12.5 | 3 | 5 | 0.075 | 0.125 |
[15, 20) | 17.5 | 3 | 8 | 0.075 | 0.200 |
[20, 25) | 22.5 | 3 | 11 | 0.075 | 0.2775 |
[25, 30) | 27.5 | 6 | 17 | 0.150 | 0.425 |
[30, 35) | 32.5 | 7 | 24 | 0.175 | 0.600 |
[35, 40) | 37.5 | 10 | 34 | 0.250 | 0.850 |
[40, 45) | 42.5 | 4 | 38 | 0.100 | 0.950 |
[45, 50) | 47.5 | 2 | 40 | 0.050 | 1 |
| | 40 | | 1 | |
Límites de clase: representan el tamaño de cada clase. El límite inferior de la
primer clase toma el valor de el dato menor de lacolección de datos, para
obtener el límite inferior de la clase siguente, se suma al límite inferior de
la case anterior el tamaño de clase.
Límites reales de clase: se obtienen sumando al LS de la clase el Lide la clase
contigua superior y dividiendo entre dos.
Marca de clase: Es el punto medio de la clase y se obtiene sumando los LI y LS
de la clase y dividiendo entre 2. La marca de clase también se llama
punto medio de la clase.
COEFICIENTE DE CONFIANZA
5. ESTIMACIÓN POR INTERVALOS.
Nos proponemos determinar dos números entre los cuales se halla el parámetro
estudiado con cierta certeza.
El procedimiento para obtener un intervalo (de confianza) para un parámetro, la
media , por ejemplo, requiere de la determinación
de un estimador del parámetro y de la
distribución del
estimador.
Ejemplo
Tratamos de obtener un intervalo de confianza para la
media de una población normal.
Sabemos que si X sigue una normal de media y varianza entonces la
media muestral sigue una normal de la misma media y de varianza la varianza
poblacional partida por n, tamaño de la muestra.
Vamos a determinar a y b tales que P[a<<b]=0´95.
Para calcular estos valores es necesario
estandarizar X
= 0´95.
Por lo tanto = 0´95.
En realidad hay infinitos pares de números para los que se cumple la ecuación
anterior. De éstos vamos a escoger el par de números
que se hallan situados simétricamente respecto de cero en la distribución normal.
Llegamos a que
y
A partir de estas ecuaciones obtenemos a = y b
Con lo que obtendríamos.
O lo que es lo mismo .
El intervalo sellama intervalo (aleatorio) de confianza para .
A partir de los datos muestrales podemos determinar el valor de y obtenemos
así un intervalo numérico. El valor
1´96 se debe a que pedíamos una probabilidad de 0´95. Para
indicar el intervalo para cualquier valor de probabilidad podemos utilizar la expresión . Expresión que puede simplificarse .
, se llama longitud del
intervalo.
Un intervalo de confianza para un
parámetro es un intervalo construido alrededor del
estimador del parámetro de tal manera que
podemos esperar que el verdadero valor del
parámetro quede incluido en dicho intervalo.
El nivel de confianza de un intervalo es una probabilidad(expresada
en porcentaje) que representa la seguridad de que el intervalo encierra el
verdadero valor del
parámetro .
En el ejemplo el nivel de confianza es del
95%.En general el nivel de confianza se expresa en la forma 100(1 %. (1 =0´95. El valorrepresenta
la probabilidad de que el parámetro quede fuera del intervalo y en
este caso es 0´5. Esta situación la representaremos en el siguiente gráfico
Para cada nivel de confianza existe un valor
de tabla ( normal, t ,, F) asociado al nivel de confianza dado. Este valor se
llama coeficiente de confiabilidad y se denota:
NORMAL | DISTRIBUCIÓN T | JI CUADRADO | DISTRIBUCIÓN F |
Si queremos un intervalo con un nivel de confianza de 100(1-)%, en la tabla
correspondiente buscaremos un valor de variable para el que el área de cola
superior(también inferior) sea del 100(1-/2)% ya que la porción de área que no
será cubierta por el intervalodebe tener una medida de tamaño y se toma
como norma general de procedimientoque se reparta en partes iguales entre las
dos colas.
Los tres conceptos básicos que encierra un intervalo quedan resumidos en
la expresión general para un intervalo de confianza
ESTIMADOR (COEF. DE CONF.) . (ERROR ESTÁNDAR)
Ejemplo
Sea X la variable aleatoria que se utiliza para designar el peso de un pasajero
de avión y que interesa conocer , el peso medio de todos los pasajeros. Para ello
tomamos una muestra de 36 pasajeros y obtenemos una media muestral de 160
libras. Supongamos que la distribución de los
pasajeros sea normal con desviación estándar 36. Calcula el intervalo del 95% de confianza
El intervalo está dado por la expresión ,
reemplazamos los valores y obtenemos 160(1´96).(30/6). Por lo tanto el
intervalo pedido es: [150´2,169´8].
Si nos hubieran pedido un intervalo del
90% de confianza tendríamos 160(1´645) 30/6). Y el intervalo pedido es [151´78,168´23].
Podríamos construir también un intervalo de confianza del 99% obteniendo 160(2´575) 30/6). Y el intervalo sería
[147´13,172´88].
Al observar los intervalos podemos notar que a medida que se aumenta el nivel
de confianza la longitud del
intervalo también aumenta como
podemos ver en la figura.
Tenemos las siguientes propiedades sobre la longitud del intervalo
PROPIEDAD 1. Para un tamaño de muestra y una varianza
dada a medida que aumenta el nivel de confianza también lo hace la longitud del intervalo
PROPIEDAD 2. Para un nivel de confianza y una
varianza dadas cuando el tamaño de la muestraaumenta la longitud del intervalo disminuye.
Estas propiedades se deducen de la expresión de la longitud del intervalo L=. Como podemos ver si la
varianza se considera fija la fórmula está sujeta a dos números cuyas acciones
se contraponen en cuanto a la longitud, el nivel de confianza y
el tamaño de la muestra
Para que un intervalo
sea tomado en cuenta con algún interés, el nivel de confianza debe ser alto.
Suelen presentarse dos interpretaciones para un
intervalo de confianza, una probabilísticay otra práctica. Veamos
cómo son en el caso de la media
Desde un punto de vista de la probabilidad se dice: “En el muestreo
aleatorio simple de una población normal de media y
varianza conocida, el
100(1-)% de todos los intervalos de la forma incluirá la media
desconocida ”.
Aplicando esto al ejemplo anterior podemos decir que de 100 muestras
de tamaño 36 que escojamos de los pasajeros del avión, 95 de
ellas(aproximadamente) producirán intervalos que contendrán el verdadero peso
promedio . O lo que es lo mismo, de 100 intervalos obtenidos por la
fórmula anterior 95 de ellos contendrán el verdadero valor del parámetro.
De la interpretación probabilística se desprende la práctica que se
establece así: ”Si se realiza un muestreo aleatorio simple en una población
normal con media y varianza conocida , se tiene el 100(1-)% de
confianza de que el intervalo particular contendrá el verdadero valor del
parámetro desconocido ”
CAMPANA DE GAUSS |
A la campana de Gauss también se le conoce en probabilidad
como distribución normal |
| La campana de Gausses un modelo de distribución de probabilidad descrito por
el matemático y físico alemán Carl Friederich Gauss (1777-1855).Esta curva,
también conocida como distribución normal es una función de probabilidad
continua y simétrica, cuyo máximo es la media y tiene dos puntos de inflexión
situados en ambos laados. Un punto de inflexión es el
que separa la parte cóncava de la convexa de la campana.
Esta gráfica representa el acomportamiento de los valores de una población o
universo de eventos, cuyas variacionses sólo están influenciadas por fenómenos
aleatorios.Muestra es un valor representativo del conjunto total
llamado universo o población.
Frecuencia es el número de veces que cada valor se repite.
Moda es el valor que más se repite.
Promedio o media (m) es el cociente de la suma de todos los valores
entre la cantidad de valores.
Mediana es el valor que ocupa la posición central, cuando los
valores se ordenan de mayor a menor.
Desviación estandár (s) es una medida de qué tanto se
dispersan los valores, alejándose mucho o poco de la media.
Los parámetros necesarios para dibujar el gráfico de la distribución normal son
m y s, con los cuales sabemos dónde situar la campana de Gauss (punto
correspondiente a m) y cuál es su ancho (determinado por s) .
En esta exhibición, se tienen 2,166 balines y 43 casillas.
Cada balín que cae en alguna de las casillas, es un evento.La moda es 21,
porque corresponde al número de casilla que registra una mayor frecuencia;
también es la mediana, pues es la que ocupa la posición central.El promedio
seobtiene de dividir la suma acumulada del producto del número de casilla por
la cantidad de balines que contiene, entre el número total de eventos.
Área bajo la curva |
Desviación Fracción total de área incluída |
0.675 | 50.00 % |
1.0 | 68.28 % |
2.0 | 95.46 % |
3.0 | 99.72 % |
4.0 | 99.99 % |
| 100 % |
La variable de la cual se pretende estudiar su comportamiento, es el número de
casilla (c).
NOTA: Los valores cambian cada vez que se realiza el experimento.
Los valores aquí mostrados corresponden a un ejemplo del experimento real.
|
Distribución normal
Distribución normal |
La línea verde corresponde a la distribución normal estándar
Función de densidad de probabilidad |
Función de distribución de probabilidad |
Parámetros
Dominio
Función de densidad(pdf)
Función de distribución(cdf)
Media
Mediana
Moda
Varianza
Coeficiente de simetría | 0 |
Curtosis | 0 |
Entropía
Función generadora de momentos (mgf)
Función característica
En estadística y probabilidad se llama distribución
normal, distribución de Gauss o distribución gaussiana, a una de
las distribuciones de probabilidad de variable continua que
con más frecuencia aparece aproximada en fenómenos reales.
La gráfica de su función de densidad tiene una forma
acampanada y es simétrica respecto de un
determinadoparámetro estadístico. Esta curva se conoce como campana de
Gauss y es el gráfico de una función gaussiana.
La importancia de esta distribución radica en
quepermite modelar numerosos fenómenos naturales, sociales y psicológicos.
Mientras que los mecanismos que subyacen a gran parte de este
tipo de fenómenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del
modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas
pocas causas independientes.
De hecho, la estadística es un modelo matemático que
sólo permite describir un fenómeno, sin explicación alguna. Para la explicación
causal es preciso el diseño experimental, de ahí que al uso
de la estadística en psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación
por mínimos cuadrados, uno de los métodos de estimación más simples y
antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el
modelo de la normal son
caracteres morfológicos de individuos como la estatura;
caracteres fisiológicos como el efecto de un fármaco;
caracteres sociológicos como el consumo de cierto producto
por un mismo grupo de individuos;
caracteres psicológicos como el cociente intelectual;
nivel de ruido en telecomunicaciones;
errores cometidos al medir ciertas magnitudes;
etc.
La distribución normal también aparece en muchas áreas de la propia estadística.
Por ejemplo, la distribución muestral de
las medias muestrales es aproximadamente normal, cuando la
distribución de la población de la cual se extrae la muestra no es
normal.1 Además, la distribución normal maximizala entropía entre
todas las distribuciones con media y varianza conocidas, lo cual la
convierte en la elección natural de la distribución subyacente a una lista de
datos resumidos en términos de media muestral y varianza. La distribución
normal es la más extendida en estadística y muchos tests estadísticos están
basados en una supuesta 'normalidad'.
En probabilidad, la distribución normal aparece como el límite de
varias distribuciones de probabilidad continuas ydiscretas.
El valor estándar de este campo es la
fecha en la que se crea el pedido.
Estudios científicos han demostrado que, desde la introducción en
1968 del valor estándar de 11 para los jugos de manzanas,
se han cultivado y utilizado para la producción de jugos de manzanas
concentrados []
En otras palabras, los diversos factores no tienenun valor
estándar para todos los casos, sino que su importancia específica ha
de determinarse en el contexto
Este nivel de entrada se ha seleccionado comovalor
estándar, ya que sirve para saturar el audífono, excepto si el
control de volumen tiene un nivel
ontrolar si puede o debe introducirse el valor estándar
Se puede definir un valor estándar de usuario para los
parámetros del usuario mediante la introducción []
solución tampón que tenga una diferencia de al menos 30 mV con respecto al valor
estándar.
partir de la traducción y se modifican los
valores prefijados se trata de una partición devalor estándar.
Con un arranque en frío la asignación de la posición
de cierre AIR TO OPEN (AtO)/ AIR TO CLOSE (AtC) no se
restablece a su valor estándar. Como valor estándar, el tiempo de integración está
ajustado a 0 segundos.
compensación que puede tener lugar cuando se exportan
las mercancías no se efectúa sobre la base de cantidades reales de insumos
importados libres de derechos y utilizados para la fabricación de los productos
exportados, sino más bien en función de un hipotético valor
estándar de los insumos del
producto exportado.
La tabla edita una lista de los tipos de valor
estándar en el sistema.
consumo estándar máximo y mínimo, el método propuesto
permite calcular el gasto por establecimiento, y el total de todos aquellos que
sobrepasan el valor estándar establecido.
Regresión lineal
Para otros usos de este
término, véase Función lineal (desambiguación).
Ejemplo de una regresión lineal con una variable
dependiente y unavariable independiente.
En estadística la regresión lineal o ajuste
lineal es un método matemático que modela la
relación entre unavariable dependiente Y, las variables
independientes Xi y un término aleatorio ε. Este
modelo puede ser expresado como:
variable dependiente, explicada o regresando.
: variables explicativas, independientes o regresores.
: parámetros, miden la influencia que las variables explicativas tienen sobre
el regresando.
donde es la intersección o término 'constante',
las son los parámetros respectivos a cada variable independiente,
y es el número de parámetros independientes a tener en cuenta en la
regresión. La regresión lineal puede ser contrastada con la regresión no
lineal.
Correlación
Para otros usos de este término,véase Correlación
(desambiguación).
En probabilidad y estadística,
la correlación indica la fuerza y la dirección de una relación
lineal y proporcionalidad entre dos variables estadísticas.
Se considera que dos variables cuantitativas están correlacionadas cuando los
valores de una de ellas varían sistemáticamente con
respecto a los valores homónimos de la otra: si tenemos dos variables (A y B)
existe correlación si al aumentar los valores de A lo hacen también los de B y
viceversa. La correlación entre dos variables no implica, por sí misma, ninguna
relación de causalidad (Véase cum hoc ergo propter hoc).
Correlación estadística
La correlación estadística determina la relación o dependencia que
existe entre las dos variables que intervienen en unadistribución
bidimensional.
Es decir, determinar si los cambios en una de las variables
influyen en los cambios de la otra. En caso de que suceda, diremos que
las variables están correlacionadas o que hay correlación entre ellas.
Estadístico muestral
(Redirigido desde «Estadístico»)
En estadística un estadístico (muestral) es
una medida cuantitativa, derivada de un conjunto de datos de
una muestra, con el objetivo de estimar o inferir características de
unapoblación o modelo estadístico.
Más formalmente un estadístico es una función medible T que, dada una
muestra estadística de valores , les asigna un
número, , que sirve para estimar determinado parámetro de la distribución
de la que procede la muestra. Así, por ejemplo, la media de los valores de una
muestra (media muestral) sirve para estimarla media de la
población de la que se ha extraído la misma; la varianza muestral podría
usarse para estimar la varianza poblacional, etc.1 Esto se denomina como
realizar una estimación puntual.
Parámetro estadístico
La media aritmética como resumen de la vejez de un
país.
En estadística, un parámetro es un número que resume la ingente
cantidad de datos que pueden derivarse del estudio de una variable
estadística.1 El cálculo de este número está bien definido,
usualmente mediante una fórmula aritmética obtenida a partir
dedatos de la población.2 3
Los parámetros estadísticos son una consecuencia inevitable del propósito
esencial de la estadística: crear un modelo de la realidad.4
El estudio de una gran cantidad de datos individuales de una población puede
ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen
que permita tener una idea global de la población, compararla con otras,
comprobar su ajuste a un modelo ideal, realizar estimaciones sobre
datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros
estadísticos.
Por ejemplo, suele ofrecerse como resumen de
la juventud de una población la media aritmética de las edades de sus
miembros, esto es, la suma de todas ellas, dividida por el total de individuos
que componen tal población.
Aplicaciones de la estadistica en la ingenieria?
hace 4 años
Denunciar abuso
Abelardo N
Mejor respuesta - elegida por los votantes
La estadística aplicada en la Ingeniría se hace mediante la rama de la
estadística quebusca implementar los procesos probabilísticos y estadísticos de
análisis e interpretación de datos o características de un conjunto de
elementos al entorno industrial, a efectos de ayudar en la toma de decisiones y
en el control de los procesos industriales y organizacionales.
Pueden distinguirse tres partes:
* el estudio de las series temporales y las técnicas de previsión, y la
descripción de los pasos necesarios para el establecimiento de un sistema de
previsión operativo y duradero en una empresa;
* el análisis multivariante, necesario para la extracción de información de
grandes cantidades de datos, una de las necesidades más apremiantes;
* el control de calidad y la fiabilidad.
Las aplicaciones de la estadística en la ingeniería actualmente han tomado un rápido y sostenido incremento, debido al poder
de cálculo de la computación desde la segunda mitad del siglo XX.
Para comprender el desarrollo de las
aplicaciones de la estadística en la ingeniería hay que citar que los Viejos
Modelos Estadísticos fueron casi siempre de la clase de los modelos lineales.
Ahora, complejos computadores junto con apropiados algoritmos numéricos, estan
utilizando modelos no lineales (especialmente redes neuronales y árboles de
decisión) y la creación de nuevos tipos tales como modelos
lineales generalizados y modelos multinivel.
El incremento en el poder computacional también ha llevado al crecimiento en
popularidad de métodos intensivos computacionalmente basados en remuestreo,
tales como
tests de permutación y de bootstrap, mientras técnicas comoel muestreo de Gibbs
han hecho los métodos bayesianos más accesibles.
En el futuro inmediato la estadística aplicada en la ingenieria, tendrá un nuevo énfasis en estadísticas 'experimentales'
y 'empíricas'. Un gran numero de paquetes
estadísticos está ahora disponible para los ingenieros. Los Sistemas dinámicos
y teoría del
caos, desde hace una década empezó a ser utilizada por la comunidad hispana de
ingenieria, pues en la comunidad de ingenieria anglosajona de Estados Unidos
estaba ya establecida la conducta caótica en sistemas dinámicos no lineales.
Algunos campos de investigación en la Ingeniería usan la estadística tan
extensamente que tienen terminología especializada. Estas aplicaciones
incluyen:
* Ciencias actuariales
* Física estadística
* Estadística industrial
* Estadística Espacial
* Estadística en Agronomía
* Estadística en Planificación
* Estadística en Investigación de Mercados.
* Estadística en Planeación de Obras Civiles - megaproyectos.
* Estadística en Restauración de Obras
* Geoestadística
* Bioestadística
* Estadísticas de negocios y mercadeo.
* Estadística Computacional
* Investigación de Operaciones
* Estadísticas de Consultoría
* Estadística en la comercialización o mercadotecnia
* Cienciometría
* Estadística del Medio Ambiente
* Minería de datos (aplica estadística y reconocimiento de patrones para el
conocimiento de datos)
* Estadística económica (Econometría)
* Estadística en procesos de ingeniería
* Estadística en Psicometría y Ergonomia Laboral.
* Controles Estadísticos en Calidad yProductividad
* Estadística en Técnicas de Muestreo y Control.
* Análisis de procesos y quimiometría (para análisis de datos en química analítica
e ingeniería química)
* Confiabilidad estadística aplicada al Diseño de Plantas Industriales.
* Procesamiento de imágenes e Interpretación Binarias para Equipos de
Diagnóstico de Fallas y Mantenimiento Predictivo.
La estadística aplicada en la Ingenieria Industrial es una herramienta básica
en negocios y producción. Es usada para entender la variabilidad de sistemas de
medición, control de procesos (como en control estadístico de
procesos o SPC (CEP)), para compilar datos y para tomar decisiones. En estas aplicaciones es una herramienta clave, y probablemente la
única herramienta disponible.
INTRODUCCIÓN A LA ESTADÍSTICA
A medida que aumenta la complejidad de nuestro mundo y nos internamos por los
senderos reales y virtuales del nuevo milenio, se hace más
difícil tomar decisiones informada e inteligentes. Con frecuencia, estas
decisiones han de tomarse con un conocimiento imperfecto de la situación y un
grado considerable de incertidumbre, sin embargo, las soluciones pertinentes
son esenciales para nuestro bienestar e incluso para nuestra supervivencia.
Estamos expuestos a la presión constante de problemas económicos galopantes y
angustiantes, como una
inflación dinámicamente creciente en casi todos los países subdesarrollados y
tercermundistas, un sistema fiscal engorroso, coercitivo e injusto y
oscilaciones excesivas del
ciclo económico.
Todo nuestro tejido socioeconómico esta amenazado por unacontaminación
ambiental exponencialmente creciente, por una deuda pública opresiva y
criminal, por un índice de delincuencia que se incrementa sin cesar día a día
como consecuencia de la perdida de valores morales y por unos intereses
impredecibles que coadyuvan a incrementar la ya casi infinita brecha entre los
países desarrollados y los países pobres de Asia, Latinoamérica y África y
sirven de caldo de cultivo para brotes de violencia cargadas de racismo,
xenofobia y lucha de clases.
Quienes crean que estas condiciones son características del estilo de vida actual, bien le cabría
recordar que problemas análogos contribuyeron a la caída del imperio romano mas que la invasión de
las hordas bárbaras del Norte. Nuestro periodo de éxito en este
planeta, relativamente, breve no es ninguna garantía de supervivencia futura. A
menos que se encuentren soluciones viables a estos apremiantes problemas,
podríamos acompañar en el olvido al dinosaurio, como ya lo hicieron
los antiguos romanos.
En razón de lo anteriormente expuesto, es necesario contar con herramientas
altamente confiables que nos permitan tomar decisiones acertadas y eficaces
para poder resolver los problemas prioritarios que podrían enmarcarse de
acuerdo al criterio 80/20 ( el 80% de todos los problemas se deben al 20% de
las causas.) .De ahí que sea fundamental que todos los futuros profesionales
que pretendan dirigir correctamente los destinos de la humanidad, aprendan y se
sirvan de los métodos estadísticos para minimizar la probabilidad de error en
la toma de decisiones en esta era llamada delconocimiento, que actualmente
cuentan con todas ayudas de última generación que a través de excelentes
software permiten agilizar todo el trabajo estadístico.
Es altamente recomendable que a la par con la formación humanística que se
imparte en nuestra universidad, se actualice las técnicas pedagógicas y se
introduzcan en los contenidos programáticos y curriculares de los diferentes
programas, la obligación que los docentes y estudiantes utilicen los diferentes
software que se consiguen en el mercado, que le permitan estar actualizados con
las tecnologías de puntas.
1.1 IMPORTANCIA DE LA ESTADÍSTICA
Todos los campos de la investigación científica seria se pueden beneficiar del
análisis estadístico ya que las técnicas estadísticas se pueden utilizar en
casi todos los aspectos de la vida Se diseñan encuestas para recopilar
información previa al día de elecciones y así predecir el resultado de las
mismas. Se seleccionan al azar consumidores para obtener información con el fin
de predecir la preferencia con respecto a ciertos productos y/o servicios.
Los responsables de la toma de decisiones sobre la política económica, asesores
presidenciales, ministeriales y de otros altos cargos
públicos, tienen en la estadística una herramienta muy valiosa. Los economistas
consideran varios índices de la situación económica durante
cierto periodo y utilizan la información para predecir la situación económica
futura. Únicamente con la ayuda del
análisis estadístico pueden tomarse decisiones inteligentes en relación con los
tipos tributarios, programas sociales, gastosde defensas, políticas laborales,
inversiones prioritarias
Es fundamental para los empresarios, en su búsqueda incansable del beneficio,
donde las actividades de control total de calidad, minimización de costos,
combinación de productos - existencias y multitud de aspectos empresariales se
pueden gestionar con eficacia mediante procedimientos estadísticos
constratados. Los ingenieros muestrean las características de calidad de un producto, juntos con otras variables controladas del proceso para
facilitar la identificación de las variables que están mas relacionadas con
dicha calidad.
En la investigación de mercados, la estadística representa una ayuda
inestimable para determinar si es probable que un
nuevo producto y/o servicio tenga éxito. Su utilidad es evidente también para los
asesores financieros que han de evaluar las
oportunidades de inversión a través de las bolsas de valores. Contadores,
directores de personal y fabricantes se benefician igualmente del análisis
estadístico.
Incluso los investigadores médicos, sicólogos, siquiatras y muchos
profesionales del sector de la salud y del comportamiento, que preocupados por
la eficacia de nuevos medicamentos, realizan experimentos para determinar su
efecto bajo ciertas condiciones ambientales controladas en los humanos y en los
animales para la determinación del método apropiado para curar ciertas
enfermedades, encuentran en la estadística un aliado imprescindible.
En termino generales la estadística se puede utilizar para
mejorar el rendimiento en el trabajo y en muchos aspectos de la vidadiaria ya
que es una guía universal para lo desconocido
1.2 HISTORIA DE LA ESTADISTICA
Las ciencias al evolucionar pierden sus rasgos primitivos, se transforman, se
dividen y aún cambian de nombre. La estadística ha seguido igual proceso
y para comprender su estado actual necesitamos conocer algo de su historia.
Formalmente se considera fundador de la estadística a Godofredo Achenwall (1719
– 1772) profesor y economista alemán quien siendo docente de la universidad de
Leipzig, escribió el descubrimiento de una nueva ciencia que llamo estadística
( palabra derivada de Staat que significa gobierno) y que definió como el
conocimiento profundo de la situación respectiva y comparativa de cada estado.
Achenwall y sus seguidores estructuraron los métodos estadísticos que se
orientaron a investigar, medir y comparar las riquezas de las naciones No obstante lo anterior no significa que antes de los
estudios de Achenwall, los estados no hubiesen efectuados inventarios de sus
riquezas; estos inventarios o censos (palabra derivada del latín censere
que significa valuar o tasar) se realizaron desde la antigüedad. Se sabe que
2000 a 3500 años antes de Cristo, los chinos y los egipcios efectuaron censos
que eran simples inventarios elementales y que desde los comienzos de la
civilización han existido formas sencillas de estadística, pues ya se
utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos
de madera y paredes de cuevas para contar el número de personas, animales o
cosas. Hacia el año 3000 AC. Los babilonios usaban pequeñas
tablillasde arcilla para recopilar datos sobre la producción agrícola y sobre
los géneros vendidos o cambiados mediante trueque. En el siglo XXXI
a.C., mucho antes de construir las pirámides, los egipcios analizaban los datos
de la población y la renta del país. Los
libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de
estadística. El primero contiene dos censos de la población de Israel y el
segundo describe el bienestar material de las diversas tribus judías. En China
existían registros numéricos similares con anterioridad al año 2000 a.C. Los
griegos clásicos realizaban censos cuya información se utilizaba hacia el 594
a.C. para cobrar impuestos.
El Imperio romano fue el primer gobierno que recopiló
una gran cantidad de datos sobre la población, superficie y renta de todos los
territorios bajo su control. Durante la edad media sólo se
realizaron algunos censos exhaustivos en Europa. Los reyes caloringios
Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las
propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la
conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra
encargó la realización de un censo. La información
obtenida con este censo, llevado a cabo en 1086, se
recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en
Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio
estadístico notable de población, titulado Observations on the London Bills of
Mortality (Comentarios sobre las partidas de defunción en Londres. Unestudio
similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania,
realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como
base para la primera tabla de mortalidad.11 En el siglo XIX, con la
generalización del método científico para estudiar todos los fenómenos de las
ciencias naturales y sociales, los investigadores aceptaron la necesidad de
reducir la información a valores numéricos para evitar la ambigüedad de las
descripciones verbales Desde su creación, la estadística se ha enriquecido
continuamente con los aportes de matemáticos, filósofos y científicos de todas
las disciplinas.
En nuestros días, la estadística se ha convertido en un método efectivo para
describir con exactitud los valores de datos económicos, políticos, sociales,
psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y
analizar dichos datos. El trabajo del experto estadístico no
consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso
de “interpretación” de esa información. El desarrollo de la
teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadística. Muchos conjuntos de datos se pueden
aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilísticas; los resultados de éstas se pueden utilizar para analizar datos
estadísticos. La probabilidad es útil para comprobar la fiabilidad de
las inferencias estadísticas y para predecir el tipo y la cantidad de datos
necesarios en un determinado estudio estadístico.
1.3 LA ESTADÍSTICA Y SUS METODOS
De acuerdo aun punto de vista aceptado ampliamente, la Estadística, se define
mejor como la rama de las matemáticas que se ocupa de facilitar la toma de
decisiones acertadas frente a una incertidumbre y por lo tanto, desarrolla y
utiliza técnicas para la recolección cuidadosa, presentación efectiva y el
análisis correcto de la información numérica.
Esta definición incorpora claramente a la estadística
descriptiva y a la estadística inductiva o inferencial. Conjuntamente,
las ramas ayudan a quienes toman decisiones a extraer la máxima utilidad a
partir de información limitada; por una parte, las tablas, gráficos, resúmenes
resaltan los modelos que de otra forma quedarían ocultos en datos
desorganizados; a la vez que las deducciones correctas proporcionan
estimaciones razonables de cosas desconocidas, juntos con probabilidades
indicadas claramente de que sean correctas o falsas.
La materia prima de la estadística consiste en conjuntos de números obtenidos
al contar o medir elementos. Al recopilar datos estadísticos
se ha de tener especial cuidado para garantizar que la información sea completa
y correcta.
El primer problema para los estadísticos reside en determinar qué información y
en que cantidad se ha de reunir. En realidad, la dificultad al compilar un
censo está en obtener el número de habitantes de forma completa y exacta; de la
misma manera que un físico que quiere contar el número de colisiones por
segundo entre las moléculas de un gas debe empezar determinando con precisión
la naturaleza de los objetos a contar.
Los estadísticos se enfrentan a uncomplejo problema cuando, por ejemplo, toman
una muestra para un sondeo de opinión o una encuesta electoral.
El seleccionar una muestra capaz de representar con exactitud las preferencias del
total de la población no es tarea fácil.
Para establecer una ley física, biológica o
social, el estadístico debe comenzar con un conjunto
de datos y modificarlo basándose en la experiencia. Por ejemplo, en los
primeros estudios sobre crecimiento de la población, los cambios en el número
de habitantes se predecían calculando la diferencia entre el número de
nacimientos y el de fallecimientos en un determinado
lapso. Los expertos en estudios de población comprobaron que la tasa de
crecimiento depende sólo del número de nacimientos, sin que
el número de defunciones tenga importancia. Por tanto, el
futuro crecimiento de la población se empezó a calcular basándose en el número
anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se
dieron cuenta que las predicciones obtenidas utilizando este
método no daban resultados correctos. Los estadísticos comprobaron que hay
otros factores que limitan el crecimiento de la población. Dado que el número
de posibles nacimientos depende del
número de mujeres, y no del
total de la población, y dado que las mujeres sólo tienen hijos durante parte
de su vida, el dato más importante que se ha de utilizar para predecir la población
es el número de niños nacidos vivos por cada 1.000 mujeres en edad de procrear.
El valor obtenido utilizando este dato mejora al combinarlo con el dato del
porcentaje de mujeres sin descendencia.Por tanto, la diferencia entre
nacimientos y fallecimientos sólo es útil para indicar el crecimiento de
población en un determinado periodo de tiempo del pasado, el número de
nacimientos por cada 1.000 habitantes sólo expresa la tasa de crecimiento en el
mismo periodo, y sólo el número de nacimientos por cada 1.000 mujeres en edad
de procrear sirve para predecir el número de habitantes en el futuro.
La estadística descriptiva analiza, estudia y describe a la totalidad de
individuos de una población. Su finalidad es obtener información, analizarla,
elaborarla y simplificarla lo necesario para que pueda ser interpretada cómoda
y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se
desee.
La estadística descriptiva trabaja con todos los individuos de la población. La
estadística inferencial, sin embargo, trabaja con muestras, subconjuntos
formados por algunos individuos de la población. A partir del estudio de la
muestra se pretende inferir aspectos relevantes de toda la población. Cómo se
selecciona la muestra, cómo se realiza la inferencia, y qué grado de confianza
se puede tener en ella son aspectos fundamentales de
la estadística inferencial, para cuyo estudio se requiere un alto nivel de
conocimientos de estadística, probabilidad y matemáticas.
Tiene especial importancia como herramienta la estadística aplicada a la
economía que formalmente llamamos econometría 2
1.4 LA ESTADÍSTICA Y LA INFORMATICA
Vivimos en la llamada era del conocimiento, de la globalización, del Internet,
donde los conocimientos se vuelven obsoleto en unabrir y cerrar de ojos. La
diversidad y abundancia de información que trae hoy cualquier periódico
dominical es mucho más grande que la podía obtener un
ciudadano normal del
de siglo XVII en toda su vida. Tenemos derechos y necesidad de conocer toda
esta información y de acceder a ella de forma resumida
y confiable y es aquí donde la estadística juega unos de sus roles importantes.
La estadística en combinación con la Informática permite manejar de manera
eficiente, confiable y relativamente fácil grandes volúmenes de información y
obtener resultados que se han de someter al análisis e
interpretación de los profesionales.
Actualmente existen muchos paquetes estadísticos que agilizan todo el trabajo y
entre los más importantes tenemos
SPSS . : Gestión de datos, análisis estadístico, gráficos y presentación de
resultados.
STAGRAPHICS : Paquete de análisis interactivo y
sistema grafico
SAS : Planificación, análisis estadístico, gráficos y presentación de
resultados.
Excel : análisis estadístico, gráficos y presentación
de resultados.
STATISTICA : Planificación, análisis estadístico,
gráficos y presentación de resultados
MINITAB : Planificación, análisis estadístico, gráficos y presentación de
resultados
ARIMA : Diseño de experimentos
EViews : Análisis econométrico y estadístico, gráficos y presentación de
resultados
La pobreza extrema, por debajo del
limite de subsistencia, para millones de personas. Pobreza en forma de hambre
permanente que se transforma en azote bíblico en momento como el presente;
pobreza de capacidad y de gestión queafecta a la inmensa mayoría, analfabeta en
mas de dos tercios de las mujeres y más de la mitad de los hombres de los
países del tercer mundo en la llamada era del conocimiento. El narcotráfico
enfermedad social de los países ricos y desgracia de los países pobres, el
hambre, la deuda externa, la malaria de siempre, el SIDA de la última década,
la escasez de agua potable y de energía, el analfabetismo, la guerra y la
destrucción se han convertido en imagen habitual y nos hemos insensibilizados.
Parafraseando, como dijo el expresidente español Felipe González 4, a Joseph
Ki-Zerbo , de Burkina Faso, afectado de malaria,
venerable en su vejez de luchador por un futuro mejor para su continente, decía
en las palabras finales de una de sus intervenciones “ la juventud africana se
encuentra ante un pasado mudo, un presente ciego y un futuro sordo “ así nos
hemos quedados nosotros en todos los países subdesarrollados, masticando un
silencio cómplice y cobarde.
Ya se fue el milenio, considerado durante mucho tiempo
sinónimo de futuro y desde ahora en adelante, nuestro presente. La
globalización vuela y llega a los rincones más recónditos del planeta
ignorando la independencia de los pueblos y la diversidad de sus regímenes
políticos, vivimos una nueva colonización donde los actores principales son las
empresas y conglomerados de grupos de industriales y financieros privados que
intentan dominar el mundo. Nunca antes los dueños del poder y de la
tierra habían sido tan poco numerosos y sin embargo tan poderosos. Estos grupos
se sitúan en el triangulo formado porlos Estados Unidos, Europa y Japón, donde
la mitad de ellos tienen su base en los Estados Unidos.
La concentración del
capital y el poder se ha acelerado enormemente bajo el influjo de las
revoluciones tecnológicas de la información. La globalización no intenta
conquistar países sino mercados. La preocupación de este
moderno poder no es la conquistar territorios como los fueron las grandes invasiones en la
colonia, sino la toma de sus riquezas. ; lo que lleva
consigo destrucciones impresionantes, donde industrias enteras son brutalmente
desmanteladas en todas las regiones, paros masivos, contratos-basuras,
desempleo, sobreexplotación de hombres, mujeres y niños, miseria, etc.
La globalización es también pillaje planetario, los grandes grupos saquean el
medio ambiente, sacan provecho de las riquezas de la naturaleza que son
patrimonio de humanidad y lo hacen sin escrúpulos ni limitaciones, acompañado
de una criminalidad financiera y bancaria, por la que pasan sumas que superan
el billón de dólar anuales, es decir, mas que el PIB de la tercera parte de la
humanidad.
La mercantilización generalizada de palabras y cosas, cuerpos y espíritus, de
la naturaleza y la cultura provoca mayor desigualdad mientras la producción
mundial de productos alimenticios básicos cubren mas del 110% de las
necesidades, 30 millones de personas continúan muriendo de hambre cada año y
más de 800 millones están famélicos.
A principios de la década del 60, el 20% de la población del mundo, los más
ricos, tenían unos ingresos 30 veces superiores que el 20 % de los más
pobres.Hoy en día los ingresos de los ricos son 82 veces superiores. De los
6.000 millones de habitantes del planeta, solamente 500
millones viven con holgura, el resto, los 5,500 millones malviven en la
necesidad.55 s Usted amigo lector cree que esto es justo?
Se perdieron los valores, las estructuras sociales y políticas; se desarrollan
zonas sin derechos, entidades caóticas e ingobernables que escapan a todo tipo
de legalidad, sumergidas en un estado de barbarie donde los grupos de
saqueadores son los únicos capacitados para imponer la ley chantajeando a la
población, carteles del narcotráfico y redes mafiosas, especulación financiera,
corrupción a todo nivel, contaminación ambiental, fanáticos religiosos y
étnicos, efecto invernadero, desertización y proliferación nuclear entre otras.
sSerán consecuencia lógica o ilógica o realmente entrópica del neoliberalismo implementados en el
triangulo del
poder arriba mencionado? s Que piensa usted amigo estudiante
y futuro profesional?
Aunque alegremente se pregona el triunfo de la democracia y la libertad en un planeta que casi se ha librado de regímenes autoritarios,
la censura y la manipulación vuelven paradójicamente con mas fuerza. Nuevos y
seductores “ lideres “ proponen mundos maravillosos,
mágicos pero alejados de la realidad distrayendo a los viejos y convenciendo a
los jóvenes para que abandonen toda acción cívica y reivindicativa. Amigos en esta nueva era de alienación, de la cultura global, de la
informática, de los mensajes planetarios. , La comunicación juega un papel ideológico importante quepuede amordazar y liberar
el pensamiento.
Si Usted, amigo lector es capaz de resolver problemas y tomar decisiones
acertadas, tendrá una excelente posición en el campo empresarial, si a la vez
que toma decisiones inteligentes, resuelve problemas, alguien estará dispuesto
a pagarle con generosidad. En este mundo se suele
pagar mas a quienes formulan preguntas adecuadas para lograr los objetivos
fundamentales que a quienes toman la responsabilidad para lograrlos. Las
respuestas suelen ser muy evidentes una vez que se han
hecho las preguntas correctas. El análisis estadístico
demostrará ser de gran utilidad en la formación adecuada de esas preguntas.
Los empresarios saben que los complejos problemas con que nos enfrentamos en el
mundo actual exigen soluciones cuantitativas. Si usted no estuviera en
condiciones de aplicar la estadística y otros métodos cuantitativos a los
numerosos problemas corrientes
que si duda se le presentaran, se encontrara en fuerte desventaja en el mercado
empresarial.
Quienes aspiren a ocupar puestos de dirección, trabajar independientes o
desempeñar cualquier profesión del sector industrial advertirán que una
comprensión básica de la estadística no solo multiplica sus oportunidades de
trabajo sino que renueva las probabilidades de promoción debido a las mejoras
del rendimiento en el trabajo. Tenga presente que en el mercado actual los
empresarios se resisten a contratar analfabetas estadísticos por lo tanto si
sus aspiraciones profesionales se encaminan a la industria privada, al sector
oficial o al desempeño de cualquieractividad lucrativa, se encontrara mucho
mejor respaldado por su experiencia académica si adquiere una base sólida en
los fundamentos del análisis estadístico “ Amigo lector no se olvide de la
primera parte de la reflexión y luchemos por la utopía de un mundo mejor.”
Cada vez que usted toma decisiones esta aplicando la
estadística, ya que tomar decisiones es inherente a todo ser viviente, por lo
tanto es de aplicación universal. Tomarla bien o mal
depende no solamente de los soporte cuantitativos y cualitativos sino también
de la formación moral y ética, ya que con la estadística también se puede
engañar y manipular.
REVISTAS ELECTRONICAS
Estadisticas
por Investment » Mar Ago 22, 2006 12:00 am
Hola reciban un cordial saludo, en cuanto ha estadisticas pues son muchos los
casos donde se pueden usar ademas que dependen mucho del area donde se muevan
la empresa, por ejemplo en mi caso y a la hora de programar la uso para estimar
tiempos de respuesta a usuarios, en ambientes donde se manejan bases de datos
muy grandes es necesario calcular cuanto tiempo de maquina me demoro en hacerle
los calculos necesarios a una persona, para asi estimar cual seria el total por
la cantidad de usuarios a los que voy ha hacerles alguna operacion en
particular, estas operaciones generalmente se llevan de noche cuando implica
muchos usuarios, la usa google para saber cuales son las palabras mas buscadas
en internet, En inteligencia artificial para sistemas expertos, en marketing,
en politica, un banco, los cantadores de una pagina, muchos son los usos de las
estadisticas, a unpais que le podemos decir el pais de las estadisticas en EEUU
porque para todo tiene una estadistica.teamgroup.info@gmail.com
sPARA QUE SIRVE LA ESTADISTICA?
ING. MSc. ÁNGEL GÓMEZ
PROF. FACULTAD DE AGRONOMÍA. LUZ
A pesar de que la Estadística se enseña en todas las universidades
del
país, existe poco conocimiento sobre su aplicación en las
empresas y negocios. En la actualidad no hay una cultura de
pensamiento estadístico en nuestros empresarios.
Carecer de datos e información en cuanto a lo que
ocurre dentro y
fuera de la empresa, impide la toma de decisiones racionales y
científicas. No se puede tomar decisiones desconociendo las
probabilidades de éxito u ocurrencia de eventos.
Varios autores mencionan que no se puede gerenciar lo que no
se
mide, sino se mide no se puede controlar, sino se controla, entonces
no se puede gerenciar.
Las mediciones son la clave, y la herramienta fundamental
para
comprender lo que dicen esas mediciones es La Estadística. Conocer
y aplicar las herramientas Estadísticas a la medida para la solución de
problemas concretos y el aprovechamiento de oportunidades, es
prioritario para que la empresa logre posicionamiento en el mercado.
Las empresas que no utilicen la Estadística en conjunto con
la
Informática, perderán su capacidad competitiva y visibilidad en el
entorno, poniendo en riesgo su existencia.
Hoy un empresario necesita información científica y a tiempo,con
el
fin de tomar decisiones racionales prácticas y justas. Se debe contar
con información estadística fiable, completa y a tiempo.
Sin Estadística una empresa carece de capacidad para
identificar los
principales bienes y servicios que generan las mejores utilidades. Ello
hace necesario concientizar y capacitar a los directivos y empleados
de la empresa sobre la importancia fundamental de la información
estadística a la hora de Planificar, Dirigir, Controlar y Evaluar la
marcha de la empresa. Esto es lo que se conoce como la Gerencia
Moderna Basada en la Estadística (GMBE).Las empresas que utilizan el análisis
estadístico logran:
ï‚· Mejorar la calidad de un bien o servicio
ï‚· Incrementar la rentabilidad
ï‚· Mejorar la eficiencia operativa
ï‚· Conocer y Mejorar los procesos
ï‚· Mejorar la satisfacción de los clientes
ï‚· Capturar nuevos clientes
ï‚· Aumentar la competitividad en el mercado
Tenemos un gran volumen de datos, pero, slos aprovechamos para la
toma de decisiones, solución de problemas e identificación de
oportunidades?
En toda empresa se debe contar con un Sistema de Gestión
Estadístico para realizar una evaluación continua de los procesos
que apoye la toma de decisiones cotidianas y permita conocer los
fenómenos, que nos den el significado de los datos con la ayuda de
las probabilidades y del análisis de los datos .
Con la Estadística se puede realizar los siguientes estudios:
ï‚· Estudio del mercado
ï‚· Comportamiento del consumidor de un bien o servicio
ï‚· Análisis de la satisfacción del cliente
ï‚· Estudiode segmentación del mercado
ï‚· Posicionamiento de un bien o servicio
ï‚· Grado de importancia de la mezcla de mercado, por parte del
consumidor
ï‚· Estudio de opinión de los consumidores, sobre un bien o
servicio
ï‚· Grado de importancia de atributos comerciales de bienes y
servicios
ï‚· Medición de la calidad del servicio percibido
ï‚· Cambios de tendencia de las ventas
ï‚· Métodos para rechazar o aceptar un cliente potencial
ï‚· Segmentación de zonas geográficas
ï‚· Predicciones de ventas por zonas, bienes, servicios, sucursales,
canales de comercialización
ï‚· Control estadístico de un sistema de calidad
ï‚· Aplicación de herramientas estadísticas de calidad
ï‚· Mejoramiento de los procesos de una empresaï‚· Métodos para aceptar o
rechazar proyectos de Investigacióninversión-Desarrollo
ï‚· Relacionar características del mercado con características
demográficas, geográficas, psicográficas y sociales
ï‚· Determinar el perfil del clima organizacional
ï‚· Planificación estratégica FODA
ï‚· Encuesta en investigaciones cuantitativas y cualitativas
ï‚· Diseño de muestras estadísticas
ï‚· Validez, confiabilidad y dimensionalidad de instrumentos de
investigación
ï‚· Diseño y Análisis de experimentos
ï‚· Análisis estadístico de proyectos
ï‚· Evaluación de programas
ï‚· Análisis de deterioro de clientes
ï‚· Análisis de logro de empleados
ï‚· Análisis del riesgo crediticio
Estos estudios son solo una muestra del amplio espectro del uso de la
Estadística como ciencia indispensable para la toma de decisiones en
nuestras empresas.