Estadística
Introducción
La estadística es comúnmente considerada como una colección
de hechos numéricos expresados en términos de una relación
sumisa, y que han sido recopilados a partir de
otros datos numéricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen
la estadística como
un valor resumido, calculado, como
base en una muestra de observaciones que generalmente, aunque no por
necesidad, se considera como
una estimación de parametro de determinada población;
es decir, una función de valores de muestra.
'La estadística es una técnica especial apta para el estudio
cuantitativo de los fenómenos de masa o colectivo, cuya mediación
requiere una masa de observaciones de otros fenómenos mas simples llamados individuales o particulares'. (Gini, 1953.
Murria R. Spiegel, (1991) dice: 'La estadística estudia
los métodos científicos para recoger, organizar,
resumir y analizar datos, así como para sacar conclusiones
validas y tomar decisiones razonables basadas en
tal analisis.
'La estadística es la ciencia que trata de la
recolección, clasificación y presentación de los hechos
sujetos a una apreciación numérica como base a la
explicación, descripción y comparación de los
fenómenos'. (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la
importancia científica que tiene la estadística, debido al gran
campo de aplicación que posee.
Se usa
para la toma de decisiones en areas de negocios o
instituciones gubernamentales.
La estadística se divide en dos grandes areas
La estadística descriptiva, se dedica a la descripción,
visualización yresumen de datos originados a partir de los
fenómenos de estudio. Los datos pueden ser resumidos
numérica o graficamente. Ejemplos basicos
de parametros estadísticos son: la media y
la desviación estandar. Algunos ejemplos graficos
son: histograma, piramide poblacional, grafico
circular, entre otros.
La estadística inferencial, se dedica a la generación de
los modelos, inferencias y predicciones asociadas a los fenómenos
en cuestión teniendo en cuenta la aleatoriedad de las
observaciones. Se usa
para modelar patrones en los datos y extraer inferencias acerca de
la población bajo estudio. Estas inferencias
pueden tomar la forma de respuestas a preguntas si/no (prueba de
hipótesis), estimaciones de unas características numéricas
(estimación), pronósticos de futuras observaciones,
descripciones de asociación (correlación) o modelamiento de
relaciones entre variables (analisis de regresión). Otras técnicas
de modelamiento incluyen anova, series de
tiempo y minería de datos.
Ambas ramas (descriptiva e inferencial) comprenden
la estadística aplicada.
Hay también una disciplina
llamada estadística matematica, la que se refiere a las
bases teóricas de la materia.
La palabra «estadísticas» también se refiere al
resultado de aplicar un algoritmo estadístico a
un conjunto de datos, como
en estadísticas económicas, estadísticas
criminales, entre otros.
Origen
El término aleman Statistik, introducido originalmente
por Gottfried Achenwall en 1749, se refería al
analisis de datos del Estado, es decir, la 'ciencia
del Estado' (o mas bien, de la ciudad-estado). También
se llamó aritmética política de acuerdocon la
traducción literal del inglés. No fue hasta el
siglo XIX cuando el término estadística adquirió
el significado de recolectar y clasificar datos. Este
concepto fue introducido por el militar britanico Sir John
Sinclair (1754-1835).
En su origen, por tanto, la Estadística estuvo
asociada a los Estados o ciudades libres, para ser utilizados por el gobierno y
cuerpos administrativos (a menudo centralizados). La colección de datos
acerca de estados y localidades continúa ampliamente a través de
los servicios de estadísticas nacionales e internacionales. En particular, los censos comenzaron a suministrar
información regular acerca de la población de cada
país. Así pues, los datos
estadísticos se referían originalmente a los datos
demograficos de una ciudad o estado determinados. Y es por ello que en la clasificación decimal de Melvil
Dewey, empleada en las bibliotecas, todas las obras sobre estadística se
encuentran ubicadas al lado de las obras de o sobre la demografía.
Ya se utilizaban representaciones graficas y otras medidas en pieles,
rocas, palos de madera
y paredes de cuevas para controlar el número de personas, animales o
ciertas mercancías. Hacia el
año 3000 a. C. los babilonios usaban ya
pequeños envases moldeados de arcilla para recopilar datos sobre la
producción agrícola y de los géneros vendidos o cambiados.
Los egipcios analizaban los datos de la población y la renta del
país mucho antes de construir las piramides en el siglo
XI a. C. Los libros bíblicos
de Números y Crónicas incluyen en algunas
partes trabajos de estadística. El primero esta ubicado al lado
de las demograficas.La estadística tiene dos censos de la
población de la Tierra de Israel y el segundo describe el
bienestar material de las diversas tribus judías.
En China existían registros numéricos similares con
anterioridad al año 2000 a. C. Los antiguos griegos
realizaban censos cuya información se utilizaba hacia
el594 a. C. para cobrar impuestos.
Usos
En el mundo actual la estadística puede tener aplicaciones muy
variadas.
El uso mas común es en el ambito
de la estadística oficial, todo país que se precie de tener una
buena administración debe contar con buenas estadísticas para la
toma de decisiones: Cuantos habitantes viven en el país y como son éstos,
que características tienen sus viviendas, etc.
La estadística siempre ha sido una herramienta fundamental en las
ciencias naturales.
En biología, una aplicación de la
estadística es determinar la abundancia de una especie en determinada
area. Diseño de muestras para determinar la
composición florística de un area
(cuantas especies de plantas viven en el area).
En el area médica, se usa la
estadística para probar la eficacia de las drogas para ello se
seleccionan sujetos de prueba, ya sea animales o seres humanos en las
últimas etapas.
En las ciencias agrícolas se utiliza para mejoramiento genético y
para probar el desempeño de las semillas mejoradas
En la industria se usa para medir la
confiabilidad de los aparatos que adquirimos.
La investigación científica en Biología
La investigación en Biología es un
proceso que esta orientado a la producción de conocimientos sobre
lo vivo, interpretando lo vivo, como una forma
altamenteespecializada del
movimiento de la materia, regida por sus propias leyes. El
conocimiento de esas leyes es precisamente el objeto principal de estudio de la
Biología.
La investigación en Biología ha pasado de las simples
teorías de aproximación a la comprobación directa; de la
descripción pasiva a la formulación de experimentos,
hipótesis y teorías.
Su campo de acción es tan amplio que ha tenido que diversificarse en
disciplinas específicas que abordan su objeto general de estudio por
alguno de sus aspectos.
Esta situación exige llamar la atención sobre
cómo el desarrollo de la biología puede llevar a los
especialistas al peligro de la formación de conceptos muy parciales
sobre lo vivo si no se teorizan y generalizan los conocimientos que son
producto de los procesos parciales de la investigación biológica.
Este intento de generalizaciones es lo que hoy se denomina
Biología Teórica.
La Biología actual no es entonces sólo una ciencia experimental.
La Biología, como
la Química y la Física, experimenta para producir nuevos
conocimientos sobre la materia viva y teoriza sobre ello.
Su mismo desarrollo le exige utilizar los métodos de las ciencias
empíricas como
de las no empíricas. Es así que se utiliza en la
investigación biológica tanto la observación, la
medición y la experimentación -como métodos empíricos- como la hipótesis, la ley y la teoría, entre
otros, como
métodos teóricos.
El método para la Biología y para las demas ciencias
naturales, se vincula directamente con la lógica del proceso de
descubrimiento científico y a él le corresponde no solamente
orientar la selección de los instrumentos,técnicas y
procedimientos específicos de cada investigación, sino
también y fundamentalmente, fijar los criterios de comprobación o
demostración de cada caso.
No existe ni para la Biología ni para ninguna
otra ciencia particular, un método como
pauta general que guíe todas las investigaciones científicas y
que garantice de algún modo el caracter del conocimiento obtenido. No hay tal receta. La ciencia no es un
proceso mecanico sino dialéctico.
Si bien es cierto que la experimentación es la base
fundamental de la investigación en Biología, también lo es
que no todas sus especialidades permiten la experimentación, ya sea por
limitantes metodológica o ética. Es el caso de la
investigación clínica humana o de la genética humana,
areas en las cuales hay restricciones universales.
El experimento controlado es una forma común de
investigación en la Biología y las demas ciencias
naturales.
Es un tipo de experimento en que se trabaja con dos
grupos similares: el grupo control y el grupo de prueba o experimental. Los dos grupos sólo se distinguen por el factor
variación, que es la variable o dimensión que se quiere
investigar.
Aunque es posible homogeneizar en la practica y en alta
proporción los dos grupos, siempre quedara alguna posible
diferencia. Estas diferencias se pueden corregir mediante
herramientas matematicas que permiten estimar los resultados.
La Importancia del Diseño del
Experimento
Se requiere una estrecha colaboración entre los estadísticos y el
investigador o científicos con las consiguientes ventajas en el
analisis e interpretación de las etapas del programa.
Se enfatiza respecto a lasalternativas anticipadas y respecto
a la pre-planeación sistematica, permitiendo aun la
ejecución por etapas y la producción única de
datos útiles para el analisis en combinaciones posteriores.
Debe enfocarse la atención a las interrelaciones y a la
estimación y cuantificación de fuentes
de variabilidad en los resultados.
El número de pruebas requerido puede determinarse con certeza y a menudo
puede reducirse.
La comparación de los efectos de los cambios es mas precisa
debido a la agrupación de resultados.
La exactitud de las conclusiones se conoce con una precisión
matematicamente definida.
Experimento
Un experimento es un procedimiento mediante el cual se trata
de comprobar (confirmar o verificar) una o
varias hipótesis relacionadas con un determinado fenómeno,
mediante la manipulación y el estudio de las correlaciones de
la(s) variables que presumiblemente son su causa.
La experimentación constituye uno de los elementos claves de
la investigación científica y es fundamental para
ofrecer explicaciones causales.
En un experimento se consideran todas las variables
relevantes que intervienen en el fenómeno, mediante la
manipulación de las que presumiblemente son su causa, el control de las
variables extrañas y la aleatorización de las
restantes. Estos procedimientos pueden variar mucho según las
disciplinas (no es igual en física que
en psicología, por ejemplo), pero persiguen el mismo objetivo:
excluir explicaciones alternativas (diferentes a la variable manipulada) en la
explicación de los resultados. Este aspecto se conoce como validez interna del experimento, la cual aumenta cuando
elexperimento es replicado por otros investigadores y se obtienen los mismos
resultados. Cada repetición del experimento se llama prueba o
ensayo.
Las distintas formas de realizar un experimento (en
cuanto a distribución de unidades experimentales en condiciones o
grupos) son conocidas como protocolo
de investigación.
Por cierto, la experimentación no es dominio exclusivo de las ciencias,
pues a nivel personal y desde la niñez, vivimos experimentando
constantemente confirmando o verificando hipótesis, a efectos de poder
mejorar nuestra relación con el mundo que nos rodea.
Medidas de tendencia central: Media, Mediana, Moda
Supóngase que un determinado alumno obtiene 35
puntos en una prueba de matematica. Este puntaje, por sí mismo
tiene muy poco significado a menos que podamos conocer el total de puntos que
obtiene una persona promedio al participar en esa prueba, saber cual es
la calificación menor y mayor que se obtiene, y cuan variadas son
esas calificaciones.
En otras palabras, para que una calificación tenga significado hay que
contar con elementos de referencia generalmente relacionados con ciertos
criterios estadísticos.
Las medidas de tendencia central (media, mediana y moda) sirven como
puntos de referencia para interpretar las calificaciones que se obtienen en una
prueba.
Volviendo a nuestro ejemplo, digamos que la calificación promedio en la
prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificación del alumno se ubica
notablemente sobre el promedio. Pero si la calificación promedio fue de
65 puntos, entonces la conclusión sería muy diferente,debido a que se ubicaría muy por debajo del promedio de la
clase.
En resumen, el propósito de las medidas de tendencia central es
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Sirve como
un método para comparar o interpretar cualquier puntaje en
relación con el puntaje central o típico.
Sirve como
un método para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como
un método para comparar los resultados medios obtenidos por dos o
mas grupos.
La Mediana
La mediana, llamada algunas veces media posicional, es el valor del
término medio que divide una distribución de datos ordenados en
dos partes iguales, es decir, el 50% de los datos se ubican sobre la mediana o
hacia los puntajes altos y el 50% restante hacia los puntajes bajos.
Propiedades
-La Mediana no tiene propiedades que le permite intervenir en desarrollos
algebraicos como
la media aritmética, sin embargo, posee propiedades que ponen en
evidencia ciertas cualidades de un conjunto de datos, lo cual no ocurre con la
media aritmética que promedia todos los valores y suprime sus individualidades.
En cambio, la mediana destaca los valores individuales.
- Tiene la ventaja de no estar afectada por las observaciones extremas, ya que
no depende de los valores que toma la variable, sino del orden de las
mismas.
Métodos de calculo
Para Datos No Agrupados
a) Si el número n de datos es impar, la mediana es el dato que se
encuentra a la mitad de la lista. Para calcular su posición se
aplica la siguiente ecuación:
Ejemplo ilustrativo:
Calcular la mediana de las siguientes calificacionesdel curso de Estadística
evaluadas sobre diez: 10, 8, 6, 4, 9, 7, 10, 9 y 6
Solución:
1) Se ordena los datos de menor a mayor:
4
6
6
7
8
9
9
10
10
2) Se aplica la ecuación:
La mediana es el valor de x5 (quinto dato), es decir, Md=8
Moda estadística
La moda estadística es el valor que mas se repite en un grupo de
números.
Para averiguar la moda en un grupo de
números
Ordena los números según su tamaño.
Determina la cantidad de veces de cada valor numérico.
El valor numérico que mas se repite es la moda.
Puede haber mas de una moda cuando dos o
mas números se repiten la misma cantidad de veces y ademas
este es el maximo número de veces del conjunto.
No hay moda si ningún número se repite mas de una vez.
Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.
El Promedio
El promedio de datos estadístico es conocido como la media
aritmética y para calcularla se suman todas las cifras de la
distribución y se divide entre el número de cifras. En cuanto a
las variables nominales son aquellas que sirven para nombrar una característica
de la muestra pero que no tienen un valor
matematico por ejemplo: el sexo (femenino o masculino), la
religión, escolaridad. Las variables cuantitativas son aquellas cuyos
valores si tienen un valor numérico. Las
discretas son aquellas que utilizan valores enteros y donde se usa
el cero absoluto (es decir la ausencia total de la variable) por ejemplo el
número de hermanos. Las continuas son aquellas que toman un valor dentro de un rango por ejemplo la temperatura, la
velocidad de un auto etc.
Variables en Biología
En unexperimento biológico, existen variables diferentes que ayudan al
científico a descubrir información nueva. Las
variables independientes el aspecto del experimento que se modifica o
manipula para obtener determinada respuesta, mientras que la variable
dependiente es la parte que se ve afectada por la alteración de la otra.
Las variables estandarizadas son aquellas que no se ven
afectadas por el experimento.
Cuando las variables estandarizadas permanecen sin alternaciones respecto de
las variables independientes, los resultados del experimento se
pueden extender a una población. Si se investiga el crecimiento de
determinada semilla bajo una lluvia abundante y bajo una lluvia débil,
los factores como
la luz, el calor, la profundidad de plantación y el fertilizante deben
ser variables estandarizadas. En ese caso, se
podra afirmar que los resultados del
experimento aplican sin importar dónde se planten las semillas. Si
no estan estandarizadas las variables, los resultados solo pueden aplicarse
a situaciones idénticas a las del experimento y, por ende, es imposible
llegar a una conclusión que incluya ambos grupos o que se puede aplicar
a otros diferentes.
Variable Derivadas
En matematica, una derivada parcial de
una función de diversas variables, es
su derivada respecto a una de esas variables manteniendo las otras como
constantes. Las derivadas parciales son útiles
en calculo vectorial y geometría diferencial.
La derivada parcial de una función f respecto a la
variable x se representa con cualquiera de las siguientes notaciones
equivalentes
Donde es la letra 'd' redondeada, conocida como la 'd deJacobi'.
Cuando una magnitud es función de
diversas variables (,,,), es decir:
Concepto de población y muestra
El concepto de población en estadística va mas alla
de lo que comúnmente se conoce como
tal. Una población se precisa como un conjunto finito o infinito
de personas u objetos que presentan características comunes.
Destacamos algunas definiciones:
'Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones'. Levin & Rubin (1996).
'Una población es un conjunto de elementos que presentan
una característica común'. Cadenas
(1974).
El tamaño que tiene una población es un factor de suma
importancia en el proceso de investigación estadística y en
nuestro caso social, y este tamaño vienen dados por el número de
elementos que constituyen la población, según el número de
elementos la población puede ser finita o infinita. Cuando el
número de elementos que integra la población es muy grande, se
puede considerar a esta como una población infinita,
por ejemplo; el conjunto de todos los números positivos.
Una población finita es aquella que esta formada por un limitado número de elementos, por ejemplo; el
número de habitantes de una comarca.
Cuando la población es muy grande, es obvio que la
observación y/o medición de todos los elementos se multiplica la
complejidad, en cuanto al trabajo, tiempo y costos necesarios para hacerlo.
Para solucionar este inconveniente se utiliza
una muestra estadística
Muestra
La muestra es una representación significativa de las
características de una población, que bajo, la asunción
deun error (generalmente no superior al 5%) estudiamos las características
de un conjunto poblacional mucho menor que la población global.
'Se llama muestra a una parte de la población a
estudiar que sirve para representarla'. Murria R. Spiegel (1991).
'Una muestra es una colección de algunos
elementos de la población, pero no de todos'. Levin & Rubin (1996).
'Una muestra debe ser definida en base de la población
determinada, y las conclusiones que se obtengan de dicha muestra solo
podran referirse a la población en referencia', Cadenas
(1974).
Por ejemplo estudiamos los valores sociales de una población de 5000
habitantes aprox., entendemos que sería de gran dificultad poder
analizar los valores sociales de todos ellos, por ello, la estadística
nos dota de una herramienta que es la muestra para extraer un conjunto de
población que represente a la globalidad y sobre la muestra realizar el
estudio. Una muestra representativa contiene las características
relevantes de la población en las mismas proporciones que estan
incluidas en tal población.
Los expertos en estadística recogen datos de una
muestra. Utilizan esta información para hacer
referencias sobre la población que esta representada por la
muestra. En consecuencia muestra y población
son conceptos relativos. Una población es un
todo y una muestra es una fracción o segmento de ese todo.
Exactitud y Precisión de Datos
La exactitud de una medición hace referencia a su cercanía al
valor que pretende medir.
La precisión esta asociada al número de cifras decimales
utilizados para expresar lo medido.
Un instrumento inexacto nos entregaresultados
sesgados, 'desplazados'; uno impreciso, resultados
'ambiguos', 'difusos'.
Así, por ejemplo, una pesa es exacta si nos entrega el peso correcto,
sin agregarle ni quitarle. Asimismo,
es mas precisa en la medida que el aparato usado es capaz de detectar
diferencias de peso mas pequeñas.
La exactitud y precisión exigibles a una medición,
dependeran de los objetivos del estudio que la utiliza. La
precisión de un resultado estadístico
debe estar de acuerdo con la precisión de los datos originales y con las
exigencias propias del proyecto que los usa.
Es facil cometer el error de responder usando mas decimales que los contenidos en las mediciones iniciales,
aumentando artificialmente la precisión por la propia capacidad de
calculo de los computadores. Por otra parte, es de suma importancia
cuidar que, durante el proceso de calculo
intermedio, no se pierda precisión innecesariamente. Es importante
mantener el maximo posible de decimales, pues esto ayuda a controlar la
aparición y propagación de errores numéricos que invaliden
los resultados.
Estos son errores de precisión y exactitud ajenos al proceso de
medición inicial y son introducidos típicamente por los
métodos numéricos usados y por la aritmética del
computador que tiene una precisión finita para representar interiormente
a los números.
Bibliografías
https://www.profesorenlinea.cl/matematica/EstadisticaMediaMedianaModa.htm
https://html.rincondelvago.com/variables-estadisticas_1.html
https://answers.yahoo.com/question/index?qid=20090206115207AAzNXDT
https://www.ehowenespanol.com/variable-estandarizada-biologia-info_133550/