|pontificia universidad católica del perú |
|Diploma de Estadística Aplicada |
| |
| |
|TÉCNICAS DE ANÁLISIS MULTIVARIADO |
| |
| |
| |
| |
| |
| |
|Integrantes |
| |
|Rodrigo Vásquez López |
|La Madrid Carmen Susana |
Profesor: Carlos Veliz (Teoría) y Cristian Bayes (Laboratorio)
DESARROLLO DEL TRABAJO
1.- Análisis de conglomerados
El análisis de conglomerado nos va a permitir agrupar las variables en función
a la similitud que existe entre ellos.
Para el análisis de conglomerados se utilizó el análisis de
conglomerado jerárquico, porque no se conoce el número de cluster y el número
de objetos no es demasiado grande.
Del análisis en el SPSS obtenemos los siguientes cuadros y gráficos:
En la matriz de distancia se observa que las distancias entre los individuos es
mínima y que el primer cluster está formado por aquellos individuos más
cercanos (con menor distancia entre ellos) que son % Viviendas conacceso a agua
y desagüe a la vez e Ingreso familiar per cápita (S/. Mes).
|Matriz de distancias |
|Caso |Archivo matricial de entrada |
| |
|Etapa |Conglomerado que se combina |Coeficientes |Etapa en la que el
conglomerado aparece |Próxima etapa |
| | | |por primera vez | |
| |Conglomerado 1 |
|Ingreso |Escolaridad |
|Saneamiento |Identidad |
|Electricidad |Policias |
|Vida | |
|Salud | |
|Alfabetismo | |
Por lo que tendríamos las categorías clasiï¬cadas en dos grupos según su
comportamiento en términos de cohesión social. El objetivos
a partir de aquí será utilizar otros métodos de conglomerado (no de distancia)
y veriï¬car si se forman los mismos grupos o al menos similares.
Análisis discriminante
A diferencia del análisis de conglomerado que
nos permite detectar el número optimo de grupos y su similitud a partir del número de casos, el
análisis discrimínate va a realizar la clasificación tomando en cuenta la
variable independiente.
|Autovalores |
|Función |Autovalor |% de varianza |% acumulado |Correlación canónica |
|1 |4,646a |100 |100,0 |,907 |
|a. Se han empleado las 1 primeras funciones discriminantes canónicas en el
análisis. |
En la tabla de Autovalores, en la sección de correlación canónica observamos
que la correlación canoníca está bien diferenciada.
|Lambda de Wilks |
|Contraste de las |Lambda de Wilks |Chi-cuadrado |gl|Sig. |
|funciones | | | | |
|1 | |32,023 |9 |,000 |
En la tabla de de lambda de Wilks observamos que el sig es menor de 0.05 por lo
que decimos que existe diferencia de comportamiento entre las medias de los dos
grupos. Además los valores de lambda próximos a cero indican que la diferencia
es debida a la diferencia entre las medias.
|Resultados de la clasificacióna |
| | |Average Linkage (Between |Grupo de pertenencia pronosticado |Total |
| | |Groups) | | |
| |
En la tabla de resumen se observa que en el conglomerado 1 hay 19 sujetos que
están bien clasificados, mientras que en el conglomerado 2 hay 6 sujetos que
están bien clasificados. El 100% de los sujetos están bien clasificados, por lo
que se dice que la clasificación es altamente fiable.
Análisis factorial
Para realizar el análisis factorial, primero
de debe realizar un análisis de fiabilidad o confiabilidad.
|Estadísticos de fiabilidad |
|Alfa de Cronbach |N de elementos |
| |9 |
El número de elementos es 9 y el alfa de cronbach es 0.516 y nos indica la
consistencia interna, la correlación de una variable y otra.
|Estadísticos total-elemento |
| |Media de la escala si|Varianza de la escala|Correlación |Alfa de Cronbach si
|
| |se elimina el |si se elimina el |elemento-total |se elimina el |
| |elemento |elemento |corregida |elemento |
|Esperanza de vida al nacer (años) |722
|21266,713 |,811 |,511 |
|Tasa de alfabetismo de adultos (%) |704,3081 |20328,709 |,805 |,483 |
|Ingreso familiar per cápita (S/. |480,1969 |1966,511 |,917 |,801 |
|Mes) | | | | |
|Médicospor cada 10,000 habitantes |782,2098 |20402,502 |,797 |,486 |
|% Viviendas con acceso a agua y |741,5343 |17423,415 |,887 |,390 |
|desagüe a la vez | | | | |
|% Viviendas con electricidad |727,6181 |18166,308 |,882 |,415 |
|Tasa de escolaridad de 5 a 18 años |710,0103 |21162,254 |,469 |,508 |
|(%) | | | | |
|% Población con acta de nacimiento |698,8698 |21546,400 |,319 |,519 |
|o DNI | | | | |
|Policías por cada mil habitantes |794,3315 |21668,884 |,501 |,522 |
En la tabla total – elemento se observa que si se elimina Tasa de escolaridad
de 5 a 18 años el alfa de cronbach aumenta de 0.469 a 0.508, al igual que si se
elimina Población con acta de nacimiento o DNI el alfa aumenta de 0.319 a 0.519
y si se elimina policías por cada mil habitantes aumneta de 0.501 a 0.522.
Al eliminar los datos se obtiene los siguientes resultados
|Estadísticos de fiabilidad |
|Alfa de Cronbach |N de elementos |
|,526 |6 |
El alfa de cronbach aumenta de 0.516 a 0.526 y hay 6 elementos que se están
evaluando.
|Estadísticos total-elemento |
| |Media de la escala si|Varianza de la escala|Correlación |Alfa de Cronbach si
|
| |se elimina el |si se elimina el |elemento-total |se elimina el |
| |elemento |elemento |corregida |elemento |
|Esperanza de vida al nacer (años) |540
|20458,803 |,809 |,533 |
|Tasa de alfabetismo de adultos (%) |521,8720 |19517,213 |,818 |,500 |
|Ingreso familiar per cápita (S/. |297,7608 |1651,530 |,942 |,820 |
|Mes) | | || |
|Médicos por cada 10,000 habitantes |599,7737 |19628,145 |,785 |,504 |
|% Viviendas con acceso a agua y |559,0982 |16717,947 |,881 |,394 |
|desagüe a la vez | | | | |
|% Viviendas con electricidad |545,1821 |17449,532 |,873 |,423 |
Ahora en ninguno de los casos el alfa aumenta y se procede a realizar el
análisis factorial, tomando en cuenta las 6 categorías que se presentan en el
cuadro.
Solo se ha extraído un componente
|Varianza total explicada |
|Componente |Autovalores iniciales |Sumas de las saturaciones al cuadrado de la
extracción |
| |
Del análisis
factorial sugiere que las categorías se agrupen en 1 dimensión. El método de extracción de los factores que elegimos le indica
cuantos componentes (factores) son más viables. En este caso, con sólo 1
factor se explica un 79.5% de la varianza en el modelo factorial.
|Matriz de componentesa |
| |Componente |
| |1 |
|Esperanza de vida al nacer (años) | |
|Tasa de alfabetismo de adultos (%) |,828 |
|Ingreso familiar per cápita (S/. | |
|Mes) | |
|Médicos por cada 10,000 habitantes |,842 |
|% Viviendas con acceso a agua y |,929 |
|desagüe a la vez | |
|% Viviendas con electricidad |,911 |
|Método de extracción: Análisis de componentes |
|principales. |
|a. 1 componentes extraídos |
Otra forma de determinar que preguntas se relacionan con cada componente se
proporciona por los “coeficientes de la matriz” (component matriz). Esta matriz le indica los coeficientes estandarizados de cada
pregunta por componente (dimensión/factor). En este
caso, se observa que el primer factor/dimensión está integrado por 6
categorías.
[pic]
En la grafica se observa que los departamentos se agrupan según factor común
como nivel de vidasiendo los más altos Lima, Callao, y se visualiza a los departamentos
con menor nivel de vida como Apurímac, Ayacucho, Huancavelica, Huánuco y
Cajamarca.
4.- Análisis de escalamiento multidimensional
Al realizar el análisis de escalamiento multidimensional se obtienen las
siguientes tablas y gráficos:
|Proximidades |
| |
|Stress bruto normalizado |,02866 |
|Stress-I |,16929a |
|Stress-II |,37086a |
|S-Stress |,05989b |
|Dispersión explicada (D.A.F.) |,97134 |
|Coeficiente de congruencia de |,98557 |
|Tucker | |
|PROXSCAL minimiza el stress bruto normalizado. |
|a. Factor para escalamiento óptimo = 1.030. |
|b. Factor para escalamiento óptimo = .990.
[pic]
En el mapa perceptivo de las categorías evaluadas se observa que contrabando y
desfalco ocupan los lugares más extremos en cada una de las dimensiones, por lo
que se puede decir que tienen características contrapuestas. Así se puede
interpretar que en la dimensión 1(horizontal) a la derecha inferior están
situadas las actividades muy relacionadas entre sí moralmente (desfalco y
chantaje) y a la parte central las que se relacionan mas físicamente
(terrorismo, secuestro, agresión , violencia, homicidio, atraco y robo).
En la Figura 4 se ofrece el espacio de sujetos.
Mientras el espacio de objetos es común para los dos objetos, el espacio de
sujetos nos indica que el sujeto 1 (SRC_1 enel gráfico) concede más importancia
a la dimensión 1, los rasgos deportivos del coche, mientras el sujeto 2
(SRC_2, en el gráfico) concede más importancia a la confortabilidad de los
coches. A diferencia del espacio de objetos donde cada
objeto se representa por un punto, en el espacio de sujetos, el sujeto se
representa por un vector (una línea). Cuanto más cerca esté el vector de una
dimensión, más importancia le concede el sujeto adicha
dimensión y cuanto más alejado menos importancia. En efecto, se observa en el
gráfico que el sujeto 1 está más cerca de la dimensión 1 (diseño deportivo),
concediendo por tanto más importancia a esta dimensión, mientras el sujeto 2
está más cerca de la dimensión2 indicando que en su caso es ésta la dimensión
(confortabilidad de los coches) la que adquiere más peso en susjuicios sobre
las marcas de coche.