Consultar ensayos de calidad


Analisis multivariado - tÉcnicas de anÁlisis multivariado



|pontificia universidad católica del perú |
|Diploma de Estadística Aplicada |
| |
| |
|TÉCNICAS DE ANÁLISIS MULTIVARIADO |
| |
| |
| |
| |
| |
| |
|Integrantes |
| |
|Rodrigo Vásquez López |
|La Madrid Carmen Susana |






Profesor: Carlos Veliz (Teoría) y Cristian Bayes (Laboratorio)









DESARROLLO DEL TRABAJO

1.- Análisis de conglomerados

El análisis de conglomerado nos va a permitir agrupar las variables en función a la similitud que existe entre ellos.
Para el análisis de conglomerados se utilizó el análisis de conglomerado jerárquico, porque no se conoce el número de cluster y el número de objetos no es demasiado grande.


Del análisis en el SPSS obtenemos los siguientes cuadros y gráficos:

En la matriz de distancia se observa que las distancias entre los individuos es mínima y que el primer cluster está formado por aquellos individuos más cercanos (con menor distancia entre ellos) que son % Viviendas conacceso a agua y desagüe a la vez e Ingreso familiar per cápita (S/. Mes).







|Matriz de distancias |
|Caso |Archivo matricial de entrada |
| |
|Etapa |Conglomerado que se combina |Coeficientes |Etapa en la que el conglomerado aparece |Próxima etapa |
| | | |por primera vez | |
| |Conglomerado 1 |
|Ingreso |Escolaridad |
|Saneamiento |Identidad |
|Electricidad |Policias |
|Vida | |
|Salud | |
|Alfabetismo | |

Por lo que tendríamos las categorías clasiï¬cadas en dos grupos según su comportamiento en términos de cohesión social.
El objetivos a partir de aquí será utilizar otros métodos de conglomerado (no de distancia) y veriï¬car si se forman los mismos grupos o al menos similares.
Análisis discriminante

A diferencia del análisis de conglomerado que nos permite detectar el número optimo de grupos y su similitud a partir del número de casos, el análisis discrimínate va a realizar la clasificación tomando en cuenta la variable independiente.


|Autovalores |
|Función |Autovalor |% de varianza |% acumulado |Correlación canónica |
|1 |4,646a |100 |100,0 |,907 |
|a. Se han empleado las 1 primeras funciones discriminantes canónicas en el análisis. |


En la tabla de Autovalores, en la sección de correlación canónica observamos que la correlación canoníca está bien diferenciada.

|Lambda de Wilks |
|Contraste de las |Lambda de Wilks |Chi-cuadrado |gl|Sig. |
|funciones | | | | |
|1 | |32,023 |9 |,000 |

En la tabla de de lambda de Wilks observamos que el sig es menor de 0.05 por lo que decimos que existe diferencia de comportamiento entre las medias de los dos grupos. Además los valores de lambda próximos a cero indican que la diferencia es debida a la diferencia entre las medias.

|Resultados de la clasificacióna |
| | |Average Linkage (Between |Grupo de pertenencia pronosticado |Total |
| | |Groups) | | |
| |


En la tabla de resumen se observa que en el conglomerado 1 hay 19 sujetos que están bien clasificados, mientras que en el conglomerado 2 hay 6 sujetos que están bien clasificados. El 100% de los sujetos están bien clasificados, por lo que se dice que la clasificación es altamente fiable.


Análisis factorial

Para realizar el análisis factorial, primero de debe realizar un análisis de fiabilidad o confiabilidad.
|Estadísticos de fiabilidad |
|Alfa de Cronbach |N de elementos |
| |9 |

El número de elementos es 9 y el alfa de cronbach es 0.516 y nos indica la consistencia interna, la correlación de una variable y otra.
|Estadísticos total-elemento |
| |Media de la escala si|Varianza de la escala|Correlación |Alfa de Cronbach si |
| |se elimina el |si se elimina el |elemento-total |se elimina el |
| |elemento |elemento |corregida |elemento |
|Esperanza de vida al nacer (años) |722 |21266,713 |,811 |,511 |
|Tasa de alfabetismo de adultos (%) |704,3081 |20328,709 |,805 |,483 |
|Ingreso familiar per cápita (S/. |480,1969 |1966,511 |,917 |,801 |
|Mes) | | | | |
|Médicospor cada 10,000 habitantes |782,2098 |20402,502 |,797 |,486 |
|% Viviendas con acceso a agua y |741,5343 |17423,415 |,887 |,390 |
|desagüe a la vez | | | | |
|% Viviendas con electricidad |727,6181 |18166,308 |,882 |,415 |
|Tasa de escolaridad de 5 a 18 años |710,0103 |21162,254 |,469 |,508 |
|(%) | | | | |
|% Población con acta de nacimiento |698,8698 |21546,400 |,319 |,519 |
|o DNI | | | | |
|Policías por cada mil habitantes |794,3315 |21668,884 |,501 |,522 |

En la tabla total – elemento se observa que si se elimina Tasa de escolaridad de 5 a 18 años el alfa de cronbach aumenta de 0.469 a 0.508, al igual que si se elimina Población con acta de nacimiento o DNI el alfa aumenta de 0.319 a 0.519 y si se elimina policías por cada mil habitantes aumneta de 0.501 a 0.522.
Al eliminar los datos se obtiene los siguientes resultados

|Estadísticos de fiabilidad |
|Alfa de Cronbach |N de elementos |
|,526 |6 |

El alfa de cronbach aumenta de 0.516 a 0.526 y hay 6 elementos que se están evaluando.

|Estadísticos total-elemento |
| |Media de la escala si|Varianza de la escala|Correlación |Alfa de Cronbach si |
| |se elimina el |si se elimina el |elemento-total |se elimina el |
| |elemento |elemento |corregida |elemento |
|Esperanza de vida al nacer (años) |540 |20458,803 |,809 |,533 |
|Tasa de alfabetismo de adultos (%) |521,8720 |19517,213 |,818 |,500 |
|Ingreso familiar per cápita (S/. |297,7608 |1651,530 |,942 |,820 |
|Mes) | | || |
|Médicos por cada 10,000 habitantes |599,7737 |19628,145 |,785 |,504 |
|% Viviendas con acceso a agua y |559,0982 |16717,947 |,881 |,394 |
|desagüe a la vez | | | | |
|% Viviendas con electricidad |545,1821 |17449,532 |,873 |,423 |

Ahora en ninguno de los casos el alfa aumenta y se procede a realizar el análisis factorial, tomando en cuenta las 6 categorías que se presentan en el cuadro.





Solo se ha extraído un componente
|Varianza total explicada |
|Componente |Autovalores iniciales |Sumas de las saturaciones al cuadrado de la extracción |
| |

Del análisis factorial sugiere que las categorías se agrupen en 1 dimensión. El método de extracción de los factores que elegimos le indica cuantos componentes (factores) son más viables. En este caso, con sólo 1 factor se explica un 79.5% de la varianza en el modelo factorial.


|Matriz de componentesa |
| |Componente |
| |1 |
|Esperanza de vida al nacer (años) | |
|Tasa de alfabetismo de adultos (%) |,828 |
|Ingreso familiar per cápita (S/. | |
|Mes) | |
|Médicos por cada 10,000 habitantes |,842 |
|% Viviendas con acceso a agua y |,929 |
|desagüe a la vez | |
|% Viviendas con electricidad |,911 |
|Método de extracción: Análisis de componentes |
|principales. |
|a. 1 componentes extraídos |


Otra forma de determinar que preguntas se relacionan con cada componente se proporciona por los “coeficientes de la matriz” (component matriz).
Esta matriz le indica los coeficientes estandarizados de cada pregunta por componente (dimensión/factor). En este caso, se observa que el primer factor/dimensión está integrado por 6 categorías.

[pic]


En la grafica se observa que los departamentos se agrupan según factor común como nivel de vidasiendo los más altos Lima, Callao, y se visualiza a los departamentos con menor nivel de vida como Apurímac, Ayacucho, Huancavelica, Huánuco y Cajamarca.















4.- Análisis de escalamiento multidimensional

Al realizar el análisis de escalamiento multidimensional se obtienen las siguientes tablas y gráficos:

|Proximidades |
| |
|Stress bruto normalizado |,02866 |
|Stress-I |,16929a |
|Stress-II |,37086a |
|S-Stress |,05989b |
|Dispersión explicada (D.A.F.) |,97134 |
|Coeficiente de congruencia de |,98557 |
|Tucker | |
|PROXSCAL minimiza el stress bruto normalizado. |
|a. Factor para escalamiento óptimo = 1.030. |
|b. Factor para escalamiento óptimo = .990.

[pic]



En el mapa perceptivo de las categorías evaluadas se observa que contrabando y desfalco ocupan los lugares más extremos en cada una de las dimensiones, por lo que se puede decir que tienen características contrapuestas. Así se puede interpretar que en la dimensión 1(horizontal) a la derecha inferior están situadas las actividades muy relacionadas entre sí moralmente (desfalco y chantaje) y a la parte central las que se relacionan mas físicamente (terrorismo, secuestro, agresión , violencia, homicidio, atraco y robo).








En la Figura 4 se ofrece el espacio de sujetos. Mientras el espacio de objetos es común para los dos objetos, el espacio de sujetos nos indica que el sujeto 1 (SRC_1 enel gráfico) concede más importancia a la dimensión 1, los rasgos deportivos del coche, mientras el sujeto 2 (SRC_2, en el gráfico) concede más importancia a la confortabilidad de los coches. A diferencia del espacio de objetos donde cada objeto se representa por un punto, en el espacio de sujetos, el sujeto se representa por un vector (una línea). Cuanto más cerca esté el vector de una dimensión, más importancia le concede el sujeto adicha dimensión y cuanto más alejado menos importancia. En efecto, se observa en el gráfico que el sujeto 1 está más cerca de la dimensión 1 (diseño deportivo), concediendo por tanto más importancia a esta dimensión, mientras el sujeto 2 está más cerca de la dimensión2 indicando que en su caso es ésta la dimensión (confortabilidad de los coches) la que adquiere más peso en susjuicios sobre las marcas de coche.


Política de privacidad