Técnicas de Análisis Multivariantes Dr. Willin Álvarez
Dr. Willin Gabriel Álvarez Irausquin “El pensamiento estadístico será un día tan necesario para la ciudadanía eficiente como la habilidad de leer o escribir”. Herbert George Wells (1866-1946)
Dr. Willin Gabriel Álvarez Irausquin
La Estadística se encarga de la recopilación, presentación y análisis de datos provenientes de experimentos o investigaciones para obtener conclusiones, predicciones y tomar decisiones Descriptiva --- Organizar y resumir datos Inferencial ---- Conclusiones y predicciones Paramétrica – No Paramétrica Univariante - Multivariante
Estadística Descriptiva --- Organizar y resumir datos - EXCELL MICROFOFT ® SPSS ( Statistical Package for the Social Sciences ) ® MINITAB ®
Diagrama de Tallo y Hojas Diagrama de Caja Distribución de Frecuencia Histograma de Frecuencias Diagrama de Pareto Diagrama de Tortas (Pastel) Diagrama de Barras Diagrama de Líneas (Control) Diagrama de Radar (Araña) Gráficos de Probabilidad Técnicas de presentación de conjuntos de datos
Medidas de Tendencia Central Media Mediana Moda Medidas de Dispersión Varianza Muestral Rango Muestral Coeficiente de Variación Recorrido Intercuartil Medidas de Forma Coeficiente de Asimetría Coeficiente de Curtosis
El análisis estadístico de datos incluye un conjunto de métodos y técnicas univariantes y multivariantes que permiten estudiar y tratar en bloque una o varias variables medidas u observadas en una colección de individuos.
Definición “El conjunto de técnicas estadísticas que de forma simultánea miden, explican y predicen todas las relaciones existentes entre los elementos que conforman una tabla de datos, proporcionando un resultado que debe ser interpretado minusiosamente por el analista” (Iglesias y Sulé en Lévy 2005)
Definición “El análisis multivariante consiste en una colección de métodos que puede ser usado cuando se realizan varias mediciones sobre los individuos u objetos en una o más muestras. Nos referimos a las medidas como variables y a los individuos u objetos como unidades u observaciones ” ( Rencher , 2000)
Ejemplos Datos Multivariantes Dr. Willin Gabriel Álvarez Irausquin
Dr. Willin Gabriel Álvarez Irausquin 1. Medidas del cráneo de cocodrilos Código Descripción cl Longitud del cráneo cw Ancho del cráneo sw Ancho del hocico sl Longitud del hocico dcl Longitud dorsal del cráneo ow Ancho máximo orbital olw Ancho mínimo inter-orbital ol Longitud máxima orbital lcr Longitud del paladar post-orbital wcr Ancho posterior del paladar craneal wn Ancho máximo entre los orificios nasales
2. Características de candidatos a ingresar a la policía (Johnson, 2000) Etiqueta Variable EST Estatura ESTSEN Longitud del brazo BRAZO Longitud del antebrazo ANTEB Longitud del antebrazo MANO Ancho de la mano MUSLO Longitud del muslo PIERNA Longitud de la parte inferior de la pierna PIE Longitud del pie
Dr. Willin Gabriel Álvarez Irausquin 3. Gases Contaminantes En la tabla siguiente se presentan las 10 primeras observaciones de cinco variables de niveles de gases contaminantes (CO: X 3 , NO: X 4 , NO 2 : X 5 , O 3 : X 6 y HC: X 7 ) y dos relacionadas (Intensidad del viento: X 1 y Radiación solar: X 2 )
4. Consumo de caucho y otras variables desde 1948 hasta 1963 (Johnson, 2000). Etiqueta Variable CTC Consumo total de caucho CCN Consumo de cauchos para neumáticos PA Producción de automóviles PNB Producto nacional bruto IPD Ingreso personal disponible CCM Consumo de combustible por motor
Análisis de Estadístico de Datos Multivariantes Dr. Willin Gabriel Álvarez Irausquin
Variable
Dr. Willin Gabriel Álvarez Irausquin
Dr. Willin Gabriel Álvarez Irausquin
Dr. Willin Gabriel Álvarez Irausquin
Objetivos (Peña, 2002) 1.- Resumir los datos mediante un pequeño conjunto de nuevas variables, construidas con transformaciones de las originales, con la mínima pérdida de información Dr. Willin Gabriel Álvarez Irausquin
2.- Encontrar grupos en los datos, si existen Dr. Willin Gabriel Álvarez Irausquin
3.- Clasificar nuevas observaciones en grupos definidos Dr. Willin Gabriel Álvarez Irausquin
4.- Relacionar dos o más Conjuntos de Variables Dr. Willin Gabriel Álvarez Irausquin
Dr. Willin Gabriel Álvarez Irausquin Métodos Multivariantes Métodos de Dependencia Métodos Interdependencia Modelos Estructurales Análisis de Regresión Análisis de Supervivencia Manova Correlación Canónica Análisis Discriminante Regresión Logística Análisis Conjunto Dependencia Métrica Dependencia No Métrica Datos Métricos Datos No Métricos Análisis Componentes P Análisis Factorial Escalamiento Multidimensional Análisis Cluster Análisis de Correspondencia Modelos Log-Lineal Escalamiento Multidimensional Análisis Cluster