Presentación sobre Coeficiente de correlacion de pearson
Coeficiente de correlacion de spearman
Size: 865.49 KB
Language: es
Added: Mar 19, 2016
Slides: 20 pages
Slide Content
Coeficiente de Correlación de P earson Docente: Ramón Aray Alumno: Luis Lárez C.I.:26256889
Que es el Coeficiente de Correlación de Pearson En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza , la correlación de Pearson es independiente de la escala de medida de las variables . De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.
Que es una variable? Definición: Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población . Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren valor cuando se relacionan con otras variables, es decir, si forman parte de una hipótesiso de una teoría. En este caso se las denomina constructos o construcciones hipotéticas.
Interpretación El valor del índice de correlación varía en el intervalo [-1,1]: Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa : cuando una de ellas aumenta, la otra también lo hace en proporción constante. Si 0 < r < 1, existe una correlación positiva . Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son independientes : pueden existir todavía relaciones no lineales entre las dos variables . Si -1 < r < 0, existe una correlación negativa . Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa : cuando una de ellas aumenta, la otra disminuye en proporción constante.
Variable cuantitativa : es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos : variable discreta: es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. variable continua: es aquella que puede tomar valores comprendidos entre dos números . Ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
Pasos Para Usar El Coeficiente de Correlación de Pearson Paso 1 Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.
Paso 2 Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo puede ser tedioso. Además de los varios programas de estadística , muchas calculadoras científicas pueden calcular el valor.
Paso 3 Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables . Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos correlacionados , lo que identifica las variables que no pueden ser relacionadas entre sí
Paso 4 Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta en cantidad correspondiente . La interpretación debe determinarse de acuerdo con el contexto del estudio.
Paso 5 Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una cantidad correspondiente . La interpretación, de nuevo , debe determinarse de acuerdo con el contexto del estudio.
Paso 6 Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos variables. En un estudio donde se comparan dos variables que normalmente se identifican como relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un estudio que compara dos variables donde está probado que tienen una relación linear positiva puede identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de correlación de Pearson .
Paso 7 Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el número de las dos observaciones menos 2. Con este valor, identifica el valor crítico correspondiente en la tabla de correlación para una prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad respectivamente. Compara el valor crítico al coeficiente de correlación previamente calculado . Si el coeficiente de correlación es mayor, los resultados son importantes.
Coeficiente de correlación de Spearman En estadística, el coeficiente de correlación de Spearman , ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden . El estadístico ρ viene dado por la expresión : donde D es la diferencia entre los correspondientes estadísticos de orden de x - y . N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
Dibuja tu tabla. Esta organizará la información que necesitas para calcular el coeficiente de correlación de Spearman. Necesitarás:6 columnas con encabezados como se muestra a continuación. Las filas necesarias para poner los pares de datos que tengas. Métodos Para usar el Coeficiente de correlación de Spearman
Llena las primeras dos columnas con los pares de datos . En tu tercer columna clasifica tus datos de la primera columna del 1 hasta n (el número de datos que tienes). Comienza con el más bajo, el cual debe tener el 1, el siguiente número más bajo el 2 y así sucesivamente.
En tu cuarta columna haz lo mismo que en el paso 3, pero clasifica la segunda columna en lugar de la primera . En la columna "d" calcula la diferencia del número de clasificación para cada par de datos.
Eleva al cuadrado cada número de la columna "d" y escribe estos valores en la columna "d 2 ". Suma todos los valores que hay en la columna "d 2 ". Este resultado es Σd 2 .
Escoge alguna de las siguientes fórmulas: Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula simplificada del coeficiente de correlación de Spearman y reemplaza "n" por el número de pares de datos que tienes para calcular la respuesta. Si hay alguna relación en cualquiera de los pasos anteriores, usa más bien la fórmula estándar de coeficiente de correlación de Spearman :
Ventajas y desventajas del Coeficiente de Correlacion de Pearson y Spearman Pearson: Ventajas : El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables. Mientras mas grande sea la muestra mas exacta será la estimación . Desventajas Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas. Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal . Spearman: Ventajas: No esta afectada por los cambios en las unidades de medida. Al ser una técnica no parámetra , es libre de distribución probabilística. Desventajas: Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.