tema2-estadistica-bidimensional.pdf

LizbethTito2 74 views 5 slides Nov 14, 2023
Slide 1
Slide 1 of 5
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5

About This Presentation

estadistica bidimensional tema resumido


Slide Content

Matemáticas aplicadas a las ciecias sociales I
Parte I
Estadística bidimensional
1. Variable bidimensional
En éste capítulo estudiaremos las técnicas para:
Elegir cuál es la variable independiente (x) y cuál es la dependiente (y).
Resumir información mediante las tablas de frecuencia: Simples y de doble entrada.
Comprobar los cálculos de las tablas de frecuencia tanto con la calculadora como con el ordenador.
Representar datos mediante la correspondiente nube de puntos, nombrando los ejes e intuyendo el tipo
de regresión así como el denominado centro de gravedad(x;y).
Calcular parámetros (medias, desviaciones, covarianza, coeciente de correlación,...) de las distribucio-
nes de dos variables X, Y.
Calcular la recta de regresión de y sobre x.
Utilizar dicha recta para realizar estimaciones, principal objetivo de este tema.
Dos variables X e Y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente
el valor de la segunda. Por ejemplo:
ˆLa estatura y el peso de unos jugadores de un equipo de baloncesto.
ˆCalicaciones en Física y Matemáticas de los alumnos de una clase.
ˆIngresos y gastos de una familia.
ˆProducción y ventas de una fábrica.
ˆGastos en publicidad y benecios de una empresa.
Variable estadística bidimensional:Una variable bidimensional es una variable en la que cada individuo está
denido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadísticas en las que sí existe
relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Distribuciones bidimensionales:Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par(xi; yi).
Las tablas de frecuencia pueden darse de dos maneras:
ˆTablas simples o marginales: Recogen en las o columnas las frecuencias de los datos.
ˆTablas de doble entrada:Recoge en cada casilla la frecuencia correspondiente a cada la y cada columna de
los valores de cada variable.
ˆSi representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llamanube
de puntosodiagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos
lo mejor posible, llamadarecta de regresión.
1.1. Cálculo de parámetros de las variables marginales
Para realizar un estudio cuantitativo (con números) de una distribución bidimensional se utilizan las correspondiente
distribuciones marginales (estudio de las dos variables por separado), repasando por tanto los contenidos de la estadística
descriptiva. Para ello, la información de las tablas de frecuencias deben pasarse a las correspondientes tablas marginales.
Con ello, calculamos las medias y desviaciones marginales de X, Y respectivamente.
ˆMedia de la variable X:
x=
P
xifi
N
(1)
ˆMedia de la variable Y:
y=
P
yifi
N
(2)
ˆVarianza de la variable X:
[email protected]

Matemáticas aplicadas a las ciecias sociales I

2
x=
P
x
2
i
fi
N
x
2
(3)
ˆVarianza de la variable Y:

2
y=
P
y
2
i
fi
N
y
2
(4)
1.2. La covarianza y el coeciente de correlación lineal
ˆLacovarianzade una variable bidimensional es la media aritmética de los productos de las desviaciones de cada
una de las variables respecto a sus medias respectivas. La covarianza se representa porxy.
xy=
P
xiyifi
N
XY (5)
La covarianza indica el sentido de la correlación entre las variables:
Sixy>0la correlación es positiva (o directa). En éste caso cuando la variable independiente aumenta, la
variable dependiente también aumenta.
Sixy<0la correlación es negativa (o inversa).En éste caso cuando la variable independiente aumenta, la
variable dependiente disminuye (hace lo contrario).
La covarianza presenta comoinconveniente, el hecho de que su valor depende de la escala elegida para los ejes.
Es decir, la covarianza variará si expresamos el dinero en euros o en céntimos. Por tanto, para realizar un estudio
sin que importe la unidad en que se miden las variables, utilizaremos el coeciente de correlación:
ˆElcoeciente de correlación lineales el cociente entre la covarianza y el producto de las desviaciones típicas
de ambas variables. Su fórmula es:
r=
xy
xy
(6)
Las propiedades del coeciente de correlación son:
El coeciente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos el dinero en
euros o en céntimo, el coeciente de correlación no varía.
El signo del coeciente de correlación es el mismo que el de la covarianza. Si la covarianza es positiva, la
correlación es directa, si la covarianza es negativa, la correlación es inversa y si la covarianza es nula, no existe
correlación.
El coeciente de correlación lineal es un número real comprendido entre=1 y 1, es decir:1r1.
Si el coeciente de correlación lineal toma valores cercanos a=1 la correlación es fuerte e inversa, y será tanto
más fuerte cuanto más se aproxime a1.
Si el coeciente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto
más fuerte cuanto más se aproxime a 1.
Si el coeciente de correlación lineal toma valores cercanos a 0, la correlación es débil.
Sir= 1ór=1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.
ˆSi analizamos lo que ocurre grácamente, seguro que nos va a dejar más clara el coeciente de correlación y la
covarianza:
[email protected]

Matemáticas aplicadas a las ciecias sociales I
Se nota el alto grado de correlación lineal
negativa (porque se agrupan los datos a una
recta con pendiente negativa), por tanto la
covarianza debe ser negativa. El coeciente de
correlación lineal toma valores cercanos a -1, por
tanto la correlación es fuerte e inversa, y será
tanto más fuerte cuanto más se aproxime a1.
Se nota el altísimo grado de correlación lineal
positiva (porque se agrupan los datos a una recta
de pendiente positiva), por tanto la covarianza
debe ser positiva. El coeciente de correlación
lineal toma valores cercanos a 1, la correlación es
fuerte y directa, y será tanto más fuerte cuanto
más se aproxime a 1.
Se nota que los datos están muy dispersos por lo
que no existe prácticamente corelación y por
tanto la covarianza debe ser un valor próximo a
cero.
Se nota que los datos están bastante dispersos
por lo que la correlación es poca y negativa, por
tanto la covarianza debe ser un valor negativo.
Se nota que los valores están muy dispersos (no se paroximan a una recta), no existe prácticamente
correlación y por tanto la covarianza y coeciente de correlación toma valores cercanos a 0, la
correlación es débil.
1.3. La recta de regresión lineal
La recta de regresión es la que mejor se ajusta a la nube de puntos. La recta de regresión pasa SIEMPRE por el
punto(x;y)llamado centro de gravedad.
ˆLa recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.
yy=
xy

2
x
(xx) (7)
ˆSi la correlación es nula,r= 0, las rectas de regresión son perpendiculares entre sí.
ˆA partir de estas rectas podemos calcular los valores de x conocidos los de y (o viceversa), es decir, realizar
predicciones para valores que no se encuentran en nuestra tabla de valores. La abilidad que podemos conceder a
los cálculos obtenidos viene dada por el valor numérico del coeciente de correlación:
Si r está muy cerca de 0, no tiene sentido realizar ningún tipo de estimaciones.
Si r es próximo a 1o1, las estimaciones realizadas estarán cerca de los valores reales.
Sir= 1ór=1, las estimaciones realizadas coincidirán con los valores reales.
[email protected]

Matemáticas aplicadas a las ciecias sociales I
2. Ficha de problemas
1.
x: Horas de estudio2016342327321822
y: Calicación obtenida6.568.5799.558
a)
b)
c)
d)
2.
los siguientes datos:
Nºhoras dormidas678910
Nºde horas de TV43321
Frecuencias 31620101
a)
b)
3.-Se ha medido el peso (X) y la estatura en centímetros (Y) de los alumnos de una clase. Su peso medio ha sido de 56
kg con una desviación típica de 2.5 kg. La ecuación de la recta de regresión que relaciona la estatura y el peso es:
y= 1;8x+ 62
a)
b)
c)
d)
e)
4.
verano por 15 grupos musicales y las ventas de discos de estos grupos(expresadas en miles de discos):
y = Discos \ x = Conciertos[10;30)[30;40)[40;80)
[1;5) 3 - -
[5;10) 1 4 1
[10;20) - 1 5
a)
b)
c)
Para ello calcula el coeciente de correlación.
d)
e)
5.--En dos estudios realizados sobre los datos de una variable bidimensional, las rectas de regresión fueron las siguientes:
a)
Recta de regresión de Y sobre X:8x3y61 = 0 Recta de regresión de X sobre Y:xy+ 18 = 0
b)
Recta de regresión de Y sobre X:8x5y+ 20 = 0 Recta de regresión de X sobre Y:5x2y10 = 0
Si conocemos quex= 23,y= 41, yr= 0;8, comprueba cuál de los estudios es válido.
6.-Nico arma que si una nube de puntos se aproxima a una recta, el coeciente de correlación siempre vale 1 o -1.
Como Tere no está de cuerdo, Nico prueba con los puntos de la recta cuya ecuación esy=5x+ 20y Tere hace lo
mismo con los puntos dey= 2xx
2
. ¾Quién tiene razón?, ¾por qué?
7.
[email protected]

Matemáticas aplicadas a las ciecias sociales I
8.
entre los datos recogidos. Los coecientes de correlación obtenidos han sido:
1= 0;9 2= 0;83 3= 1 4= 0;6 5= 0
Asigna a cada par de variables el correspondiente coeciente.
a)
naturas aprobadas en una evaluación.
b)
c)
conseguidas por un equipo de baloncesto.
d)
1ºbachillerato.
e)
minado y velocidad del mismo en dicho tiempo.
9.
a)
-0.92 0.95 0.6 -0.65
b)
y= 3x+ 0;2 y= 1;3x0;9 y=0;6x+ 10 y=2x12;6
10.Práctica a ordenador.La distribución bidimensional que se obtiene al estudiar la estatura y el peso de 10 personas
es:
Peso ( kg)70658560707590806070
Estatura (cm)175160180155165180185175160170
a)
b)
c)
d)
e)
f)
g)
h)
[email protected]
Tags