Matemáticas aplicadas a las ciecias sociales I
Parte I
Estadística bidimensional
1. Variable bidimensional
En éste capítulo estudiaremos las técnicas para:
Elegir cuál es la variable independiente (x) y cuál es la dependiente (y).
Resumir información mediante las tablas de frecuencia: Simples y de doble entrada.
Comprobar los cálculos de las tablas de frecuencia tanto con la calculadora como con el ordenador.
Representar datos mediante la correspondiente nube de puntos, nombrando los ejes e intuyendo el tipo
de regresión así como el denominado centro de gravedad(x;y).
Calcular parámetros (medias, desviaciones, covarianza, coeciente de correlación,...) de las distribucio-
nes de dos variables X, Y.
Calcular la recta de regresión de y sobre x.
Utilizar dicha recta para realizar estimaciones, principal objetivo de este tema.
Dos variables X e Y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente
el valor de la segunda. Por ejemplo:
La estatura y el peso de unos jugadores de un equipo de baloncesto.
Calicaciones en Física y Matemáticas de los alumnos de una clase.
Ingresos y gastos de una familia.
Producción y ventas de una fábrica.
Gastos en publicidad y benecios de una empresa.
Variable estadística bidimensional:Una variable bidimensional es una variable en la que cada individuo está
denido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadísticas en las que sí existe
relación entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Distribuciones bidimensionales:Son aquellas en las que a cada individuo le corresponden los valores de dos variables,
las representamos por el par(xi; yi).
Las tablas de frecuencia pueden darse de dos maneras:
Tablas simples o marginales: Recogen en las o columnas las frecuencias de los datos.
Tablas de doble entrada:Recoge en cada casilla la frecuencia correspondiente a cada la y cada columna de
los valores de cada variable.
Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llamanube
de puntosodiagrama de dispersión. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos
lo mejor posible, llamadarecta de regresión.
1.1. Cálculo de parámetros de las variables marginales
Para realizar un estudio cuantitativo (con números) de una distribución bidimensional se utilizan las correspondiente
distribuciones marginales (estudio de las dos variables por separado), repasando por tanto los contenidos de la estadística
descriptiva. Para ello, la información de las tablas de frecuencias deben pasarse a las correspondientes tablas marginales.
Con ello, calculamos las medias y desviaciones marginales de X, Y respectivamente.
Media de la variable X:
x=
P
xifi
N
(1)
Media de la variable Y:
y=
P
yifi
N
(2)
Varianza de la variable X:
[email protected]