Matriz de datos

899 views 16 slides Sep 30, 2019
Slide 1
Slide 1 of 16
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16

About This Presentation

Matriz de datos


Slide Content

Los datos (concepto)

(© La plata dato iene morgen timolégico enel eno tin «Dm
que significo dado”. Sin embargo, en sentido etico, en el santo de
Jn investigación cintia, como sealn Javier Gil Flores (Análisis de
Datos Cualtavos Aplicaciones aa Investigación Educativa, Barcelo,
Ed PPU, 1994, Cap. 1), “La mayoria de os autores asumen que el
¿vestidor desempeña wn papel activo respect de los dato: dato eel
resultado de un proceso de elaboración es decir e dato hay que

“e Siguiendo a Gil Flores, se puede definir los datos como aquella

información extraida de a realidad que tiene que ser registrada en

algún soporte sie simbólico, que implica una claborción

‘conceptual y además que se pueda expresara través de alguna forma
lenguaje. Tiene los siguientes componentes

= Un contenido format
1 Un regio en ln sport fo
La presión de os mimos en algun forma de lenge mnie no

Los datos

(© Tales componentes operan durante todo el proceso de la

investigación, esto es, desde la elección del tema, la elaboracién del
iso hasta el informe final, pero se plasman durante la etapa de
recolección de datos a través dela administración delas técnicas de
investigación, ya sean cuantitativas 0 cualitativas

(© En efecto, un entrevista producir dats de naturaleza verb un et de
intlgenca datos de naturaleza muménia. También etá a aternativa 3
través de la cul el investigador encuentra ls datos que ha sido

¡dos por “tros ya ea poros sjeos imestiados o po tos

adore. À pesar de ello, el do obenido exe reslado de ma
interacción ene el investigador, con us supuestos Básicos subyacentes, u
enfoque del problema, os objetivos del sudo y su adición a again
Paradigma teórico yo metodológico

Los datos

© Johan Galtung define el témino “dato” de la siguiente manera: “Se
bienen datos sociológicos cuando un sociólogo registra hechos

‘acerca de alin sector de larealidad social o recibe hechos
resisrados para dl”

© También sostiene que todo dato tiene una estructura compuesta por
tees elementos: unidades de análisis, variables y valores. Cualquier
dato consistirá en
emp Uta unidad de ands que
ap En na variable y asumir
a Un determinado valor.

© También sostiene que todo dato tiene un estructura compuesta por
tres elementos: unidades de análisis, variables y valores. Cualquier
dato consistirá en

La unidad de análisis
e Las Unida

de Andis son los elementos menes y no ives
universe de estudio de un entgehen. Sobre
cl comportamiento de as vnabls Las
Frades de análisis se etbleoon de manera revi aa clap de
recolecin de ats, por en, st dion foma pare dl marco
tei. Se pueden lana según Mayntz R. Holm, E. y Hb,
Pe
Dominio pocos de nen human o tp mt cone
ER Feta or al do seais vts om

Om ees nds ceria rpnind en tte
(© cuando as midades son colectivos sociales, se distingue entre
vidades de análisis y unidades de Observación

Las variables

© Francis Kom lo define dela siguiente manera: «En otros términos

el significado completo de la palabra "variable" al como es usada
en ciencias sociales, contiene no slo la comotación de "aspecto" o
aspectos o dimensiones de asumir diferentes valores

Gnir el término variable, como un concepto
0 y/o magnitud de un elemento unidad:
análisis capaz de asumir diferentes cualidades y/o valores
© Ensociología un atributo o cualidad que presentan los individuos o

los hechos sociales susceptible de ser observado y medido de alg

Las valores

© «Un Valor o categoria es uma de las diferentes posiciones o
“alternativas que presenta la variable y adopta alguna ded de
análisis y se puede expresar cualitativanente a través de una
clasicaciôn por ausencia y presencta, por jerarquía orden o sino
‘uantitativamente, es dcir através de magnitudes.

© Entérminos generale, el DATO, tal como se lo conceptualiza desde|
la metodología, sel valor que toma una variable en una unidad de
análisis, Por est razón se dice que su estructura es “tripartite

E Finer, serie am mitad de regio

a) Panini au cam eva

pa tne sree a valves

Matrices de Datos

© El mundo observable y/o experimentable se resumo mediante
vanidades de análisis las que asigramos unos valores en
determinadas variables. Todo ello queda registrado en una matriz de
datos

Cap Lait de rege (5 5,5 SD
conto de vibes (PV)

A)

© Enla Matriz, «nw simboliza la muestra de wnidades de análisis «Vo
las variables «Su, esla unidnd de análisis; es deci, la fuente de
informacion, Esta puede ser una persona, una vivienda, un salón de
clase, un curso, et. de donde se obtiene información; es decir, se

fine un elemento de donde se obtiene información.

lo Ves la variable que expresa un concepto cuantficable enla unidad.
de andiis Ejemplo: cada alumno es una unidad de análisis yla
variable “rendimiento académico” significa que
concreta en a nota que obtiene cado alumno,

© La «D» sel valoro respuesta que tiene la variable en cada unidad
de andisis. Ejemplo, Ses el alumno, Ves “tendimiento académico
Des la nota que ten cada alumno,

(© Enla Matiz anterior, DI, significa el dato, valor o respuesta que
tiene la variable 1 en a unidad de análisis 1. DI2, significa el dato,
valor o respuesta que tiene la variable 2 en la idad de análisis 1

© La MATRIZ DE DATOS es un modo de ordenar los datos de

manera que sea particularmente visible la estructura tripartita de los
datos

© Los datos se arreglan detal forma que las unidades (S= 1,23... 1)
se ubican en as filas y cada variable (V = 1,23... K) enlas.
columns

Leap Sede caer cadre ane nas dis valor
a> in verbo ers la clama

(© Las celdas están formadas por las intersecciones dela filas y las
«columnas y eontienen los valores (4)

¡E Cada lo (D sara isin inden akin vial
A er toda coincé, VA) defn main pute
pr)

D nn de me

=

Finalidad de las Matrices de Datos

© Esuna forma de sistematizar a informacion
par investiga un problema y ratar de obtener conocimiento
cientifico que intente explcar dicho problema a través del método de
investigación cientifica. De ali la importancia del llenado” dela
Matriz de Datos, el que se logra mediante ls técnicas de recolección
de datos

En efecto, mediante el análisis dela Matiz de datos podemos
obtener un conocimiento que describa, explique y prediga,
probabilisticamente, el comportamiento de ls hechos tal omo Lo
observamos y/ experimentamos en a realidad

La evaluación de los datos

+ T Galtang propone tes prinipos para realizar un sevaluación de
Za matriz» de datos quese derivan lógicamente de las nociones de
tructura tripartita del dato” y de la noción de “matriz de datos

EZ principio de comparada que toda proposición (5, VE)

No tendon sido combinaciones el po:
La nidos cmo personas y viable tasa de mabe
Alias coo la iad Tx de exo malo, mis que la
‘tifa Zune a rado depriació pola
El principi de claficción supe que actors de respuestas Dk
‘eb producir clsfeacin de todos os prs (Si, VR). Supone
cumplirlos principio de cuido y exh
El principio de tntgridnd de lam de dos exi que pr todo

> TE te er especanencun ve (DI

Examen de los datos

(© Hay dos formas de examina la integridad de la matriz por las ©
por columnas

Fede ca amena ec ci

De canne, ins pas cu ie ue acusa con
> oreo prsca lr peca era, Pues car ch
‘Tiana ele ro er a bgt
sana pira cba td qn de da ems ddr ede
a ean td eur les cen
+ Se acostumbra a definir un ctndar de aan máxima »
paraa ausencia de valores. Galt señaló la conveniencia de que
quel no supers el 9% para cada Variables. En a pri el
<stndar depende del tipo de instrumento que se haya il en a
recolección. Po ejemplo, en ls censos se toleran iecueniasmäs.

alas. Las variables de “ingresos” suelen tener altos rivales.

Decisiones ante los «casos perdidos»

© Antes de todo análisis estadistico es necesario establecer y
Findamentar algunas DECISIONES sobre os casos “sn datos’
Todos los paquete estadísticos trabajan sobre determinados
supuestos relativos a la ausencia de información

© Tratar la ausencia de información como una situación aleatoria en
la producción del dato. «Principio de ignorabilidad fuerte».

E mise ingen Ps ca rem de

mp Se opone qu deter ron de erat de a iformacón
fa devalcs no cstácocentrada cn un mismo bloque e variable,

meodoógcanonedeadas deu nismo concepto Es dei e pone
ueno lay problemas de aprem an dl concepto

© Pucde suponerse que sia ausencia de datos se concentra en algunas
variables y tiene una magnitud muy baja, se tata la falta de valores
‘camo una categoria residual que se agrega en todos los análisis
«Principio de ignorabilidad debits

Se supone que a variable no cumpli con er extanstiva y de ai
diva el no cumplimiento del principio de lasícaciónde la matiz

considerados) mo alte I operaciomlzcin del concepto

E se recomienda que la categoría residual no supere como máximo el

un mismo conjunto de unidades, se puede suponer que eiste una
«razón sistemática tebricamentesustandsa» que la produjo
ap Se opone que mille que crec de informacin en vis on
= ais vis cm a ac de resi e cota,
A ell ceci Pen ra
E Serupone que mile comparen un mio cojo de art
sole ls laca
ME Enretazo puedes credo deun erento rm que asia
tna población de excusado
ede sre rend dtl ecuador
Puede sre ride duna ect ai come mines
spina)

Puedo er rende dem oma de pst pon e aa
ido a condiciones ctrl: er ejemplo, el deso)

Sila ausencia de información para una vanable tiens una frecuencia

importante (mayoral 10%, por ejemplo) y se presenta sin ningún

patrón de regularidad para un conjunto especifico de unidades (por

ejemplo, enel caso anterior, se puede realizar una «imputación de

duos faltantes».

La imputación opera lógicamente identificando wn parón de
regulaidad para Jas unidades ques dieron respuestas es variable

amp esisendo cho paré mediante un model tad, ee
> asigna el valor a las unidades que carecen de información.

E Se requiero un modelo estadíicament stisfctorio, es decir con
vn "buen ajuste a oe duos

© Silt ausencia de nformación se concentra en muchas variables para
un mismo conjunto de unidades, se puede suponer que existe ua
«razón sistemática teóricamente sustantiva que la produjo

Se supone que as unidades que carecen e información en vais ©
en todas ls variables conforman un siación de “rechazo” del
«uemionanio que puede sr parcial ote

SD (Sion) ea etc cr

=} Se supone que las unidades comparten un mismo conjunto de
sb. Po lo general, puedo sr detente proporcionado por
Ins variable de cool quese disponen en la misma matiz de

© Podía resultar el caso de que en una matriz de datos estuviera
susente toda una columna que result fundamental para el ipo de
“análisis que se desea hacer, Por ejemplo la estimación de la pobreza

sea por el método de ls recursos opor un método combinado,
requiere contar con información sobre el ingreso no-monetaro del
hogar. Los censos por lo regular no aportan esta variable aunque sí
lo hacen as encuestas de hogares. Es posible formular un modelo de
imputación el ingreso no monetaio para una encuesta de hogares y
extrapolar la imputación al censo,

Analisis de la matriz de datos

(© Análisis centrado en a variable: waubitn denominado análisis
Vertical, porque ls columnasse analizan en forma separada en
‘cuanto ala nformación que brindan acerca de la varia
‘correspondiente. Los valores que corresponden alas diferentes
unidades se comparan conforme al principio de comparabiidad. De
esta forma se puede obtener una distribución estadistica, en la cual
pura cada valo categoría posible dela variable se da el nimero de
vidades que tienen ese valoro categoria dela variable. Este ipo de
análisis tico un perl básicamente uivaniable y cuailaiv.

© Análisis centrado en la unidad de análisis: Kundin denominado.

análisis horizontal. Porque en el mismo se analizan as filas
separadamente en cuanto ala infornación que dan acerca delas
tuidades, Se analiza cada unidad separadamente y los valores de
diferentes variables no son comparables Por o tanto, est tipo de
análisis nos brinda pautas 0 rasgos de cada nidad. Es un tipo de
análisis com un perfil más cualitativo.

© ¿Análisis combinado: vertical y horizontal, los cales pueden
Adoptar, según Galtun, diversas Formas: puede ser bivariable 0
‘multivariable. Ademäs se puede comenzar con un análisis
horizontal, construyendo un indice y luego se puedo ehr un
análisis vertical incorporando los valores que aporta el indice para
todas las midades, en una mueva column

Tabulación de la matriz de datos

‘de confeccionar la matiz de datos, se procedo a la tabulación
de los mismos. La tabulación es el proceso mediante el cual os
‘datos recopilados se organizan y concentran, con base a

ermunadas ideas o Iapótsis, entabla o cuadros para su
tratamiento estadistico,
Entonces tabular es contr las unidades que son ubicadas, ya sa en
forma malo con la utilización de un ordenador, en cada categoría
de una variable o unidades que son ubicadassimultineamente en
estegoras determinadas de dos o más variables

Por supuesto, o que antecede requiere un "plan de tabulación”, eto
es, determina de antemano qué resultados delas variables se vana
presentar y cuáles relaciones entre las mismas se van analizar, afin
de brindar respuesta al problema y os objetivos formulados.

Ejemplo de tabulación manual

Se presenta a continuación un ejemplo de tabulación simple o
‘variable elaborado a partir de la primera variable incluida en un
Modelo de Matiz de Datos, osea, a variable Sexo. Cabe aclarar
que hoy en din esto se luce con la computadora, sin embargo, es
bueno saber como se procede en forma manual Entonces, e ubica
la variable con sus categorias Masculino/Femenino codificadas I y

respectivamente, y luego se comienza a contar. Por ejemplo cada
vez que aparece un nimeto 1 se coloca un palote ena categoria
raseulino, cuando se llega a à se cruza el 5 para facilitar el
recuento

Be

fy ascuas MEI

0 e recuenta del tabla anterior para cada categoria la
fiectencia absoluta y a partir de esta se obtiene la frecuencia relativa

porcentual, como resultado de ello se obtiene la siguiente tabla con

Tabulación cruzada

© También es posible tabular dos o más variables en forma simultinea,
Lo eual resulta ser muy iil para poner a prueba la olas hipötesis que
se han formulado como respuesta anticipada al problema de una
investigación Por supuesto que, como se señalo anteriormente esto
se hace con un ordenador, pero siempre es bueno saber como se
puede hacer mantalmente

A continuación se expondrá un ejemplo de tabulación cruzada, con
dos dels variables incluidas en un Modelo de Matriz de Datos: VI
Sexo y V3, Estado Civil. Cabe aclarar que este ejemplo no tiene por
objetivo poner a prueba ninguna hipótesis, ya que son dos variables
de clasificación. El único sentido que persigue es mostrar cómo se
hace una tabulación cruzada. Más pertinente hubiera sido cuzar una
variable de clasificación con una de opinión ode actitud

En principio, como resultado del crue de estas dos variables, la
tabla va a constar de ocho ($) celdas En efecto la variable Sexo
tiene dos categorias, mientras que la variable Estado Civil, tiene
cinco categorias, pero hay una de ells, a N°5 No SabeNo contesta,
que no aparece enla matriz, entonces no se lava a considerar. Cada
ea va a estar identificada con una letra, como se puede observar
enel siguiente modelo:

= 5

© A continuación hay que ubicar las unidades de análisis en as
(äferentes celdas, comenzando por la UAL, que para ambas variables

registra el código 1, entonces deberá ubicarse en la celda "a" la

gunda idem, la UA asume para las dos variables el código 2, por
ende deberá ubicarse en a celda “4”, la UA, asume para la variable
Sexo el código 1 y para Estado Civil el código 3, por ende deber
ubicarse cl celda "e" y asi sucesivamente hasta completar los
entres (14) casos. Como resultado de ello se obtendrá la siguiente
tabulación

© Luego se procedo a efectua el recuento de los casos que se ubican
en cada celda y se obtienen os totales, como se puede observar enla
siguiente tabla

Con el resultado del recuento de os casos incluidos enla matriz, se
Ji elaborado una Tabla de Contingencia que contiene cifas
absolutas, la misma nos vaa pemuiti iniciar un análisis bivariable
y/o multivariable de ls datos.
Tags