Organización de datos (estadística)

122,240 views 15 slides Sep 14, 2017
Slide 1
Slide 1 of 15
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15

About This Presentation

Organización de los datos. Tipos de Organización de los datos. Operaciones con Organización de datos. Ejemplos de cada Organización de datos.


Slide Content

Prof.:
Ing. Ramón A. Aray. L
Bachiller:
Luiscarlys Maican
Organización de
Datos
Ing. Industrial
Barcelona, 2017

Introducción
Laestadísticaconfrecuenciaserealizaconlaintencióndellegara
establecerconclusionesoaobtenerresultados,estodemandamuchas
vecesestudiarcentenaresdecifrasdecosas,objetos,personasogrupos.
Porejemplouncasoextremodeestudioqueinvolucraalaestadísticaesla
realizacióndeuncenso,apesardelaayudadeprocedimientoscomplejos
diseñadosparatalfin,constituyesiempreunatareagigantescaresumiry
describirlasenormescantidadesdedatosquesegenerandelosproyectos
deinvestigación.
Usandolosprincipiosmáselementalesdelaestadísticadescriptiva,es
posibledescribirlascaracterísticasdelosdatosconbastanteclaridady
precisión,demodoquelastendenciasogeneralidadessepuedandescubrir
másrápidamenteycomunicarconmayorfacilidad.Primero,esmenester
clarificarquedependiendodelniveldemedicióndelavariablese
posibilitarásuorganización.

Organización de los datos:
Siendoeldatoelmaterialquesedebeprocesar,esdecir,la
materiaprimadelaestadística,elprimerpasoesentoncesla
recoleccióndedatos,paralocualseempleandiferentes
técnicas,comolaentrevistapersonal,elcuestionario,la
observación,etc.Elsegundopasoeslaorganizacióny
ordenamientodelosdatos,loquesehaceatravésdetablas,las
cualespuedenserpormediodeunadistribucióndefrecuencias
simplesounadistribucióndefrecuenciasconintervalos,en
amboscasosagrupandotodosaquellosquecorrespondena
unamismodatonominalovariableyexpresandoenuna
columnaelnúmerodevecesqueapareceesavariable.
LA FRECUENCIA es el número de veces que aparece cada variable o dato
nominal.

Por ejemplo:
Sedeseahacerunatablaquemuestrelascalificaciones
enMatemáticasdeungrupoescolar.Sevequehubieron
dosalumnosquesacaron10decalificación,siete
estudiantessacaron9,etc.;sediceentoncesquela
frecuenciadeldatonominal10esdedos;lafrecuenciade
lavariable9essiete,etc.
Unadistribucióndefrecuenciaseselresultadode
organizarlosdatosrecolectadosengrupos,mostrandola
frecuenciadecadauno.Estapuedesersimpleopor
intervalos.

Distribución de
frecuencias simple:
Organizarlosdatosrecolectados,yaseademenoramayoroviceversa,de
maneraquesemuestrelafrecuenciadecadaunodeellos,eshaceruna
distribucióndefrecuenciassimple.
Elprimerpasoeslocalizareldatomenoryeldatomayordentrodelconjunto
dedatosrecolectadosaúnendesorden,enelcasoquelosdatosseandecarácter
numérico.Unavezconseguidoloanterior,enunaprimeracolumnaseescriben
todoslosnúmerosquevandesdeelmenorhastaelmayor,incluidoséstos.
Luego,secuentacuántasvecesapareceelprimervalornominal,paralocualse
aconsejairmarcandoconunalínea(/)cadavezquesecuenteuno.Elproceso
deberepetirseparacadavariable.Finalmentesecuentanelnúmerodemarcas
quesehayanregistradoparacadavalornominalyseprocedeaconstruirlatabla
definitiva.

Por ejemplo:
Ejemplo1:Ordenaryconstruirunatablade
frecuenciassimpledelsiguienteconjuntode
datosrecolectados:
24 20 32 32 29 21
21 22 33 30 27 26
23 24 20 25 26 32
28 22 29 29 33 35
31 28 32 35 33 32
27 21 33 29 25 24
Solución:
Primerpaso:Selocalizanlosnúmeros
máschicoymásgrande:sonel20yel35.
Segundopaso:Sehaceunalistacompleta
denúmerosdesdeel20hastael35:
20 24 28 32
21 25 29 33
22 26 30 34
23 27 31 35
Tercerpaso:Secuentacuántosdatosnominales20
aparecenyporcadaunoqueaparezcaseponeuna
“rayita”(/).Sehacelomismoparacadavalor:
20 // 24 /// 28 // 32 /////
21 /// 25 // 29 //// 33 ////
22 // 26 // 30 / 34
23 / 27 // 31 / 35 //
Amaneradecomprobación,paratenerlaseguridaddequenoseescapó
algunoonosecontarondemás,lasumadetodaslas“rayitas”(/)debe
serigualalnúmerodedatosnominalesdelconjuntoinicial.Enestecaso
existen36datosnominalesy36“rayitas”,loquesignificaqueelconteofue
correcto.

Esconvenienteyavecesnecesarioobtenereltotaldeuna
columnaenunatabla,locualseespecificacomolomuestra
latablaanterior.Paraevitarconfundirconotrodatonominal,
lasumadecualquiercolumnadebeponerse“afuera”dela
tabla.
Dato
nominal ??????
Frecuencia
??????
20 2
21 3
22 2
23 1
24 3
25 2
26 2
27 2
28 2
29 4
30 1
31 1
32 5
33 4
34 0
35 2
Cuartopaso:Seelaboralatabladefinitiva.Enunatablasonindispensables
•Losencabezadosdecolumna,
•laslíneashorizontalesquedelimitanlatablaporlapartesuperioryporla
parteinferior,
•lalíneahorizontalquedelimitaporsupasteinferioralosencabezadosy
•laslíneasverticalesquedelimitanlascolumnas.
Total:36

DISTRIBUCIÓN DE FRECUENCIAS POR
INTERVALOS:
Losdatosrecolectadospuedentambiénorganizarsepor
intervalos.Cadaintervalosellamatambiénclase.Elancho
declaseolongituddelintervaloeslarestadeellímite
superiormenosellímiteinferiordecadaclaseointervalo.
Nodebeconfundirseelanchodelaclaseconelnúmero
dedatosnominalesquecontieneelintervalo.
-Cuandosetrabajaconvariablesdiscretas,elanchode
claseolongituddelintervaloeslarestadeellímite
superiormenosellímiteinferiordecadaclaseointervalo,
mientrasqueelnúmerodedatoseslarestadeellímite
superiormenosellímiteinferiordecadaclaseointervalo
más1.

-Cuandosetrabajaconvariablescontinuas,elanchodeclaseo
longituddelintervaloes,igualqueantes,larestadeellímitesuperior
menosellímiteinferiordecadaclaseointervalo,mientrasqueel
númerodedatosposiblesquepudieracontenerelintervalonoes
posibleconocerlosporquecabentodoslosvaloresintermedios.
Alaorganizacióndelosdatosrecolectadosentablasporintervalosse
lellamadistribucióndefrecuenciasporintervalos.Lacaracterísticamás
importanteesqueelanchodecadaclaseolongituddelintervalodebe
serelmismoparacadaintervalo.

Por ejemplo: Ejemplo2: ordenar y construir una tabla de frecuencias con cuatro
intervalos del siguiente conjunto de datos recolectados.
24 20 32 32 29 21
21 22 33 30 27 26
23 24 20 25 26 32
28 22 29 29 33 35
31 28 32 35 33 32
27 21 33 29 2524
Solución:
Convieneiniciardelamismamaneraqueenlaorganizacióndefrecuenciassimple.Entoncesselocalizanlos
númerosmáschicoymásgrande:sonel20yel35ysehaceunalistacompletadenúmerosdesdeel20
hastael35.Acontinuaciónsecuentancuántosdatosnominalesaparecenporcadaunoyseponeuna
“rayita”(/),deloqueresulta:
20 // 24 /// 28 // 32 /////
21 /// 25 // 29 //// 33 ////
22 // 26 // 30 / 34
23 / 27 // 31 / 35 //

Entonces,comohay16datosnominalesysepidencuatrointervalos,simplementesedividen,
porloquecadaintervaloincluiráacuatrodatosnominales,comolomuestralasiguiente
tabla:
Intervalo Frecuencia
??????
20 –23 8
24 –27 9
28 –31 8
32 –35 11
Total: 36
A manera de comprobación, para tener la seguridad de que no se escapó alguno o no se
contaron de más, la suma de todas las “rayitas” ( / ) debe ser igual al número de datos
recolectados del conjunto inicial. En este caso existen 36 datos recolectados y 36
“rayitas”, lo que significa que el conteo fue correcto. Después, se cuenta cuántos datos
nominales existen dentro del conjunto. En este caso hay 16.

Muchasvecesresultadegranutilidadtener
informaciónsobrelafrecuenciaqueapartirdel
iniciodelatablasetienehastaciertodatonominal
determinado.Aloanteriordeseleconocecon
elnombredefrecuenciasacumuladas(fa)yse
añadeenunacolumnaenlamismatabla.
?????? ?????? ????????????
20 2 2
21 3 5
22 2 7
23 1 8
24 3 11
25 2 13
26 2 15
27 2 17
28 2 19
29 4 23
30 1 24
31 1 25
32 5 30
33 4 34
34 0 34
35 2 36
Frecuencias Acumuladas:
Ejemplo 3: En los datos del ejemplo del Ejemplo 1, sus frecuencias
acumuladas son:
Total: 36
Obsérvese que la columna de las frecuencias acumuladas no se suma, pero
debe coincidir el último valor acumulado con la suma de la columna de las
frecuencias.

PORCENTAJES Y PORCENTAJES ACUMULADOS:
Otrasdosinformacionesmuyútilesdentrodelaetapade
organizacióndedatosescalcularelporcentajedecadavariable
conformeasufrecuencia,lomismoquesuporcentajeacumulado,
yaseaenunadistribucióndefrecuenciassimpleoporintervalos.
Paracalcularelporcentajebastahacerunaregladetres,endonde
el100%eselnúmeroNdedatosrecolectados,oseaeltotaldelas
frecuencias,estoes:
??????
100
=
??????
%
donde:
??????= número total de datos recolectados o frecuencia total
??????= frecuencia particular del dato nominal del que se desea saber su
porcentaje
%= porcentaje correspondiente al dato nominal de frecuencia ??????.
O bien, despejando, se obtiene que:
%=
100??????
??????

Por ejemplo:
Enlatabladelejemplo1,añadirunacolumna
queexpreselosporcentajesdecadadato
nominalyotradesusporcentajesacumulados.
Solución:Paraobtenerelporcentajedelprimer
dato??????=20,seplanteaunaregladetres
simple,endondeelnúmerototaldedatosesel
100%:
36
100
=
2
%
Donde:
%=
100×2
36
%=5,5
Sehacelomismoconlosdemásdatos,demaneraque
latablasecompletadelasiguiente
forma:
?????? ?????? ???????????? % %??????
20 2 2 5.5555 5.5555
21 3 5 8.3333 13.8888
22 2 7 5.5555 19.4443
23 1 8 2.7777 22.2222
24 3 11 8.3333 30.5553
25 2 13 5.5555 36.1108
26 2 15 5.5555 41.6663
27 2 17 5.5555 47.2218
28 2 19 5.5555 52.7773
29 4 23 11.1111 63.8884
30 1 24 2.7777 66.6661
31 1 25 2.7777 69.4438
32 5 30 13.8888 83.3326
33 4 34 11.1111 94.4437
34 0 34 0 94.4437
35 2 36 5.5555 99.9992
Totales:36 99.9992

Bibliografía:
•Recuperado de:
http://www.wikillerato.org/Organizaci%C3%B3n_de_los_datos.html
•Recuperado de:
http://www.fic.umich.mx/~lcastro/2organizacion.pdf
Tags