5 graficos

yov61 31,703 views 55 slides Nov 12, 2013
Slide 1
Slide 1 of 55
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28
Slide 29
29
Slide 30
30
Slide 31
31
Slide 32
32
Slide 33
33
Slide 34
34
Slide 35
35
Slide 36
36
Slide 37
37
Slide 38
38
Slide 39
39
Slide 40
40
Slide 41
41
Slide 42
42
Slide 43
43
Slide 44
44
Slide 45
45
Slide 46
46
Slide 47
47
Slide 48
48
Slide 49
49
Slide 50
50
Slide 51
51
Slide 52
52
Slide 53
53
Slide 54
54
Slide 55
55

About This Presentation

No description available for this slideshow.


Slide Content

1 Manual de Stata
6 Gráficos con Stata
Una de las capacidades básicas que ha de tener cualquier aplicación estadística es la
de ser capaz de generar gráficos. Tan importante es la capacidad de tratamiento de
variables y la de generación de estadísticos como la de hacer que se muestren los datos
representados mediante una imagen, que en muchas ocasiones dice bastante más que
mil números.
Hay muy diversos tipos de gráficos en la representación estadística, pero con objeto
de simplificar la amplia variedad existente, éstos pueden ubicarse en dos clasificaciones:
por un lado, la del número de dimensiones que representan, y por el otro, el tipo de
variables representado. En el primer caso, se pueden encontrar gráficos
unidimensionales (representan los valores y frecuencias de cada variable
independientemente de las demás, si las hubiere), gráficos bidimensionales, en los que se muestran distribuciones conjuntas de dos variables, y representaciones
multidimensionales, donde se muestran distribuciones multivariantes. Es necesario precisar que no siempre coincide el concepto de dimensión con el de variable: en un
gráfico unidimensional pueden representarse dos o más variables, en cuyo caso, según
se construya el gráfico, se podrá estudiar la asociación existente entre ellas
1
o comparar
sus características representadas. Por otro lado, los gráficos también pueden clasificarse
según el tipo de variable que quieren representar: hay gráficos que se adecuan
especialmente a variables cualitativas, como son el gráfico de sectores o el de barras,
mientras que otros, como las nubes de puntos o el histograma están indicados principalmente para variables cuantitativas.
La aplicación Stata es capaz de producir gráficos de tres modos distintos:
a) En primer lugar, existe una instrucción que contiene la mayor parte de los gráficos
más usuales. Se trata de la instrucción graph, que será la única que será abordada en
este capítulo
2
.
b) En segundo lugar, existen otra serie de instrucciones que son capaces de realizar
gráficos más específicos. En este caso, nos encontramos instrucciones como la de

1
Para estudiar asociación en gráficos unidimensionales es preciso añadir a su representación de única
entrada otra dimensión. Esto se logra, como se verá más adelante, mediante dos modos: Con over la
operación se realiza en los mismos ejes del gráfico, con by se construye otro gráfico paralelo.
2
La versión 8 proporciona una sintaxis bastante diferente de las de versiones anteriores de Stata para
la ejecución de gráficos. Sin embargo, permite que los antiguos usuarios y los viejos programa puedan
ejecutarse. Para ello, ha de cambiarse la instrucción graph por graph7 o bien, en el interior de un
programa, advertir al comienzo que se está trabajando con una versión anterior a la 8, con la instrucción
version.

2 Manual de Stata
dotplot, que realiza histogramas basados en puntos, o stem, que realiza un gráfico de
tallo y hoja.
c) También Stata dispone de ciertos procedimientos de operaciones estadísticas que se
pueden complementar con algún tipo de gráfico. De este modo, instrucciones gráficas
como greigen, rvfplot o cluster dendrogram sólo son posibles tras la realización de
previos análisis estadísticos como factor, regress y cluster, respectivamente.
Con la instrucción más específica de gráficos ( graph) se pueden realizar dos
modalidades de representación de variables:
a) las univariadas, como son los gráficos de sectores (pie), los de barras (bar), los de
puntos (dot) y los de caja (box).
y b) las bivariadas, en gráficos de dos dimensiones (twoway) o múltiples (matrix).
La instrucción graph es sin lugar a dudas la más compleja de cuantas contiene el
programa Stata. Dado que en un gráfico pueden controlarse muchos aspectos, son
necesarias muchas opciones que lo hagan posible. Para explicar con la mayor facilidad
en este capítulo la mayor parte de las posibilidades de esta instrucción, se ha
considerado conveniente dividirlo en cuatro apartados: en los dos primeros se pasa
repaso a los distintos tipos de ilustraciones de los datos. Se han dividido en dos para
exponer en el primero de ellos los gráficos unidimensionales y en el segundo los
bidimensionales. A un aprendiz de Stata estos dos primeros le bastan para conocer y
producir los diferentes tipos de gráficos. El tercer apartado expone la construcción y el
tratamiento específico que Stata proporciona a los gráficos. Enseña, por un lado, cómo
se pueden grabar, recuperar, combinar, imprimir o exportar a ot ra aplicación estas
figuras y, por otro, habla de la herramienta de los esquemas para facilitar la mejor
presentación posible de los gráficos, para acabar en la exponsición de un ejemplo de
solicitud de gráficos mediante menús. Finalmente, se cierra este capítulo presentando
los componentes de los gráficos (títulos, ejes, elementos y leyendas). Cada uno de ellos
tiene múltiples opciones de modulación, que el usuario más familiarizado con Stata
puede cambiar, para dar una apariencia más personal a los gráficos.

6.1 Gráficos unidimensionales
6.1.1 Gráficos de sectores
Los gráficos de sectores son representaciones de los datos en un círculo cuyos
segmentos representan proporcionalmente la frecuencia de los valores contenidos en
una o varias variables.
La instrucción mínima para realizar gráficos de sectores es la siguiente:
graph pie listadevariables

3 Manual de Stata
Hay que tener en cuenta que esta instrucción produce un gráfico en el que cada
variable explicitada se representa en un sector cuya área es proporcional a la suma de
los valores de todos los casos en la variable en cuestión.
Esto implica que, para obtener un gráfico de sectores en el que un sector represente a
los hombres y el otro a las mujeres, los datos han de disponerse de dos posibles modos:
1) Si se dispone de un fichero con un solo caso y dos variables: Hombre y Mujer, con
valores que representen sus respectivas frecuencias, tal como el representado en la
Ilustración 6.1,
Ilustración 6.1

basta con indicar la modalidad simple de la instrucción
graph pie Hombre Mujer
para producir el siguiente gráfico:
Ilustración 6.2
Hombre Mujer

2) Sin embargo, lo más común es disponer los datos por individuo en una variable
categórica, como puede ser el sexo, con 5.000 sujetos y dos valores, hombre y mujer,
en cuya circunstancia habría que escribir la instrucción del siguiente modo:
graph pie, over(sexo)
donde sexo es la variable que se quiere representar en el gráfico de sectores.

4 Manual de Stata
Con la anterior instrucción se genera el gráfico de la Ilustración 6.3, donde puede
advertirse, además de la ligera mayoría de mujeres en la muestra, que el programa pone
automáticamente a cada uno de los sectores las etiquetas de los valores que tiene la
variable original.
Ilustración 6.3
hombre mujer

La instrucción graph pie admite la posibilidad de introducir una variable categórica
para la obtención de tantos gráficos como valores tenga ésta. Por ejemplo, en el caso de
que se quieran obtener los diferentes perfiles de sexo, en función de los distintos
votantes, hay que emplear la opción by(variable).
graph pie, over(sexo) by(Voto_2000)
Esta orden da lugar al siguiente gráfico bidimensional, donde se puede estudiar el
perfil de género de los votantes de cada uno de los partidos:
Ilustración 6.4
PP PSOE IU
Otros Blanco NC
hombre mujer
Graphs by Partido votado

6.1.2 Gráficos de barras
Los gráficos de barras también son útiles para la representación de variables no
cuantitativas, pero son más recomendables que los de sectores, en el caso de que se
tenga un número mayor de categorías en la variable que se quiere representar. Consiste
en dibujar un rectángulo para cada variable o valor representado con longitud
proporcional a su valor, suma o frecuencia. Para su obtención, se necesitan

5 Manual de Stata
instrucciones con opciones bastantes distintas a la de los gráficos de sectores. Sin
embargo, la sintaxis general es muy similar a la anterior:
graph bar listadevariables
De este modo, la instrucción del primer gráfico realizado con la opción pie, ahora
quedaría del siguiente modo
3
:
graph bar Hombre Mujer, nolabel
y produciría el siguiente gráfico:
Ilustración 6.5
0
20
40
60
Hombre Mujer

No obstante, como en la mayor parte de las ocasiones, se disponen los datos en un
fichero en el que cada registro representa un caso, en cuya situación, en los gráficos de
barra no puede emplearse directamente la opción over como se aplicó en la modalidad
de sectores. Para poder hacer algo similar, hay que confeccionar el gráfico en dos pasos:
en el primero, mediante dos instrucciones, se genera una constante ficticia, equivalente
al peso en porcentaje del caso
4
, y en el segundo se pide la representación del recuento
de ésta
5
cruzada con la variable propiamente dicha, que en el ejemplo siguiente es sexo.
Y esto es debido a que Stata considera el gráfico de barras más como un caso de

3
En esta instrucción se produce la paradoja de que para que aparezca en la leyenda los nombres de las
variables (Hombre y Mujer), se debe especificar la opción nolabel. Si esta no aparece, las etiquetas que
aparecerían serían las automáticas del grafico, es decir, “Mean of Hombre” y “Mean of Mujer”
4
Si se quiere representar proporciones, en lugar de porcentajes, basta son sustituir el 100 por un 1.
5
Otro modo de hacerlo es convirtiendo la variable nominal en tantas dicotómicas como valores tenga,
mediante la opción generate del comando tabulate, para a continuación pedir el gráfico de barras de las
nuevas variables dicotómicas. Sin embargo, en esta modalidad la única forma de que aparezcan
adecuadamente las etiquetas de los valores de la variable es mediante la compleja opción
legend(order(…) Véase más abajo.

6 Manual de Stata
variable numérica (de intervalo o de razón) que de variable con atributos (nominal u
ordinal).
tabulate sexo
generate casos=100/r(N)
bar (count) casos, over(sexo)
Ilustración 6.6
0
5,
000
10,
000
15,
000
c
ount of c
a
s
o
s
hombre mujer

También en estos gráficos cabe la posibilidad de realizar un control por una segunda
variable para realizar un gráfico bidimensional de barras, que es muy útil para
representar gráficamente tablas de contingencia (véase el capítulo X). En la Ilustración
6.7, por ejemplo, se utiliza el sexo como independiente y se emplea la intención de voto
como variable dependiente, para ver su distribución en hombres y mujeres:
Ilustración 6.7
0
20
0
40
0
600
80
0
1,00
0
c
o
u
n
t o
f

c
a
s
o
s
hombre mujer
PPPSOEIUOtrosBlancoNC PPPSOEIUOtrosBlancoNC

En esta Ilustración se observan claramente dos grupos comparable de barras: unas
para los hombres y otras para las mujeres. Para conseguirlo se ha tenido que escribir
esta instrucción
6
:

6
Es obvio que las etiquetas del eje que el programa crea por omisión no es la deseable en el caso de
que se quiera publicar el gráfico en castellano. Para arreglarla, es preciso leer el apartado de opciones lo
que allí se especifica para el cambio de ejes.

7 Manual de Stata
graph bar count(casos), over(Voto_2000) over (sexo)
Hay otro modo de que se produzcan un resultado similar al anterior. Se trata de
mostrar tantos gráficos como valores tenga la variable que se especifique detrás de la
opción by(variable). Incluso, si se desea, puede obtenerse al mismo tiempo el gráfico
correspondiente al conjunto de la muestra, si se añade después de la variable la opción
total:
graph bar count(casos), over(Voto_2000) by (sexo, total )
Ilustración 6.8
0
500
1,
0
0
0
1,
5
0
0
2,
0
0
0
0
500
1,
0
0
0
1,
5
0
0
2,
0
0
0
PPPSOEIUOtrosBlancoNC PPPSOEIUOtrosBlancoNC
PPPSOEIUOtrosBlancoNC
hombre mujer
Total
co
u
n
t
o
f

c
a
so
s
Graphs by pp42

Especialmente en este gráfico se nota cómo hasta ahora lo que se representan son
frecuencias y no porcentajes. Para obtenerlos, o para representar proporciones
7
, en lugar
de frecuencias, hay que solicitar la estadística (sum), en lugar de count, que aparecía en
los anteriores gráficos.
graph bar (sum) casos, over(Voto_2000)

7
Sacará porcentajes o frecuencias según se haya construido la variable ficticia con la que se
construyen los gráficos de barras (casos, en este ejemplo). Como más arriba se construyó dividiendo 100
por el tamaño de la muestra (_N), entonces se obtienen porcentajes. Si se hubiera utilizado 1, en lugar de
100, se habrían obtenido proporciones.

8 Manual de Stata
Ilustración 6.9
0
10
20
30
40
su
m
o
f

ca
so
s
PP PSOE IU Otros Blanco NC

Una variante ineludible del gráfico de barras es la apilada, en la que en lugar de
aparecer paralelas las barras correspondientes a las categorías de la variable, aparecen
contiguas en la misma columna. Esta alternativa facilita, en la mayor parte de los casos,
la comparación entre categorías. Para obtenerla, es necesario añadir a la instrucción dos
opciones: la primera es asyvar, que trata a la variable expresada en over() como si fueran
valores de distintas variables. Por eso las barras aparecen dibujadas con distintos
colores. La segunda opción es stack, que como su propio nombre indica es la que hace
que las barras queden apiladas.
graph bar count(casos), over(Voto_2000) asyvar by(pp42) stack
Ilustración 6.10
0
1,
0
0
0
2,
0
0
0
3,
0
0
0
hombre mujer
PP PSOE
IU Otros
Blanco NC
c
o
u
n
t o
f

c
a
s
o
s
Graphs by pp42

Como puede fácilmente apreciarse, por el hecho de acumular el número de casos, las
alturas no alcanzan el tope y la de las mujeres, más numerosas en la muestra, es más alta
que la de los hombres. Para igualar las bases de la comparación, es preciso añadir la
opción percent, en cuyo caso la escala que representan las frecuencias cambia hasta
tener el máximo de 100 y, en consecuencia todas las barras se igualan.
graph bar sum(casos), over(Voto_2000) asyvar by(pp42) stack percent

9 Manual de Stata
Ilustración 6.11
0
20
40
60
80
100
hombre mujer
mean of Voto1 mean of Voto2
mean of Voto3 mean of Voto4
per
c
e
n
t
Graphs by pp42

Finalmente hay que señalar que todos los gráficos de barra aquí expuestos pueden
dibujarse horizontalmente. Para ello, sólo es preciso cambiar la segunda palabra de la
instrucción por hbar en lugar de bar.
Por ejemplo, si se desea, dibujar la intención de voto en barras horizontales, se
debería escribir la siguiente línea:
graph hbar (sum) casos, over(Voto-2000) asyvar
De este modo, se obtiene el siguiente gráfico con barras de distinto color por haber
especificado la opción asyvar:
Ilustración 6.12
0 10 20 30 40
sum of casos
PP PSOE
IU Otros
Blanco NC

6.1.3 Gráficos de puntos
Los gráficos de punto son considerados por Stata como los gráficos de barra. De
hecho, prácticamente las instrucciones de uno y otro presentan la misma sintaxis, con la
única diferencia de que en lugar de poner la palabra clave bar, se ha de escribir dot. Esto
es así, porque este programa estadístico trata los gráficos de barra como si de variables
cuantitativas se tratara.
De esta manera, al escribir la siguiente instrucción:

10 Manual de Stata
graph dot (sum) casos, over(Voto_2000)
Se muestra el siguiente gráfico:
Ilustración 6.13
0 10 20 30 40
sum of casos
NC
Blanco
Otros
IU
PSOE
PP

En la Ilustración 6.13 se advierten claramente las diferencias entre el gráfico de
barras y el de puntos. Para cada categoría se representa la proporción de casos mediante
una marca, representada con símbolos (círculos en este caso) que están ubicados en una
guía de puntos, en lugar de estar representadas mediante una barra de tamaño
proporcional al número, porcentaje o cualquier otro estadístico de las variables
especificadas.
Y si se desea que todos los puntos aparezcan en la misma línea, para una mejor
comparación de los porcentajes en este caso, es preciso añadir la opción asyvar
graph dot (sum) casos, over(Voto_2000) asyvar
con el resultado que se muestra a continuación:
Ilustración 6.14
0 10 20 30 40
sum of casos
PP PSOE
IU Otros
Blanco NC

6.1.4 Histogramas
Los histogramas son gráficos que se emplean para la representación de variables
cuantitativas continuas. Consisten en dividir los valores en una serie de intervalos y

11 Manual de Stata
representar cada uno de éstos con un área proporcional a su tamaño. Generalmente los
valores se expresan en el eje de abscisas de un gráfico de coordenadas, mientras que, en
el caso de que todos los intervalos tengan amplitud constante, en las ordenadas se
expresan las frecuencias absolutas o relativas correspondientes a cada grupo de valores.
En Stata basta con dos palabras para generar un gráfico de este tipo: el comando
histogram
8
seguido del nombre de la variable que se quiere representar:
histogram pp43
Sin ninguna otra especificación añadida, el histograma aparece del siguiente modo:
Ilustración 6.15
0
.0
0
5
.0
1
.0
1
5
.0
2
.0
2
5
De
n
s
i
ty
20 40 60 80 100
Edad

En él se aprecia cómo el programa ha dividido la variable edad con valores
comprendidos entre los 18 y los 98 años en cuarenta y tres sectores iguales, opción ésta
última que se adopta en caso de no indicarle lo contrario. Y son 43, porque adopta la
siguiente fórmula:
ln()
min ,10
ln(10)
N
kN
⎛⎞
=
⎜⎟
⎝⎠

Como quiera que está representando 24.000 casos y la raíz de este número es 155.9,
mientras que diez veces el cociente de su logaritmo entre el de 10 da un resultado de 43,
éstos son los intervalos que dibuja.

8
Ésta (histogram) es una de las instrucciones específicas (diferentes a graph) para realizar gráficos.
Sin embargo, en este caso se puede obtener el mismo resultado con el siguiente bloque de órdenes: graph
twoway histogram, especialmente útil cuando se quiere integrar los histogramas con otro tipo de
representación bivariada. Por eso, en este contexto donde se están viendo los gráficos de una sola
variable, y por razones de brevedad sólo se señala la primera forma de solicitarlos.

12 Manual de Stata
Para obtener un número no automático de intervalos en el histograma, existe la
opción bin(#), siendo # el número de ellos que se quiere queden dibujados. De este
modo si se desean ocho intervalos en lugar de los que 43 anteriores, debería escribirse:
histogram pp43, bin(8)
Ilustración 6.16
0
.0
0
5
.0
1
.0
1
5
.0
2
De
n
s
i
ty
20 40 60 80 100
Edad

Pero también es posible especificar, en lugar del número de intervalos, el ancho que
se desea tengan las barras a través de la opción width(#) e incluso el punto de partida
con start(#). Y obvio es que ambas se pueden combinar para obtener un histograma a
gusto del usuario:
histogram pp43, start(15) width(10)
Con esta última instrucción, el histograma adopta la siguiente forma:
Ilustración 6.17
0
.0
0
5
.0
1
.0
1
5
.0
2
De
n
s
i
ty
20 40 60 80 100
Edad

Dos opciones adicionales permiten mejorar la presentación del histograma. Por un
lado, frequency hace mostrar las frecuencias, en lugar de los porcentajes. Por el otro,
normal sobrescribe en el histograma la curva de Gauss para que pueda compararse la
distribución empírica con la distribución normal. La instrucción en su conjunto sería
histogram pp43, start(15) width(10) frequency normal
Y el resultado muestra tanto las frecuencias como la curva normal:

13 Manual de Stata
Ilustración 6.18
0
10
0
0
20
00
30
00
40
00
50
0
0
F
r
eq
ue
nc
y
20 40 60 80 100
Edad

6.1.5 Gráficos de densidad
Una alternativa de los histogramas a la representación de las variables continuas son
los gráficos de densidad, que pueden ser considerados como un método de suavización
de las frecuencias de una variable.
Así como el histograma divide la distribución en un conjunto de tramos a los que se
les representa por una frecuencia atribuida constante, en el caso de los gráficos de
densidad también se procede a una división del rango de la variable representada en una
serie de intervalos, pero en lugar de asignar una probabilidad constante, se atribuye a
cada valor un peso con el que se asigna la probabilidad final. El resultado es un
polígono de frecuencias suavizado.
Existen muy distintos modos de obtener representaciones de densidad para la misma
variable. Básicamente depende de dos parámetros: sobre todo, del ancho de los
intervalos; pero también del método empleado para calcular los pesos
9
.
Este gráfico unidimensional puede realizarse con Stata de dos modos: uno es
mediante una instrucción propia llamada kdensity, en la que pueden especificarse como
opciones el ancho de los intervalos (width(#)), el método (véase nota 9), la
comparación con una distribución normal (normal) o de Student (student) e incluso la
generación de dos nuevas variables ( generate (variable_con_valores,
variable_con_frecuencias), para ver el resultado no sólo gráfica, sino también
numéricamente.
Otra manera de realizarlo es a través de la instrucción graph twoway, mediante la
que pueden combinarse en los mismos ejes un histograma y un gráfico de densidad, con

9
El algoritmo utilizado por defecto es el de Epanechnikov, pero también emplea, siempre que se
especifique en las opciones los siguientes: biweight, cosine, gaussian, parzen, rectangular y triangular.

14 Manual de Stata
objeto de que se aprecie el papel suavizador que tiene la estimación de las frecuencias
con el sistema proporcionado por el segundo.
graph twoway (histogram tmi) (kdensity tmi)
Ilustración 6.19
0
.005
.01
.015
.02
.025
D
ensi
t
y/kdensi
t
y tm
i
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998/x
Density kdensity tmi

En el histograma se aprecia cómo las alturas correspondientes a las tasas de
mortalidad infantil del conjunto de países representados se ven afectadas por la
acumulación de casos en una determinada categoría (en este caso, especialmente la
primera y la quinta barra. Ambas quedan suavizadas mediante la línea que se genera con
la ponderación de Epanechnikov.
En el siguiente gráfico, en lugar de comparar la línea de densidad con el histograma,
se comparan tres distintas. La primera (línea continua) está realizada con unos
intervalos de longitud 5, pequeños por tanto, que generan una curva de frecuencias poco
suavizada. La tercera y última (la punteada) está construida con intervalos de ancho 20
y, consecuentemente, posee un suavizado considerable. La intermedia (línea
discontinua) está hecha con la opción por omisión, que se calcula automáticamente con
una compleja fórmula que tiene en cuenta la varianza y el número de casos de la
variable. Con estos datos, el resultado obtenido mediante programación estaba en torno
al valor 13. A través del examen del gráfico, se deduce claramente que se trata de un
valor intermedio situado entre el primero y el último.
Ilustración 6.20
0
.005
.01
.015
.02
kdensi
t
y tm
i
0 50 100 150 200
x
Kdensity (5) Kdensity Kdensity (20)

15 Manual de Stata
6.1.6 Gráficos de caja
Los gráficos de caja poseen una peculiar importancia en el análisis exploratorio de
datos. Consisten en la representación de los datos en un rectángulo de anchura arbitraria
y longitud igual al rango intercuartílico. Esto se logra dibujando uno de los límites del
rectángulo en el primer cuartil y el otro en el tercero. Entre el uno y el otro también se
dibuja en el rectángulo otra línea que representa la mediana. De cada extremo del
rectángulo ha de salir también una línea con longitud nunca superior a vez y media el
rango intercuartílico, que llegue hasta el caso que cumpla esa condición. Finalmente,
siempre que haya al menos un valor de la variable fuera de esos rangos (casos
extremos), ha de expresarse en forma de puntos.
La forma de obtener estos gráficos con Stata es similar a la de los otros gráficos ya
contemplados. Cambia, en este caso la palabra clave que sigue a la instrucción graph:
graph box listadevariables
Así, para obtener la representación de la variable edad, basta con escribir la siguiente
instrucción.
graph box edad
Y el resultado muestra el mínimo en 18, el máximo en 98, una mediana próxima a
44, y cuartiles respectivos de 30 y 63 años.
Ilustración 6.21
20
40
60
80
10
0
Ed
ad

El número solicitado de variables puede ser mayor que uno, en cuyo caso para cada
una de ellas se dibuja una caja paralela, a fin de que se puedan comparar las
distribuciones. Con las reservas propias del carácter ordinal de estas variables, se puede
poner como ejemplo comparativo la atribución ideológica que hacen los encuestados a
los partidos españoles con representación parlamentaria en el conjunto nacional:
graph box ideo01-ideo03

16 Manual de Stata
Ilustración 6.22
0
2
4
6
8
10
iu pp
psoe

stats | ideo01 ideo02 ideo03
---------+---------------------
p25 | 2 6 3
p50 | 2 7 4
p75 | 3 8 5
-------------------------------
En este gráfico se observa cómo el primer rectángulo, correspondiente a Izquierda
Unida no tiene línea mediana en el rectángulo, porque este estadístico coincide con el
primer cuartil. La línea inferior del rectángulo llega a 1 porque es el valor empírico
inferior, pero la superior sólo llega hasta el 4, porque al ser variable discreta no existe
empíricamente el supuesto máximo (4’5), esto es, el tercer cuartil (3) más vez y media
el rango intercuartílico (1’5). En cambio hay cuestionarios –no se sabe cuántos por
medio del gráfico- que han recogido para esta variable valores desde el 5 hasta el 10.
El rectángulo del medio, el correspondiente al PP, tiene un rango intercuartílico de
dos puntos (entre el 6 y el 8) con mediana en el 7. Por eso la línea de abajo alcanza
hasta el 3, esto es 6 menos vez y media el rango, que tiene en este caso el valor de 2. Y
la de arriba, llega hasta el máximo valor posible, es decir el 10, porque parte desde el
valor 8 del tercer cuartil.
En el siguiente ejemplo, en lugar de representar distintas variables, se dibuja una sola
(la ubicación en la escala ideológica del PP, p1502), pero en tantos grupos como valores
tenga una variable de control (el partido político al que se votó, Voto_2000). A dichos
efectos, es preciso utilizar la opción over(variable):
graph box p1502, over(Voto_2000)

17 Manual de Stata
Ilustración 6.23
0
2
4
6
8
10
pp
PP PSOE IU Otros Blanco NC

De la Ilustración 6.23Ilustración 6.24 se concluye que los que votaron a partidos
distintos del PP, consideran a éste más de derechas que los que lo votaron, los que lo
hicieron en blanco, o que los que no contestaron a la pregunta.
Y análogamente puede representarse más de una variable (en este caso, las
valoraciones de las ideologías de dos partidos) por una o varias variables de control (en
este ejemplo, el voto en las últimas elecciones y el sexo):
graph box p4502 p4503, over(Voto_2000) over(sexo)
Ilustración 6.24
0
2
4
6
8
10
hombre mujer
PPPSOEIUOtrosBlancoNC PPPSOEIUOtrosBlancoNC
pp psoe

En este caso, puede deducirse también que quienes votaron a IU ven al PSOE más a
la derecha que el resto, y que entre hombres y mujeres hay escasas diferencias en la
percepción ideológica de los partidos políticos mayoritarios.
6.2 Gráficos bidimensionales
La versión 8 de Stata agrupa bajo la orden graph twoway 29 modalidades diferentes
de gráficos. Algunas poseen características muy similares, pero otras son
extremadamente diferentes e incluso difíciles de considerar como bidimensionales. El

18 Manual de Stata
programa considera bidimensional todo aquel gráfico en el que los dos ejes o escalas (la
X, o eje horizontal, y la Y, o eje vertical) son numéricos. Según esa definición un
histograma siempre es considerado bidimensional
10
, del mismo modo que ciertos
gráficos de barras y puntos, aunque propiamente sean unidimensionales, el programa los
puede tratar como bidimensionales, siempre y cuando estén representándose variables
cuantitativas (en un eje se representa el valor de ésta variable y en el otro, según sea el
caso, su frecuencia o el valor en otra variable). Una característica esencial y versátil de
esta instrucción es la de poder combinar en el mismo gráfico distintas representaciones,
sean de la misma o de diferente modalidad. Basta para ello separar las órdenes de los
distintos gráficos por paréntesis, como ya se hizo en la instrucción que generó la
Ilustración 6.19.
En general, la instrucción para realizar gráficos bidimensionales presenta la siguiente
sintaxis:
graph twoway modalidad [lista_de_variables] [weight=variable] [if exp] [in rango],
[opciones_comunes] [opciones específicas]
Las modalidades de gráficos bidimensionales posibles en la versión 8 de Stata
pueden ser agrupadas en los siete siguientes grupos: nubes de puntos, gráficos de líneas,
gráficos de área, gráficos de ajuste, gráficos de función, gráficos de barra y gráficos de
rangos. Véanse a continuación las características e instrucciones de cada uno de ellos.
6.2.1 Nubes de puntos
Las nubes de puntos son los gráficos específicos para el estudio de la relación entre
dos variables cuantitativas y continuas. En un eje de ordenadas, compuesto por una
dimensión horizontal, donde generalmente se representa la variable independiente o
influyente, y otra vertical, donde se ubica la dependiente o influida, cada caso se
representa mediante un punto situado en las coordenadas co rrespondientes a sus valores
en las dos variables representadas. Son idóneos cuando existe un número intermedio de
casos, aproximadamente entre 10 y 300. Menos casos pueden conducir a conclusiones
erróneas sobre los datos y más casos producen superposiciones de puntos de tal
naturaleza que no permiten valorar claramente donde se produce el grueso de la
asociación entre las variables.
Aunque la sintaxis completa de este tipo de gráficos es graph twoway scatter, basta
con la última palabra para que Stata reconozca la instrucción y genere inmediatamente

10
A pesar de eso, en este capítulo la modalidad del histograma ha sido considerada entre los gráficos
unidimensionales. La orden que se explicó fue histogram. Pero de ahora en adelante, es conveniente saber
que ésta es una abreviatura de graph twoway histogram. Esto es importante porque este tipo de gráficos
puede mezclarse con otros de naturaleza propiamente bidimensional.

19 Manual de Stata
una nube de puntos que relaciona dos variables de naturaleza cuantitativa. Así, con la
base de datos mundial, se puede representar la relación existente entre el producto
nacional bruto y la esperanza de vida al nacer por países. Basta con escribir estas tres
palabras:
scatter evn pnbppa
para producir la siguiente imagen:
Ilustración 6.25
40
50
60
70
80
Esper
anza de vi
da al
nacer
1998
0 10000 20000 30000 40000
PNB por unidad de compra
Como la principal utilidad de las nubes de puntos es estudiar la relación y asociación
entre variables cuantitativas, mediante un examen de la distribución de los casos en el
gráfico puede observarse si dos variables poseen relación, es decir, si son dependientes
o independientes una de otra; o dicho con otras palabras, si a valores altos de una de
ellas le corresponden o no valores altos (o bajos) de la otra.
Puede haber muy distintos tipos de asociaciones. En la Ilustración 6.26 se exponen
cuatro modelos diferentes y reales de asociación entre variables. En primer lugar, se
expone la relación entre el producto nacional bruto (PNB) y la tasa de inflación. Como
puede apreciarse la mayor parte de los países se concentran entre el 0 y el 10%. Sólo
unos pocos, pero todos en la franja de renta baja, están por encima o por debajo de estos
topes. La distribución bivariable es muy distinta en el gráfico superior derecho. En éste
se relaciona el PNB con las líneas telefónicas por mil habitantes y puede verse
claramente cómo a valores bajos de la primera variable le corresponden valores también
pequeños de la segunda, mientras que los países de alta renta tienen en contrapartida
tasas de líneas telefónicas elevadas. En este caso se está ante una asociación lineal
positiva puesto que los puntos siguen una pauta recta ascendente. En el tercer gráfico
sucede lo contrario. La pauta sigue siendo una línea recta, pero los valores bajos de le
tasa de mortalidad infantil están asociados lógicamente con valores altos de esperanza
de vida al nacer y, a medida que va aumentando esta tasa, va disminuyendo la altura en
el eje vertical en la que están situados los países que tienen esperanza de vida menor. En
esta situación también existe una asociación lineal, pero negativa. Finalmente, el gráfico
inferior derecho muestra una asociación particular en la medida en que fácilmente se
aprecia que no es lineal, sino curvilínea. También ocurre que las altas esperanzas de
vida al nacer se encuentran en países con alta renta y las bajas en los de bajo PNB, pero
se aprecia que entre los de bajo nivel económico un ligero ascenso del producto produce

20 Manual de Stata
un considerable aumento de la esperanza de vida, mientras que, entre los países de alto
nivel económico, el enriquecimiento en similares cuantías conlleva muchos menores
progresos en el número de años que la gente vive.
Ilustración 6.26
-4
0
-2
0
0
20
T
a
s
a
m
edi
a d
e
c
r
ec
im
ient
o
anual
1998-
199
9
0 10000 20000 30000 40000
PNB por unidad de compra
0
200
400
600
800
Li
neas
t
e
le
f
oni
c
a
s
(
x
1000
hbs
)
1998
0 10000 20000 30000 40000
PNB por unidad de compra
40
50
60
70
80
E
s
per
anz
a
de v
ida al
nac
er

1998
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998
40
50
60
70
80
E
s
per
anz
a
de v
ida al
nac
er

1998
0 10000 20000 30000 40000
PNB por unidad de compra

En el caso de las representaciones de variables discretas, la instrucción scatter cuenta
con una opción (jitter(#)), que añade una perturbación aleatoria a cada punto tanto más
amplia cuanto mayor sea el número indicado entre paréntesis, con objeto de que no se
superpongan todos los puntos en el mismo lugar, siendo imposible juzgar la cuantía de
los casos acumulados. En la Ilustración 6.27, se muestran sendas nubes de puntos del
cruce de la percepción de la idelogía (en una escala del 1 al 10) de Izquierda Unida con
el sexo (con valores discretos arbitrarios 1 para hombres y 2 para mujeres). En la de la
izquierda, parece como si tan sólo se prepresentaran 19 casos –sólo falta hombres que
hayan dado el valor 9 a la ideología de Izquierda Unida; en cambio, en la de la derechas,
se ve que la mayor concentración de casos se encuentra, tanto para hombres como para
mujeres, en los tres valores más bajos, correspondientes lógicamente a la izquierda. Para
producir los gráficos mencionados, las respectivas instrucciones han sido:
scatter ideo01 sexo
scatter ideo01 sexo, jitter(10)

21 Manual de Stata
Ilustración 6.27
0
2
4
6
8
10
iu
1 1.2 1.4 1.6 1.8 2
sexo
0
2
4
6
8
10
iu
1 1.2 1.4 1.6 1.8 2
sexo

6.2.2 Gráficos de matriz
Para un análisis exploratorio del conjunto de relaciones entre más de dos variables, el
programa Stata dispone de la modalidad matrix en su programa de gráficos
11
. Ésta
produce tantos gráficos de dispersión como pares de contrastes se puedan realizar entre
una serie de variables. De este modo, si se escriben tres variables, tres son los posibles
gráficos no redundantes que se generan en la Ilustración 6.28.
graph matrix evn tmi pnbppa, half
Ilustración 6.28

Cuando se dispone de una variable dependiente y un conjunto de variables
independientes, lo más adecuado es ubicar la primera al final de la lista. De este modo
en la última fila de la matriz de gráficos se dispone del conjunto de cruces de las

11
Paradójicamente, aunque represente relaciones bivariadas entre variables, este gráfico no es tratado
como bidimensional por Stata. La razón es sencilla, por su propia naturaleza de inclusión de múltiples
graficos bivariados no puede incrustarse con otros gráficos sencillos. Operativamente, la instrucción
graph twoway sólo es aplicable a gráficos que puedan integrarse entre ellos. Sin embargo, este tipo de
gráfico se incluye en este apartado por su alta similitud de contenido y uso con los gráficos de dispersión.

22 Manual de Stata
variables independientes (ubicadas en el eje horizontal de abscisas) con la variable
dependiente (situada en el de eje vertical).
La opción half, utilizada en el reciente ejemplo, sirve para que sólo se reproduzcan
los gráficos de la parte inferior de la matriz, pues el resto es redundante. También se
puede utilizar la opción jitter(#), con la misma utilidad que en los gráficos
bidimensionales, además de todas las opciones de título, control de las características de
los ejes y de los elementos, en este caso de los puntos.
6.2.3 Gráficos de líneas
Los casos dibujados en una nube de puntos pueden conectarse entre sí siguiendo
distintas reglas a fin de que mejore la apreciación de la pauta que siguen los puntos o a
fin de que se de una sensación de continuidad en los datos, como puede ser en el caso de
datos que representen funciones o en el caso de representación de series temporales.
Existen dos instrucciones que permiten desarrollar este tipo de gráficos. La primera
(connected) dibuja los puntos y los conecta. La segunda (line) tan sólo hace la conexión
y deja invisibles los puntos. A ambas es recomendable acompañarlas con la opción sort,
que ordena los casos en función de la variable independiente (en el eje horizontal) para
que la conexión se produzca entre casos contiguos y no se produzcan cruces entre las
líneas dibujadas.
A continuación se exponen las dos instrucciones que generan los gráficos
compuestos representados en la próxima figura:
graph twoway connected evn tmi, sort
graph twoway line evn tmi, sort
Como puede apreciarse las diferencias entre ambas está en la presencia o ausencia de
puntos representado a los casos:
Ilustración 6.29
40
50
60
70
80
E
s
per
anz
a d
e
v
id
a
a
l
nac
er

199
8
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998
40
50
60
70
80
E
s
per
anz
a d
e
v
id
a
a
l
nac
er

199
8
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998

6.2.4 Gráficos de área
Son una modalidad de los anteriores, puesto que lo único que los diferencia es que
aparece rellena el área existente entre la línea formada por la conexión de los puntos y el

23 Manual de Stata
eje horizontal. Son idóneos cuando se quiere representar frecuencias o también cuando
se representan cantidades, puesto que proporcionan al lector una considerable sensación
de volumen.
Además de la opción sort, siempre recomendable en este tipo de gráficos, tiene otras
dos importantes: La primera es horizontal, que permite cambiar la orientación del
gráfico, poniendo en el eje vertical la segunda variable (la independiente) y en el eje
horizontal la primera (la dependiente). La segunda es base(#), que permite indicarle al
gráfico el punto de arranque del área.
Como ejemplo de uso, se utiliza los mismos datos de los gráficos de línea para que se
aprecien sus semejanzas.
graph twoway area evn tmi, sort
El gráfico de área solicitado en la anterior instrucción presenta el siguiente aspecto:
Ilustración 6.30
40
50
60
70
80
E
s
per
anz
a de
v
i
da
a
l
nac
er
1998
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998

6.2.5 Gráficos de ajuste
En lugar de dibujar líneas quebradas que unan a todos los puntos de una distribución
bivariada, se puede optar por trazar una línea –recta o curva- que trate de pasar lo más
cerca posible de los puntos con el fin de dar cuenta simplificada de la realidad, esto es,
generar un modelo de relación entre las variables que explique de modo simple cómo
una variable cambia sus valores, en la medida en que otra variable modifica los suyos.
El ajuste más simple y utilizado, aunque no el único, como se verá más adelante, es
la línea recta. Y el criterio más común que se utiliza (véase el primer capítulo dedicado

24 Manual de Stata
a la regresión) es el de mínimos cuadrados, esto es, se traza la recta cuya distancia
cuadrática respecto a los puntos empíricos reales sea mínima.
12
A pesar de la aparente complicación del proceso de ajuste de la recta, mediante el
programa gráfico de Stata, el trazado de esta línea es extremadamente simple. Basta con
pedir un gráfico bidimensional con la modalidad lfit y aportar las variables que han de
ubicarse respectivamente en el eje vertical y horizontal. Así escribiendo la siguiente
instrucción:
graph twoway lfit evn tmi
En lugar de dibujarse los puntos empíricos, se traza la línea que mejor ajusta la
distancia cuadrática de éstos a la recta. Es preciso notar que en el eje vertical aparecen
los valores ajustados de la esperanza de vida al nacer, en lugar de la variable
propiamente dicha.
Ilustración 6.31
30
40
50
60
70
80
F
i
t
t
ed v
a
l
u
es
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998

Mucho más útil que dibujar sólo la recta ajustada es representar junto con ella los
puntos que representan los valores medidos de ambas variables. Como se ha dicho al
inicio de los gráfico bidimensionales, la instrucción graph twoway posee la facultad de
dibujar en los mismos ejes varios gráficos al mismo tiempo con una gran facilidad;
basta con expresar los distintos gráficos entre paréntesis, o separarlos por dos líneas
verticales (||). Por ello, las dos siguientes instrucciones dan el mismo resultado:
graph twoway (lfit evn tmi) (scatter evn tmi)
graph twoway lfit evn tmi || scatter evn tmi

12
El método de ajuste de líneas es contemplado con más detenimiento en el capítulo destinado a la
regresión.

25 Manual de Stata
De esta forma, además de los puntos que representan cada uno de los casos empíricos
de los que se disponen datos, aparece la línea recta que mejor ajusta los valores
empíricos de la tasa de mortalidad infantil y la esperanza de vida al nacer:

Ilustración 6.32
30
40
50
60
70
80
F
i
t
t
ed v
a
l
u
es
/E
s
p
er
a
n
z
a
de
v
i
da al
nac
er

1998
0 50 100 150 200
Tasa de mortalidad infantil /1000 1998
Fitted values Esperanza de vida al nacer 1998

Además del ajuste lineal, la opción gráfica de Stata permite otros ajustes inmediatos.
El cuadrático (qfit) y el polinómico (fpfit)
13
, por un lado, son ajustes en última instancia
lineales. El ajuste lowess es un suavizado basado en regresiones ponderadas localmente
de los valores yi. Los ajustes mband y mspline dividen la distribución de la variable
independiente en distintos sectores (bandas) y, a través de la mediana en cada una de
ellas construye un ajuste no suavizado, como en el primer caso; o suavizado, como en el
segundo.
Mediante las cuatro instrucciones siguientes posteriormente combinadas se obtienen
los cuatro gráficos de la próxima figura, donde pueden comprobarse las diferentes
características de los ajustes expuestos en sus respectivos títulos:
twoway (qfit evn pnbppa) (scatter evn pnbppa), title(“Ajuste qfit”)
twoway (fpfit evn pnbppa) (scatter evn pnbppa), title(“Ajuste fpfit”)
twoway (lowess evn pnbppa) (scatter evn pnbppa), title(“Ajuste lowess”)
twoway (mspline evn pnbppa) (scatter evn pnbppa), title(“Ajuste mspline”)

13
Este ajuste implica la realización de una regresión fraccional polinómica en la que el programa
busca las mejores potencias sobre la variable independientes para que ajuste los valores de la variable
dependiente. Véase para más detalle la instrucción fracpoly en el manual de Stata (Vol. 1, p.399).

26 Manual de Stata
Ilustración 6.33
40
50
60
70
80
Fit
t
ed v
a
lues
/
EVN
0 10000 20000 30000 40000
PNB por unidad de compra
Fitted values EVN
Ajuste qfit
40
50
60
70
80
predic
t
ed ev
n/
EVN
0 10000 20000 30000 40000
PNB por unidad de compra
predicted evn EVN
Ajuste fpfit
40
50
60
70
80
Median s
p
line/
EVN
0 10000 20000 30000 40000
PNB por unidad de compra
Median spline EVN
Ajuste mspline
40
50
60
70
80
low
e
s
s
ev
n pnbppa/
EVN
0 10000 20000 30000 40000
PNB por unidad de compra
lowess evn pnbppa EVN
Ajuste lowess


6.2.6 Gráficos de función
Son aquellos en los que se representa la curva resultante de aplicar una función a una
variable de rango establecido (entre los valores de 0 y 1, en caso de que el usuario no lo
indique en las opciones)
La sintaxis de estos gráficos es sencilla:
graph twoway function var_dep=f(x), opciones
La expresión var_dep=f(x)
14
es la que representa a la función que se quiere
representar. Así, si se desea dibujar una recta con parámetros a=2 y b=.5, la instrucción
siguiente genera la línea deseada.
graph twoway function y=2+.5*x

14
En este caso x representa la variable que va a fluctuar un número determinado de veces (300 por
omisión) en un rango dado (entre 0 y 1, si nada se especifia)

27 Manual de Stata
El gráfico muestra el valor en la variable y al aplicar la expresión tras el igual a 300
valores comprendidos entre el 0 y el 1.
Ilustración 6.34
2
2.
1
2.
2
2.
3
2.
4
2.
5
y
0 .2 .4 .6 .8 1
x

El usuario, a través de las opciones puede controlar tanto el número de estimaciones
de la función, como el rango de la variable x. Así, si se desea representar la función de
probabilidad de la normal sólo a través de nueve valores, la instrucción necesaria es la
que se expone a continuación:
graph twoway function y=normden(x), range(-2.5 2.5) n(9)
Ilustración 6.35
0
.1
.2
.3
.4
z
-2 0 2
x

Como puede apreciarse, la curva normal pierde su apariencia de campana curvada
por tener tan pocos puntos de referencia:
6.2.7 Gráficos de barra
En este apartado se consideran cuatro gráficos similares a las nubes de punto, de los
que se diferencian en que poseen una guía que une el punto (representado o no) con el
eje de abscisas. Por tanto, aunque algunos de ellos parezcan haberse visto en el apartado
de gráficos unidimensionales, en el fondo son muy distintos, pues en lugar de
representar una variable cualitativa con su frecuencia o con otro estadístico de otra
variable, se representan los valores de dos variables cuantitativas, la mayor parte de las
veces siendo la independiente (expresada en el eje horizontal) el tiempo.

28 Manual de Stata
Las cuatro modalidades consideradas semejantes en este apartado son: barras (bar),
en el caso de que lo que una al punto sea una columna; líneas con o sin puntos (dropline
o spikes), cuando en lugar de una columna se une el punto representado con los ejes
mediante una línea recta y puntos guiados, y puntos (dots), en el caso que se quiera que
quede como guía todo el eje vertical (incluido el espacio superior al punto). Un mismo
ejemplo al que se le aplican las cuatro modalidades muestra la similitud de todos estos
tipos de gráficos.
Ilustración 6.36
0
500
1000
1500
Poblac
ion (millones
) 1999
0 5,000,00010,000,00015,000,00020,000,000
Superficie km2 1996
Gráfico de barras
0
500
1000
1500
Poblac
ion (millones
) 1999
0 5,000,00010,000,00015,000,00020,000,000
Superficie km2 1996
Gráfico de clavos (spike)
0
500
1000
1500
Poblac
ion (millones
) 1999
0 5,000,00010,000,00015,000,00020,000,000
Superficie km2 1996
Gráficos de líneas caídas (dropline)
0
500
1000
1500
Poblac
ion (millones
) 1999
0 5,000,00010,000,00015,000,00020,000,000
Superficie km2 1996
Gráficos de puntos

En estas cuatro representaciones de más de 200 países aparece la variable extensión
territorial en el eje horizontal y la altura de los puntos, líneas o barras indican el tamaño
de sus respectivas poblaciones. Como en el fondo son iguales, en todos ellos destacan
del resto los siete países mayores del planeta. En sentido decreciente son Rusia, Estados
Unidos, China, Canadá, Brasil, Australia y la India. Éste último tiene una población
aproximada de 1.000 millones de habitantes sólo superados por los 1.250 de China. Los
cinco restantes países de gran extensión tienen una población mucho más reducida, por
debajo de los 300 millones de habitantes. Y, entre los países pequeños, destaca
Indonesia por su población por encima de lo 200 millones de habitantes.
Para que el lector vea claro el comentario anterior y su representación, se expone a
continuación los datos de los países con más de 5 millones de km
2
de superficie, o con
más de 200 millones de habitantes:
sortg –supkm2
list pais pob supkm2

29 Manual de Stata
Ilustración 6.37
+-----------------------------------+
| pais pob supkm2 |
|-----------------------------------|
1. | Rusia 146.9 17075400 |
2. | Estados Unidos 273 9363123 |
3. | China 1250 9326400 |
4. | Canada 30.6 9221000 |
5. | Brasil 168 8456500 |
|-----------------------------------|
6. | Australia 18.8 7682300 |
7. | India 998 3287590 |
16. | Indonesia 207 1904569 |
+-----------------------------------+
Una de las opciones específicas de estos cuatro subtipos de gráficos es la de invertir
la orientación de la representación y poner horizontalmente el sentido de las líneas o de
los puntos que conectan el eje de las marcas de cada caso.
graph twoway dot pob supkm2, horizontal
Así, la anterior instrucción da lugar al siguiente gráfico de puntos horizontal.
Ilustración 6.38
0
5000000
10000000
15000000
2000000
Super
fi
ci
e km
2 1996
0 500 1000 1500
Poblacion (millones) 1999

Es interesante resaltar que la variable nombrada en segundo lugar (la extensión) pasa
al eje vertical, y consecuentemente la población cambia al horizontal. Está opción sólo
produce un giro de 90º grados en la representación, pero las rejillas siguen siendo
horizontales, guiando en este caso la variable extensión del país. Si se quisiera levantar
los puntos desde la variable población, bastaría con ponerla en la instrucción en
segundo lugar, a continuación de la primera variable, es decir, de supkm2, sin indicar la
opción horizontal.
6.2.8 Gráficos de rango
Son aquellos que, para cada valor de la variable independiente, se representan dos
puntos distintos correspondientes a dos valores de sendas variables dependientes. Hay
varias formas de presentación de presentación, pero todos ellos se caracterizan por lo
que se acaba de definir.
Por un lado, las dos variables representadas pueden estar unidas entre ellas sea por
barras (rbar), por líneas verticales (rspike), por líneas rematadas (rcap o rcapsim) o por
áreas (rarea). Otra posibilidad es que se representen las dos series con dos líneas

30 Manual de Stata
conectadas, pero paralelas entre sí, insertando o no los puntos que representan los
diversos casos (rconnected y rline).
La sintaxis de este tipo de gráficos comienza con la orden graph twoway, después
continúa con la modalidad de gráfico deseada y seguidamente ha de ponerse en primer
lugar las dos variables representadas en el eje vertical y, a continuación, la variable
independiente, es decir la del eje horizontal. El orden de las dos primeras es irrelevante
puesto que mediante la barra o el área se representa la distancia absoluta entre los dos
valores.
A continuación se presenta para mostrar las distintas modalidades de representación
de los gráficos de rango cuatro modelos distintos de ellos obtenidos con las siguientes
instrucciones:
graph twoway rbar lintfno pcx1000 pnbppa
graph twoway rcap lintfno pcx1000 pnbppa
graph twoway rarea lintfno pcx1000 pnbppa, sort
graph twoway rline lintfno pcx1000 pnbppa, sort
La combinación de estas cuatro instrucciones da lugar a los siguientes gráficos:
Ilustración 6.39
0
200
400
600
800
pcx1000/lintfno
0 10000 20000 30000 40000
pnbppa
Gráfico de rangos (rbar)
0
200
400
600
800
lintfno/pcx1000
0 10000 20000 30000 40000
pnbppa
Gráfico de rangos (rcap)
0
200
400
600
800
pcx1000/lintfno
0 10000 20000 30000 40000
pnbppa
Gráfico de rangos (rarea)
0
200
400
600
800
pcx1000/lintfno
0 10000 20000 30000 40000
pnbppa
Gráfico de rangos (rline)

Las variables que definen el rango son el número de líneas telefónicas (máximo) y el
número de ordenadores personales (mínimo) por mil habitantes. La variable
independiente es el producto nacional bruto per cápita. Los gráficos muestran bajo
diversas formas cómo los dos indicadores de desarrollo tecnológico crecen a medida
que lo hace el PNB per cápita y dejan entrever que donde más divergencias se da entre

31 Manual de Stata
teléfonos y ordenadores es en algunos países con producto nacional bruto per cápita
medio.
También podrían clasificarse en esta categoría aquellos gráficos que ajustan datos y
dan un determinado rango de ocurrencia. Se corresponden con los gráficos lfit, qfit y
fpfit, es decir, ajustes lineales, cuadráticos y polinómicos fraccionales; pero, en lugar de
aportar una sola curva, muestran dos correspondientes a la probabilidad señalada. En
estos casos, la modalidad del gráfico se indica con las palabras claves lfitci, qfitci y
fpfitci. Además, en este tipo de gráfico son importantes las opciones level(#), donde se
indica el porcentaje de confianza deseado para la representación y stdf, en el caso de que
se desee contar con el error típico del pronóstico, en lugar del de la predicción
15
, o la
opción stdr, si se desea utilizar para el cálculo de los intervalos el error típico de los
residuales.
Un par de ejemplos con las opciones por omisión muestran dos gráficos con los
intervalos basados en el error típico de la predicción y un 95% de confianza, salvo en el
caso de que se modifique este parámetro con la instrucción set level.
graph twoway (qfitci evn pnbppa) (scatter evn pnbppa)
graph twoway (fpfitci evn pnbppa) (scatter evn pnbppa)
Ilustración 6.40

6.3 Construcción de gráficos
De lo dicho hasta el momento puede sacarse la conclusión de que por cada gráfico
que se desee obtener hay que escribir una instrucción distinta. Además, si se ha
trabajado con los gráficos de Stata, no es difícil darse cuenta de que nada más generar
un gráfico el anterior desaparece y si no se han tomado precauciones anteriores, quedará
perdido a menos que se vuelva a repetir la instrucción. En este apartado se van a ver

15
Véase el capítulo de la regresión.

32 Manual de Stata
toda una serie de posibilidades que tiene este programa con el objeto de tratar, guardar,
recuperar, imprimir y trasladar los gráficos producidos.
En primer lugar, por su facilidad e inmediatez, hay que mencionar la posibilidad de
copiar el gráfico a otra aplicación –lo más común es que se haga a un procesador de
textos. Esta tarea sólo requiere colocar el cursor encima del gráfico, pulsar el botón
derecho y a continuación aparece un menú textual en el que la primera opción es Copy
Graph. Con ella el gráfico se guarda en el portapapeles de Windows. Por ello, si se
cambia de programa, con sólo darle la instrucción Pegar, se reproduce la ilustración
acabada de copiar.
Otro modo de hacer lo mismo, con mayor estabilidad, pero menor rapidez, consiste
en grabar el gráfico en un fichero. Para ello, bien se pulsa la opción Save Graph que
aparece en el menú textual del gráfico, obtenido al pulsar el botón derecho sobre él, bien
se escribe justo después de realizado un gráfico la instrucción
graph export nombre_de _fichero.ext
que realiza la misma operación, pero mediante una línea de instrucción, en lugar de
con menú
16
. Una vez grabado el gráfico en un fichero, se puede recuperar desde
cualquier programa que permita la incorporación de ficheros en los siguientes formatos
gráficos: printer network graphic, post-script o windows metafile.
Sobre todo cuando se trabaja con ficheros de secuencias de instrucciones, pero
también en el resto de ocasiones, si se trabaja con distintos gráficos, es conveniente
ponerles un nombre. Por omisión, todo gráfico que se presenta en la correspondiente
pantalla propia, recibe el nombre de Graph. Si se realiza un segundo gráfico, sin ponerle
nombre, también recibe el mismo nombre, ocupando la posición de la memoria que
detentaba el anterior. Por ello, si se actúa de esta forma, se pierde para siempre el primer
gráfico, a menos que haya sido grabado en un fichero. Al darle un nombre distinto, el
anterior queda en memoria interna del ordenador y quedará ahí hasta que se haga otro
gráfico con el mismo nombre, o hasta que el usuario salga del programa.
Para poner un nombre distinto y así evitar que desaparezca de la memoria interna el
gráfico anterior, hay que incluir en el gráfico la opción name(nombre). Y para saber en
un determinado momento los gráficos que están disponibles en la memoria interna ha de
escribirse la siguiente instrucción:

16
Poner extensión al nombre del fichero es el modo más cómodo de indicarle el formato con el que se
desea grabar el gráfico. En la versión de windows de Stata, los formatos posibles son postscript (.ps),
postscript encapsulado (.eps), metafile (.mf), metafile mejorado (.emf) y network portable (png). El autor
recomienda este último formato pues con él se reproduce con mayor fidelidad el gráfico, en el caso de
importarlo con cualquier otro programa.

33 Manual de Stata
graph dir
En el siguiente ejemplo, correspondiente a la Ilustración 6.40, se da sendos nombres
a los dos gráficos correspondientes a los ajustes cuadrático y polinómico de la esperanza
de vida al nacer con el producto nacional bruto per cápita. La penúltima instrucción
sirve para mostrar los ficheros residentes en la memoria, y con la última se puede
representar el primer gráfico, aun a pesar de que fuera temporalmente sustituido por el
segundo.
graph twoway (qfitci evn tmi) (scatter evn tmi), name(cuadratico)
graph twoway (fpfitci evn pnbppa) (scatter evn pnbppa), name(polinomico)
graph dir
graph display cuadratico
Una de las utilidades más manifiestas de poder disponer varios gráficos en la
memoria es la combinación de ellos en uno solo mediante la instrucción
graph combine,
que posee entre otras las opciones
rows(#) y cols(#), que permiten controlar el número
de filas y columnas que tendrá la composición. En el caso anterior, basta con poner la
instrucción compuesta seguida por los correspondientes títulos de los gráficos. graph combine cuadratico polinomico
Otra operación útil con los gráficos es la de grabarlos en la memoria externa,
generalmente en el disco duro, con objeto de que quede permanentemente a disposición del usuario, incluso después de acabada una sesión de trabajo con Stata. Es muy similar
a la operación export, con la diferencia de que se graba en un modo específico de este
programa y no puede ser incorporado a ningún procesador de textos, por ejemplo, ni a ningún otro programa, como uno de presentaciones. Estos ficheros sólo pueden ser
utilizados por Stata, para combinarlos con otros gráficos, para imprimirlos, o también
para exportarlos a otro formato que permita el intercambio a otras utilidades.
Hay dos modos de grabar un gráfico en un fichero. La primera es al mismo tiempo
que se crea: utilizando la opción ,saving(nombre_del_fichero), se graba en el fichero
mencionado, al tiempo que se representa en la pantalla. La segunda es después de que se ha ejecutado y visto el gráfico, mediante una nueva instrucción, que tiene la siguiente
estructura:
graph save nombre del fichero
Esta instrucción tiene dos opciones: ,replace permite sobrescribir un fichero sin que
aparezca un mensaje de error y ,asis graba de tal forma el gráfico que no puede alterarse
su presentación posteriormente.
Una vez grabado un fichero puede volverse a usar por Stata utilizando la siguiente
instrucción:
graph use nombre_del_fichero

34 Manual de Stata
E incluso también puede recuperarse en compañía de otros a través de la ya referida
instrucción
graph combine, en la que pueden usarse tanto el nombre interno del gráfico,
siempre que ya esté cargado, como el nombre externo, siempre que esté presente en el
formato
Stata de gráfico. O dicho de otra manera, es preciso insistir en que los gráficos
exportados, no pueden volverse a recuperar. Sólo son recuperables los ficheros grabados
en el formato propio del programa.
6.3.1 Esquemas
En el apartado 6.3 de este capítulo se ha visto una gran cantidad de opciones que
pueden controlarse en los gráficos. A pesar de haber visto un número elevado de ellas,
no se han contemplado todas, ya que la rutina gráfica del Stata es de tal calibre que
permite cambiar el mínimo detalle de un gráfico. Dada la complejidad de estas opciones
y subopciones, esta herramienta estadística ha buscado simplificar al usuario la
producción de gráficos a través de los esquemas.
Los esquemas son conjuntos de opciones con los que los gráficos son representados
en la pantalla. Ejemplo de las especificaciones que puede contener un esquema son el
tipo y tamaño de letra, los colores de fondo y de los cuadros, los sucesivos colores que
incorporan los elementos (sectores, barras, líneas, …) de los distintos tipos de gráficos,
el grosor y la textura de las líneas, la presencia –y en su caso la forma- o ausencia de
marcas, ejes rejillas, etc. Por omisión, Stata trabaja con uno de la docena de esquemas
que tiene disponibles
17
. Para saber los nombres disponibles y cuál está activo en un
determinado momento se emplean respectivamente las siguientes dos instrucciones:
graph query, schemes
query graphics
El resultado de ella puede variar de ordenador a ordenador, según los esquemas en él
incorporados a través de internet o de la propia construcción. Un ejemplo de listado es
el siguiente:

17
El usuario pude importar nuevos esquemas por Internet y con un poco de destreza incluso puede
construir nuevos esquemas a partir de los existentes, que residen en los directorios de los ficheros .ado.

35 Manual de Stata
Ilustración 6.41
Available schemes are
economist see help scheme_economist
s1color see help scheme_s1color
s1manual see help scheme_s1manual
s1mono see help scheme_s1mono
s1rcolor see help scheme_s1rcolor
s2color see help scheme_s2color
s2colorg see help scheme_s2colorg
s2manual see help scheme_s2manual
s2mono see help scheme_s2mono
sj see help scheme_sj
Graphics settings
set graphics on
set scheme sj
set printcolor automatic may be automatic, asis, gs1, gs2, gs3
set copycolor automatic may be automatic, asis, gs1, gs2, gs3
En la primera parte de este recuadro aparecen todos los esquemas disponibles en la
máquina. En la segunda parte, se expresa que el esquema puesto por defecto (set
scheme) es el sj, que corresponde a los que se han empleado hasta el momento, que es el
utilizado en las publicaciones del Stata Journal. Como puede apreciarse, ademas de éste
y del propio del semanario The Economist, aparecen dos esquemas en blanco y negro
(s1mono y s2mono), dos estilos en color (s1color y s2color) y dos estilos manuales
(s1manual y s2manual).
Para cambiar el esquema del próximo gráfico hay que introducir la instrucción set
scheme nombre_del estilo. Haciéndolo así, el gráfico de la Ilustración 6.61, se convierte
en este otro con el esquema de The Economist:
Ilustración 6.42
0
2
4
6
8
10
PP PSOE IU
Partidos


6.3.2 Gráficos con menús
Dado que controlar las múltiples posibilidades que ofrecen las posibilidades gráficas
de Stata es complicado y requiere un conocimiento pormenorizado de opciones y
subopciones, resulta de gran utilidad recurrir a los menús que se ofrecen a partir de la
versión 8 de este programa estadístico. No obstante hay que reparar en que, -salvo en
los gráficos de sectores para los que se dispone de una posibilidad inmediata ubicada en
el menú de los gráficos fáciles- para la representación simple de variables categóricas,
no basta con poner esta variable en la casilla correspondiente. Como se vio en el
apartado 6.1, para la construcción de gráficos unidimensionales de variables, hay que

36 Manual de Stata
generar una nueva con el peso de cada caso, que es la que aparece en el eje de
frecuencias, mientras que la que genera los distintos valores de la variable aparece bajo
la opción over.
Un ejemplo con un gráfico de barras del sexo mostrado a través de los diversos
menús ayudará a realizar la representación de las variables cualitativas.
Para no complicar excesivamente el ejemplo, se recurre a la modalidad de gráficos
simples (Graphics/Easy Graphs/Bar charts). Una vez que se han seleccionado desde el
menú estas tres opciones, aparece un cuadro de diálogo con seis pestañas (main, para
exponer la variables del gráfico y su tratamiento; over, para incluir las variables que
marcan los distintos segmentos del gráfico; if/in, para seleccionar los casos que se
desean exponer en el gráfico; titles, para poner títulos, subtitulos, aclaraciones y notas
adicionales al gráfico; yaxis, para manejar la apariencia de la escala vertical, y options
para propósitos diversos.
De ellas las dos primeras son las más importantes para el gráfico deseado y han de
ser dispuestas del modo siguiente:
Ilustración 6.43

En el cuadro de diálogo de la de la izquierda aparece en Statistic la modalidad sums
(count nomissing, en el caso de que se desee frecuencias absolutas y no relativas) y en
Varable(s), se ha insertado la variable instrumental que se crea a fin de que aparezcan
porcentajes o proporciones en lugar de sumas (véase el apartado 6.1.2). En el de la
derecha, en la ventana de las variables de cruce, es donde aparece la verdadera variable
de la que se desea la representación. El nombre que posee la variable en el fichero es el
que aparece en la primera ventanilla y en el momento de la instrucción puede dársele
una nueva etiqueta en la casilla relabel.
Con estas dos instrucciones bastaría para confeccionar el gráfico deseado. No
obstante puede ser mejorado sólo con dos detalles. En primer lugar, dando un título
distinto al eje vertical que representa en este caso a los porcentajes. Esto se logra

37 Manual de Stata
especificándolo en la casilla title de la penúltima pestaña. Y, en segundo lugar, haciendo
que el programa trate a la variable de cruce, como variable principal. Para ello, en la
última pestaña, puede marcarse la casilla Treat first over() group as Y-variables. De este
modo, cada barra, que representa cada uno de los valores de la variable, será dibujada
con un color o tonalidad diferente.
Ilustración 6.44


6.4 Opciones gráficas
Una vez visto cómo proceder para obtener lo básico de los distintos gráficos que
Stata genera con su instrucción graph, se van a considerar otros elementos que, aunque
auxiliares, son muy importantes para la definición final de los gráficos. Para cualquier
tipo de gráficos, independientemente de la instrucción que lo genere o de las
características propias de su forma, pueden distinguirse una serie de elementos
complementarios, a veces considerados secundarios, pero muy importantes para la
presentación adecuada. Sin pretensión de ser exhaustivos, aquí se presenta una lista de
ellos:
Títulos, etiquetas y notas: Cumplen la función de aclarar al lector qué es lo que se está
representando. Entre ellos, el título principal de un gráfico es un elemento esencial para
exponerlo en un índice de una publicación donde haya un número elevado de gráficos.
En muchas ocasiones, estos textos deben acompañarse de una línea adicional que
complementa la información del primero. Las etiquetas sirven para aclarar el contenido
de determinados componentes del gráfico, sean éstos ejes o elementos. Finalmente, las
notas suelen ocupar la parte baja del gráfico y su empleo más habitual es la cita de las
fuentes de los datos del gráfico.

38 Manual de Stata
Ejes: Son escalas donde se ubican los valores o las frecuencias de las variables
representadas. En teoría puede haber gráficos sin ejes, como los de sectores, y los puede
haber hasta con nueve; pero lo más frecuente es que un gráfico sólo tenga uno o dos. En
los mismos ejes se ubican las marcas y las cuadrículas. Las primeras son pequeños
signos, generalmente perpendiculares al eje, que especifican donde se encuentra un
determinado valor. Las cuadrículas, en cambio, son líneas que tienen su origen en un
determinado eje y llegan hasta el otro extremo del gráfico con el fin de poder ubicar la
posición de un determinado elemento dentro del conjunto.
Elementos: Son cada uno de los componentes esenciales de un gráfico, que
representan sea un caso o un grupo de casos, sea un valor o conjunto de valores. Son
elementos, por ejemplo, los sectores de un gráfico circular, los re ctángulos que forman
un diagrama de barras, los puntos de una nube de puntos o las líneas que representan
una regresión. En general, aun teniendo en cuenta las excepciones de las distintas
variedades, los elementos pueden diferenciarse de cuatro maneras distintas. En primer
lugar, por la
forma. De este modo, para distinguir distintos tipos de casos, puede
utilizarse un círculo, un cuadrado o cualquier otra forma similar, según se quieran
expresar los de una clase u otra. En segundo lugar, por el
tamaño también se pueden
diferenciar unos elementos de otros, aunque en la mayor parte de los gráficos el tamaño
suele emplearse para distinguir la frecuencia de unos determinados casos o valores. En
tercer lugar, por la
posición, pues en muchas ocasiones un valor no está representado por
el tamaño del elemento, sino por lo cercano o alejado que esté del punto de origen de
una escala. En cuarto lugar, los gráficos pueden utilizar el
color para diferenciar los
elementos. Así un valor puede quedar representado con un color y el resto de valores
con otros. Y finalmente, de modo alternativo o complementario al color, se pueden
utilizar distintas
tramas al dibujar cualquier elemento, como por ejemplo líneas
continuas, discontinuas o punteadas, o barras con superficies lisas, rayadas o punteadas.
Leyendas: Son el repertorio de símbolos que se utilizan en un gráfico, junto al
significado que éstos poseen. Sirven para descifrar el significado de las formas, colores
o tramas que se emplean para la representación de los datos y son voluntarias aunque
altamente recomendables.

6.4.1 Títulos
Para ser entendido sin necesidad de aclaraciones adicionales todo gráfico necesita
llevar un conjunto de textos que aclaren al lector qué es lo que está viendo. Entre éstos,
destacan por ser del conjunto del gráfico los títulos, los subtítulos (
captions) y las notas.
En la instrucción graph de Stata se ponen los textos y, en consecuencia, los títulos, a
través de opciones. Las más comunes y utilizadas son
title, subtitle, caption y note. Un
ejemplo con todas, nos muestra donde se ubican por omisión cada una de ellas.
También cabe destacar cómo un determinado título puede tener varias líneas siempre y
cuando cada una de ellas aparezca encerrada entre comillas.

39 Manual de Stata
graph pie, over(pp42)
title(“Gráfico 1” “Sexo”)
subtitle(“Encuesta 2000”)
caption(“Fuente CIS. 2000. Estudio 2384”)
note(“Elaboración propia”)
El gráfico resultante de la instrucción anterior es el siguiente:
Ilustración 6.45
hombre mujer
Elaboración propia
Fuente CIS. 2000. Estudio 2384
Encuesta postelectoral 2000
Gráfico 1
Sexo

A los títulos se les puede cambiar su apariencia mediante subopciones. Las más
importantes son el tamaño de la letra, el color, la alineación, la posición. Las palabras claves
para indicarlas son respectivamente size, color, aligment y position.
En cada una de ellas, se ha de especificar un valor numérico o textual. Así, por
ejemplo, en el tamaño, hay que indicarle un valor size(#) relativo al tamaño del gráfico,
o un factor multiplicador en relación al tamaño de la letra por omisión(*#). Pero
también se pude ubicar dentro del paréntesis una palabra clave indicativa del tamaño
deseado (tiny, small, medium, large, huge…). En el caso del color, las opciones han de
especificarse en inglés o en formato RGB formado por tres números que indican en una
escala de 0 a 255 la cantidad de rojo, verde y azul que contiene el color deseado. En el
alineamiento, las palabras claves que se pueden utilizar son (left, center y right). Y en la
posición, se puede indicar un número del 1 al 12, que representan las posiciones de los
números en la esfera de un reloj tradicional. Es evidente que a cada texto, tras la
especificación del contenido, seguido de coma, se le puede indicar tantas subopciones
como se desee. Un ejemplo, lo dirá mejor que un conjunto de palabras:
graph pie, over(pp42)
title(“Gráfico 1” “Sexo”, position(11) justification(left))
subtitle(“Encuesta postelectoral 2000”, position(11) size(small))
caption(“Fuente CIS. 2000. Estudio 2384”, size(*.8))
note(“Elaboración propia”, size(4))
Esta compleja instrucción compuesta de opciones y subopciones da lugar al siguiente
gráfico:

40 Manual de Stata
Ilustración 6.46
hombre mujer
Elaboración propia
Fuente CIS. 2000. Estudio 2384
Encuesta postelectoral 2000
Gráfico 1
Sexo

6.4.2 Ejes
Los ejes son escalas donde se ubican los valores o las frecuencias de las variables
representadas. No todos los gráficos tienen el mismo número de ejes. Así, un gráfico de
sectores no los posee, pues las frecuencias quedan representadas proporcionalmente por
cada uno de los sectores del círculo. Una nube de puntos posee claramente dos ejes, uno
para cada variable. Paradójicamente, un histograma dispone de dos ejes: uno
correspondiente a los valores de la variable y otro a sus frecuencias absolutas o
relativas. Por su parte, el gráfico de caja sólo dispone de uno, donde se representan los
valores de la variable que se desea representar. Ha de quedar claro, pues, que además
del número de ejes que pueda tener un gráfico, en unos se representan valores, que a su
vez pueden ser cuantitativos o cualitativos, y en otros se representan frecuencias. Los
que se refieren a las frecuencias o a las variables dependientes son conocidos como eje
y, mientras que los que afectan a valores o a variables independientes son denominados
como eje x.
Dentro de los ejes pueden a su vez distinguirse otra serie de componentes. Entre
ellos, los más importantes son el título, la escala, las etiquetas, las marcas y las guías.
Empezando por el título, ha de decirse que, aunque el ordenador titule por defecto los
ejes, se pueden cambiar o hacer que desaparezcan. Para ello, se emplea la opción
y|xtitle. En el siguiente ejemplo, se utiliza ésta sólo en el eje x, pues al tratarse de un
gráfico de barras sólo cuenta con una dimensión. Sin embargo, aunque sólo tenga una,
si se desea poner un título al eje vertical, puede utilizarse la opción b1title (o l1title si se
pide un gráfico de barras horizontales
18
). De este modo, añadiendo dos opciones (ytitle
y l1title) al gráfico de la Ilustración 6.12, sus ejes quedan titulados.
graph hbar (sum) casos, over(Voto_2000) asyvar
title(“Voto en últimas elecciones (2000)”)

18
Las letras iniciales b y l son abreviaturas de bottom y left respectivamente.

41 Manual de Stata
ytitle(“Porcentaje”)
l1title(“Partido político”)
Ilustración 6.47
0 10 20 30 40
Porcentaje
Pa
r
t
ido
p
o

t
ic
o
Voto en últimas elecciones (2000)
PP PSOE
IU Otros
Blanco NC

Las opciones de escala pueden aplicarse a los ejes de frecuencias o a los de valores
cuantitativos. No son lógicamente válidas ni en el gráfico de sectores, ni en el eje X de
los gráficos de barras, puntos o cajas. Estas opciones determinan si la escala que va a
dibujarse es normal, logarítmica (no aplicable en el caso de frecuencias) o invertida, el
rango con el que se traza, la colocación y la apariencia de la línea que la representa. Las
posibilidades de escala han de especificarse dentro de la opción yscale() o de la de
xscale(), según se quiera cambiar una u otra. Las más comunes son (log) para expresar
la escala en términos logarítmicos, (reverse) para invertir la escala, (alt) para colocarla
en el lado opuesto del gráfico, (range(# #)) para dibujar un eje con rango mayor del que
poseen los datos
19
y (off) si se desea hacer desaparecer el eje.
Un ejemplo de uso de la escala logarítmica permite darse cuenta de que no cambian
los valores originales de la variable. Lo único que varía es la disposición de la escala.
En el ejemplo es de notar cómo la distancia entre los 20 y los 40 años (la segunda edad
dobla la primera) es idéntica a la que existe entre los 40 y los 80.
graph box edad1, title(“Gráfico de caja”)
b1title(“n=5.283”)
yscale(log)
ytitle(“Edad (Escala logarítmica)”)

19
Esta opción no puede acortar el rango de una variable. Sólo sirve para extenederlo. Si se desea
acotar el rango de valores que se exponen en un gráfico, ha de emplearse la especificación if. De este
modo si se quisiera hacer un histograma con sólo a los menores de 50 años, habría que escribir la
siguiente instrucción: histogram edad1 if edad1<50

42 Manual de Stata
Ilustración 6.48
20
40
60
80
10
0
E
d
a
d
(E
s
c
a
l
a
l
o
g
a

tm
ic
a
)
n=5.283
Gráfico de caja

Existen otros aspectos que pueden modificarse en los ejes. Los más importantes de
ellos son las marcas, las guías y sus correspondientes etiquetas. Las primeras son signos
ubicados en el eje que indican dónde están representados los valores o frecuencias de la
variable del gráfico. Lo común es que las marcas estén colocadas en intervalos regulares
del eje. No obstante, hay la posibilidad de distinguir dos tipos de marcas: las principales
y las secundarias.
Tanto las marcas como las etiquetas principales pueden ser controladas mediante la
opción y|xlabel(lista) según se quieran modificar las del eje y o las del x. El contenido
de la lista se ajusta a la sintaxis general del programa Stata. El formato más útil en este
contexto es el de min(intervalo)max, esto es, hay que poner el valor mínimo de la
escala, el máximo y entre ellos y entre paréntesis cada cuantas unidades se desea que
aparezca un valor etiquetado. Pero también puede expresarse un solo número precedido
de #, en cuyo caso el programa pondrá el número de etiquetas indicado en intervalos
regulares.
En este ejemplo de histograma se utilizan los dos sistemas: uno en el eje vertical de
frecuencias (porcentajes) y otro en el eje horizontal de los valores de la variable:
histogram edad1, percent title(“Histograma de edades”)
xtitle(“Valores”) ytitle(“Porcentaje”)
ylabel(0(.5)5)
xlabel(#8)
Ilustración 6.49
0
.5
1
1.5
2
2.5
3
3.5
4
4.5
5
Por
c
entaj
e
20 30 40 50 60 70 80 90
Valores
Histograma de edades

43 Manual de Stata
Hay un tercer modo de referirse a las etiquetas, muy útil, para cuando se quiere
expresar el valor literal de éstas. Se trata de poner el valor numérico seguido del texto
que se desea sustituya a los dígitos. De este modo, en el caso de que se desee poner letra
a los siete días de la semana en el eje X, habría que escribir las siguiente opción:
xlabel(1 “L” 2 “M” 3 “X” 4 “J” 5 “V” 6 “S” 7 “D”).
También pueden controlarse las etiquetas de las marcas menores. En este caso, las
opciones que deben emplearse son y|xmlabel(lista). Además en estas opciones puede
expresarse en lugar de las otras la expresión ##X, donde X significa el número de
divisiones que quieren realizarse entre dos marcas mayores. El mínimo número posible
es 2, en cuyo caso se pondrá una marca menor entre dos mayores. Éste y los números 5
y 10, en cuyos casos se pondrían cuatro y nueve marcas respectivamente entre cada dos
mayores, son los más frecuentes de uso.
Tanto y|xlabel como y|xmlabel, pueden contener subopciones que afectan a la
suprensión (noticks) o apariencia (tlength(), tposition(), tlstyle(), tlwidth(), tlcolor() y
tlpattern()) de las marcas, o cambian el formato (format(%fmt), alternate, labgap(),
labstyle() labsize() y labcolor()) o ángulo (angle(#)) de las etiquetas.
Además, con las opciones de las etiquetas también pueden manejarse las guías
internas del gráfico (rejillas). Por defecto sólo aparecen en las marcas (o etiquetas)
mayores del eje Y del gráfico. Pero no sólo se pueden omitir éstas (nogrid), sino
también es posible incorporar las del eje X (grid). Además, son alterables el color
(glcolor()), el ancho (glwidth()) y el estilo (glpattern()) de la línea. Todo ello ha de
hacerse como una subopción de y|xlabel o de y|xmlabel.
Algunas de las últimas posibilidades señaladas se emplean en el siguiente ejemplo
gráfico.
histogram edad1, ylabel(0(.01).03, angle(0))
ymlabel(##2, angle(0) grid glpattern(dash))
xlabel( 20(10)90)
xmlabel(##2) title(“Histograma de edades”)
xtitle(“Valores”) ytitle(“Densidad”)
Ilustración 6.50
.005
.015
.025
0
.01
.02
.03

D
ens
i
dad”
25 35 45 55 65 75 85
20 30 40 50 60 70 80 90
“Valores”
“Histograma de edades”

44 Manual de Stata
Stata permite manejar las marcas de los ejes no sólo a través de la instrucción
y|xlabel, sino también de modo directo, a través de y|xtick o y|xmtick, con lo que se
indica que se pongan marcas sin etiquetas en los ejes.
histogram edad1, ytick (0(.0025).03)
ymtick(##2, grid glpattern(dash))
xmtick(##10)
xlabel( 20(10)90) xmlabel(##2)
xtitle(“Valores”) ytitle(“Densidad”)
title(“Histograma de edades”)
El mismo gráfico anterior con las opciones ymtick() y xmtick() añadidas da lugar a
este otro:
Ilustración 6.51
0
.01
.02
.03
Densidad
25 35 45 55 65 75 85
20 30 40 50 60 70 80 90
Valores
Histograma de edades

Es preciso notar que, aun no habiendo puesto la opción ylabel, el gráfico muestra
etiquetas por omisión a las frecuencias relativas. Por ello, la función de ytick es la de
multiplicar las marcas mayores. Por otro lado, también es curioso apreciar cómo la
instrucción ymtick añade las marcas menores a la implícita ylabel, en lugar de hacerlo
con la explícita opción ytick.
6.4.3 Elementos
Se han definido los elementos como cada uno de los componentes esenciales de un
gráfico, que representan sea un caso o un grupo de casos, sea un valor o conjunto de
valores. Estos componentes gráficos traducen las propiedades numéricas o las
cualidades de las distribuciones que se desean representar con el tamaño o la posición,
la mayoría de ocasiones, pero en otras ocasiones con el color, la forma o la trama, estos
elementos. Cada tipo de gráfico suele utilizar un elemento peculiar para representar los
datos. De este modo, los sectores son los elementos de un gráfico circular; los
rectángulos, los del diagrama de barras y los del histograma; los puntos, los del gráfico
de puntos y los del diagrama de dispersión; las líneas, los de los gráficos de densidad,
de función o de ajuste, y en el caso de los gráficos de caja, los elementos son las cajas,
la línea mediana, la línea de extensión y los puntos que representan a los casos extremos
y desviados.

45 Manual de Stata
Por eso en este apartado, se presentará elemento por elemento para indicar cómo
pueden configurarse cada uno de ellos.
6.4.4 Sectores
En el gráfico de sectores cada segmento circular representa cada uno de los valores
de una variable nominal y se dibuja con un área proporcional a la frecuencia con la que
el valor en cuestión aparece en la distribución. La opción dentro de la instrucción graph
pie que controla estos elementos es pie(#, subopciones) y tiene como especificación
entre paréntesis el número del sector al que se quiere cambiar y un par de subopciones
posibles: el color (, color(value)) y la posición respecto al centro (, explode). De este
modo, si se desea que el primer sector se seccione y se dibuje en azul, habrá que escribir
la opción pie con las siguientes subopciones.
graph pie, pie(1, color(blue) explode)
over(sexo1) title(“Sexo del entrevistado”)
Y el resultado será el siguiente gráfico:
Ilustración 6.52
Hombre Mujer
Sexo del entrevistado

Otras importantes características que puede incorporarse a los sectores son sus
respectivas etiquetas. Es mucho más evidente que éstas aparezcan dentro o cerca de los
sectores, que en un recuadro aparte como es la leyenda del gráfico como aparece en la
base del gráfico de la Figura anterior.
Para que el programa ponga etiquetas a los sectores habrá que utilizar la siguiente
opción:
, plabel({_all|#} {name|percent|sum|“Texto”}, subopciones)
Esta opción contiene dos parámetros: en primer lugar, ha de especificarse si se quiere
dar una instrucción general para todos los sectores (_all) o sólo para uno en particular
(#), representado por un número que empieza a contar por el sector que comienza a las
12 en una esfera de reloj. En segundo lugar, ha de expresarse una de tres palabras claves
(name, si se desea la etiqueta del valor representado por el sector; percent, si se quiere
que aparezca el porcentaje que representa el valor en el conjunto del círculo

46 Manual de Stata
represtnado; sum, si se opta por la frecuencia absoluta, en lugar de la relativa) o entre
comillas el texto literal que se quiere que aparezca en cada sector.
A continuación, optativamente se pueden añadir subopciones para controlar el lugar
y la forma con la que se plasmarán las etiquetas pertinentes. Las subopciones posibles
más relevantes son gap(#), para expresar la distancia al centro donde se desea que se
escriba el texto; format(%formato) para que los números aparezcan con el número de
decimales o en la notación científica deseada; size (tiny|small|medsmall|
medium|large|huge) para indicar el tamaño de los caracteres, y color(red|green|blue...)
para manejar su color.
A continuación se expone un ejemplo donde aparecen en cada sector tanto las
etiquetas de los valores, como sus correspondientes porcentajes, sin que se superpongan
las unas sobre los otros.
graph pie, pie(1, explode) over(sexo1) title("Sexo del entrevistado")
plabel(_all name, gap(-15) size(*1.5))
plabel(_all percent, gap(5))
El resultado gráfico de la anterior instrucción es el siguiente:
Ilustración 6.53
Hombre
Mujer
47.68%
52.32%
Hombre Mujer
Sexo del entrevistado

6.4.5 Barras
Los elementos del gráfico de barras son las columnas y la apariencia de éstas son
controlables a través de cuatro opciones: bar, bargap, outergap y blabel.
La opción bar, que permite manejar la apariencia particular de cada una de las barras,
tiene la siguiente sintaxis general:
bar(#, bcolor(color), blcolor(color de la línea), blwidth(anchura de línea)
blpattern(pauta de la línea))
Uno de los aspectos de las barras que puede ser modificado son las líneas exteriores
que las dibujan. Éstas además de poder controlarse como subopciones de una
determinada barra, pueden modificarse directamente mediante las opciones

47 Manual de Stata
blcolor(color) y blwidth(tamaño), en cuyo caso la especificación afecta a todas las
barras de un determinado gráfico.
La opción bargap(#) determina la anchura con la que se dibujan las barras, sabiendo
que el 0 equivale a barras unidas y los números negativos montan las barras entre ellas.
Complementariamente, la opción outergrap(#) indica el porcentaje de espacio que
dejan las barras en el extremo del gráfico y, en este caso, el –25, indica que las barras
ocupan todo el espacio del eje de representación.
Y, finalmente, la opción blabel es particularmente útil para poner etiquetas al
conjunto de barras de un gráfico. Los argumentos de esta opción son none –que es el
que opera por omisión-, bar, para representar el porcentaje de una determinada barra,
total, para indicar los porcentajes de las barras acumuladas, name, para poner como
etiquetas las de las variables expuestas en la dimensión y, y group, para indicale que se
pongan las etiquetas de la variables en la dimensión z, es decir, la expuesta en la primera
opción over().
graph hbar (sum) casos, bar(1, bcolor(blue))
bar(2, bcolor(red))
bar(3, bcolor(green))
bar(4, bcolor(brown))
bar(5, bcolor(gray))
bar(6, bcolor(yellow) blcolor(black) blwidth(thick))
bargap (-50)
outergap(-25)
blabel(bar, position(inside) format(%3.1f))
over(Voto_2000) asyvar
title(“Voto en últimas elecciones (2000)”)
ytitle(“Porcentaje”) l1title(“Partido político”)
De este modo, se asignan distintos colores a las barras, abarcan todo el eje y se
superponen entre ellas en un 50% de su tamaño:
Ilustración 6.54
31.7
2.0
8.4
4.3
20.0
33.6
0 10 20 30 40
“Porcentaje”
“P
ar
t
id
o
p
o
l
íti
c
o

“Voto en últimas elecciones (2000)”
PP PSOE
IU Otros
Blanco NC

48 Manual de Stata
Hay gráficos bidimensionales (los histogramas y los gráficos de barras incluidos en
twoway) que también usan barras, pero las manejan de manera algo distinta a los
gráficos unidimensionales. La principal diferencia es que en lugar de utilizar las
opciones bar, outergap y bargap, se usan las siguientes: específicamente, barwitdh(#)
para el ancho, en unidades de la variable X; genéricamente, bcolor(color) para el color
interno, y blcolor(color), blwith(anchura) y blpattern(modelo) para el color, anchura y
modelo de las líneas con las que se dibujan las barras.
Las obvias diferencias se ven aún mucho mejor mediante un ejemplo de un gráfico
de barras de doble entrada:
graph twoway bar pob supkm2, bcolor(green)
blcolor(black)
barwidth(500000)
blwidth(thick)
title(“Gráfico de barras (Twoway)”)
xlabel(, format(%10.0f))
Con el siguiente resultado:
Ilustración 6.55
0
50
0
10
00
15
0
0
Po
bl
a
c
io
n (
m
il
lo
n
e
s
)

1
9
99
0 5000000 10000000 15000000 2000000
Superficie km2 1996
Gráfico de barras (Twoway)

6.4.6 Puntos
Las principales características que pueden definirse de los puntos son la forma, el
tamaño y el color. Aunque son claves en los gráficos bidimensionales, también aparecen
entre los unidimensionales, en los llamados diagramas de puntos, que como ya se ha
señalado son equivalentes a los diagramas de barras, pero sustituidas éstas por unas
marcas ubicadas en líneas. Según el tipo de gráfico donde estén presentes, el tratamiento
de los puntos es ligeramente distinto.
La sintaxis para determinar la apariencia de los marcadores en el gráfico de puntos es
la siguiente:
marker(#, mcolor(color) msymbol(símbolo) msize(tamaño))
Donde el color puede indicarse bien en inglés (red, green, blue, yellow, ...) o bien con
el formato RGB compuesto por tres números que indican la cantidad de rojo, verde o

49 Manual de Stata
azul del color deseado; el símbolo puede ser un círculo (O), un diamante(D), un
triángulo(T), un cuadrado(S), un aspa(X), (todas estas opciones pueden expresarse
también en minúscula para reducir su tamaño o seguida de una h para que el símbolo
quede sin el interior relleno), una cruz(+),un punto(p) o un símbolo invisible(i), y el
tamaño puede tener los siguientes valores: tiny, small, medsmall, medium large, huge
(además, las dos primeras y las dos últimas puede estar precedidas de una v (very) para
acentuar sus características).
De este modo, con la siguiente instrucción
graph dot (sum) casos, over(Voto_2000) asyvar ytitle(“Porcentaje”)
marker(1, mcolor(blue) msymbol(Oh) msize(huge))
marker(2, mcolor(red) msize(medium) msymbol(S))
marker(3, mcolor(green) msize(small) msymbol(D))
marker(4, mcolor(maroon) msymbol(+))
marker(6, mcolor(black) msize(large) msymbol(T))
Se obtiene la siguiente secuencia gráfica de puntos.
Ilustración 6.56
0 10 20 30 40
Porcentaje
PP PSOE
IU Otros
Blanco NC

En este tipo de gráficos, los puntos (markers), que representan un determinado
estadístico, se extienden bien sobre una serie de puntos (dots), una línea o un
rectángulo. Por defecto lo hace sobre la primera, en cuyo caso puede controlarse tanto el
número de puntos (ndots), como su forma y tamaño a través de la opción dots, que tiene
la misma sintaxis (msize, msymbol y mcolor) que marker, salvo el número inicial
inexistente, ya que todas las series de puntos han de poseer el mismo formato.
De modo muy parecido son diseñables los puntos en los diagramas de dispersión. En
estas representaciones bidimensionales las opciones son msize, msymbol y mcolor, sin
necesidad de que estén precedidas de una opción anterior como marker o dots. Otra
interesante posibilidad es la de darles un tamaño proporcional al tamaño de una
determinada variable, si ésta se especifica como si fuera el peso [weight=variable] de la
instrucción.
graph twoway scatter evn pnbppa [weight=pob], mcolor(green)

50 Manual de Stata
Con la instrucción anterior, se muestra un gráfico con puntos verdes de tamaño
proporcional a la población del país representado.
Ilustración 6.57
40
50
60
70
80
E
s
peranz
a
de v
ida al
nac
er 1998
0 10000 20000 30000 40000
PNB por unidad de compra

Además, se pueden poner etiquetas a los puntos con la opción mlabel(variable). Ésta
se puede complementar con las opciones mlabposition(#), mlabgap(#), mlabangle(#),
mlabsize(#) y mlabcolor(red|green|blue…) para cambiar el aspectos de las etiquetas. Y,
de igual modo, pueden realizarse determinadas operaciones con la variable a fin de que
sólo aparezcan las etiquetas con determinadas características como prueba el siguiente
ejemplo.
generate etipais=pais if pob>150
graph twoway scatter evn pnbppa [weight=pob], mcolor(green)
mlabel(etipais)
mlabposition(12)
Como puede apreciarse en el próximo gráfico, la ponderación de los puntos y su
etiquetaje son incompatibles y, por ello, cuando se etiquetan, la especificación del peso
([weight=peso])0 es ignorada
20
.

20
Hay un medio indirecto para hacer que aparezcan tanto las ponderaciones como las etiquetas.
Consiste en pedir dos gráficos y superponerlos. En este ejemplo la instrucción quedaría como sigue:
graph twoway (scatter evn pnbppa [weight=pob], mcolor(green)) (scatter evn pnbppa, mlabel(etipais)
msymbol(i)), legend(off)

51 Manual de Stata
Ilustración 6.58
Brasil
China
Estados Unidos
India
Indonesia
40
50
60
70
80
E
s
p
e
r
a
n
z
a

d
e

v
i
da
al
na
c
e
r
19
98
0 10000 20000 30000 40000
PNB por unidad de compra

6.4.7 Líneas
Las líneas pueden aparecer tanto en los gráficos unidimensionales de puntos, como
en los bidimensionales. En los primeros, sólo tienen un carácter instrumental, pues en
lugar de una serie de puntos, los marcadores pueden disponerse sobre una línea, siempre
y cuando se especifique la opción linetype(line). En este caso, la(s) línea(s) por la(s) que
se extienden los puntos (markers) también puede ser modificada(s) mediante opciones y
subopciones de la instrucción graph. Los atributos susceptibles de modificación son el
color (lcolor), la anchura (lwidth) y la forma (lpattern). Todos ellos han de ser incluidos
dentro de un paréntesis precedido por la palabra clave lines().
Las opciones de color de las líneas son las mismas que la de los sectores, las barras o
los puntos. Las opciones de ancho son none, thin, medthin, medium y thick. La
especificación thin puede estar precedida hasta por dos v para reducir su tamaño y thick
puede escribirse hasta con tres v minúsculas por delante para aumentar el tamaño del
grosor de la línea. Finalmente, las formas (lpattern) que puede adoptar una línea se
pueden indicar bien medienate una palabra clave como solid, dash, dot, dash_dot,
shortdash, shortdash_dot, longdash, longdash_dot o blank, bien mediante una formula
combinatoria entre comillas compuestas por líneas(l) guiones (_ y -) puntos(.) o
espacios (#).
Un ejemplo con estas tres opciones ayuda a conocer su disposición en el conjunto de
la instrucción:
graph dot (sum) casos, over(Voto_2000) asyvar ytitle(“Porcentaje”)
title(“Recuerdo de voto en elecciones 2000”)
linetype(line)
line(lcolor(red)
lpattern(“-##.##l”)
lwidth(vvthin))

52 Manual de Stata
Ilustración 6.59
0 10 20 30 40
Porcentaje
Recuerdo de voto en elecciones 2000
PP PSOE
IU Otros
Blanco NC


El uso de puntos y líneas es más extendido en los gráficos de dos dimensiones. Como
se vio anteriormente, pueden aparecer en los gráficos de línea, área, ajuste y rango. El
modo de controlar su forma, tamaño y color es similar al de los puntos. Mientras que en
el caso de los marcadores se empleaban directamente las opciones msymbol, mcolor y
msize enumerando los diferentes símbolos, colores o tamaños que se querían dar a las
distintas series; cuando de líneas se trata, éstas se modulan con las opciones
clpattern(pauta), clcolor(color) y clwidth(anchura), escribiendo en el interior del
paréntesis la serie de distintos formatos deseados, uno por cada línea representada en el
gráfico. El ejemplo más cercano se encuentra en la Ilustración 6.50Ilustración 6.60.
Como muestra de la manipulación de las características de las líneas, se va a
representar en el mismo gráfico tres series que constituyen el porcentaje del PIB
correspondiente a la agricultura, la industria y los servicios. Todas ellas están
representadas en el mismo gráfico y eje. Cada una de ellas con un color y ancho
distinto, especificados en las opciones, y con una pauta distinta de línea, cambiada
según las opciones por omisión del programa.
graph twoway line pibag pibin pibse rnbppa, ytitle("%") sort
clcolor(red green blue)
clwidth(2 1 .1)
Ilustración 6.60
0
20
40
60
80
%
0 10000 20000 30000
Renta per cápita (poder de compra)
PIB en agricultura PIB en industria
PIB en servicios

53 Manual de Stata
En otros gráficos bidimensionales, en general en aquellos en que las líneas son
verticales o representan una superficie, tales como los gráficos de rango, área y clavos,
hay que sustituir las opciones
clwidth, clpattern y clcolor, por blwidth, blpattern y
blcolor, respectivamente. 6.4.8 Cajas
Quedan por referirse las opciones típicas de los elementos de los gráficos de caja,
que son las más complicadas de todas por la propia naturaleza de este tipo de
representaciones de variables.
En estos gráficos, se pueden distinguir cuatro subelementos. El más obvio es la caja
(box), que aglutina al 50% de casos centrales. Dentro de la caja hay que representar a la
mediana medtype bien mediante una línea (line o cline), bien mediante otro símbolo
(marker). Como extensión de la caja se encuentran las líneas cwispers que se extienden
vez y media el rango intercuartílico. Finalmente, forman también parte de este gráfico
los símbolos (markers) que representan los casos extremos de la distribución.
Las cajas son muy parecidas a las barras del correspondiente tipo de gráfico. Por eso,
su modo de cambiarlas es idéntico. Lo único que varían son dos cosas: en primer lugar,
la opción se denomina box, en lugar bar. Y, en segundo lugar, la distancia entre las
cajas puede establecerse mediante la instrucción boxgap(#), en lugar de la que se
empleaba para las barras (
bargap()). Sin embargo, la opción outergap(#), para
determinar el espacio entre el límite del gráfico y las cajas extremas, funciona del
mismo modo. Recuérdese que la sintaxis de la primera opción es como sigue:
box(#, bcolor(color), blcolor(color de la línea), blwidth(anchura de línea))
La línea (o marca) de la mediana se puede determinar mediante la opción
medtype(tipo). Existen tres tipos: la línea común (line), una línea especificada por el
usuario (cline) o un símbolo(marker), cuyas características pueden también controlarse
a través de otra opción medmarker(), que controla la apariencia del símbolo del mismo
modo que se hace con los puntos, es decir, mediante las especificaciones msymbol,
msize y mcolor.
Las líneas que salen de las cajas (wiskers) poseen a su vez tres posiblidades de
modificación. Para que funcione cualquiera de ellas ha de explicitarse la opción
cwiskers además de la correspondiente a lo que se desea cambiar. Así, si se quiere
cambiar la apariencia de la línea ha de añadirse la opción lines(lcolor(color)
lwidth(anchura) lpattern(forma)). Si se quiere cambiar la anchura de la línea que marca
el tope, se ha de especificar la opción alsize(#), fijada en 67 puntos por omisión. Y, por
último, si se desea poner unos topes a ésta última ha de añadirse la opción capsize(#),
fijada en 0, si no se menciona explícitamente.
Finalmente, la opción marker funciona exactamente igual que la opción del mismo
nombre en los gráficos de punto. Esto es, se le puede indicar básicamente el color, la
forma y el tamaño a los símbolos que representan los casos desviados y extremos.

54 Manual de Stata
Y como ejemplo de todas estas instrucciones, se expone a continuación una orden
que cambia sustancialmente la forma de la Ilustración 6.22.
graph box p4501-p4503, title(“Posición ideológica atribuida a partidos políticos”)
cwhiskers lines(lcolor(red)) capsize(10) alsize(50)
marker(1, mcolor(green) msymbol(O) msize(huge))
marker(2, mcolor(blue))
marker(3, mcolor(red) msize(small))
box(1, bcolor(green))
box(2, bcolor(blue))
box(3, bcolor(red))
medtype(cline) medline(lcolor(yellow))
La consecuencia de todas estas opciones es la siguiente:
Ilustración 6.61
0
2
4
6
8
10
Posición ideológica atribuida a partidos políticos
iu pp
psoe

6.4.9 Leyendas
Se han definido las leyendas como un repertorio de símbolos acompañados por sus
respectivos significados. En los gráficos que hasta ahora se han explicado aparecen
automáticamente etiquetas en los sectores y, siempre y cuando haya más de una variable
en el eje Y, en los de barras, puntos y cajas. En el siguiente ejemplo compuesto, se
muestra cómo en un gráfico de caja aparece la leyenda si se representan más de una
variable, pero no si se representa una sola:
Ilustración 6.62
0
2
4
6
8
10
iu
0
2
4
6
8
10
iu pp
psoe

55 Manual de Stata
Son múltiples los aspectos de la leyenda que pueden ser controlados mediante la
opción legend(). Para obtener una lista de todas, el usuario de Stata, puede solicitar la
ayuda help legend_options. Aquí sólo se presentarán las que a juicio de los autores se
consideran más relevantes para el uso cotidiano de los gráficos.
La subopción title “Texto” pone un encabezamiento al conjunto. La especificación
de order(# “Etiqueta”…) permite cambiar el orden y el texto de la presentación de los
símbolos de la leyenda. Las subopciones rows(#) y cols(#) controlan el número de filas
o columnas que van a quedar representadas en el recuadro de la leyenda. Y, finalmente,
la subopción position(#), con un número del 1 al 12, ubica la leyenda en un determinado
lugar del gráfico.
Un ejemplo aclarará la sintaxis y el resultado de cada una de estas especificaciones:
graph box p4501-p4503, legend(title(“Partidos”) order(2 “PP” 3 “PSOE” 1 “IU”)
cols(3) position(12))
El gráfico del lado derecho de la figura anterior se convertirá en este otro:
Ilustración 6.63
0
2
4
6
8
10
PP PSOE IU
Partidos
Tags