Explotación de
Datos con
Programación en
SPSS
Elaborado por: Ing. Romy E. Rodríguez Ravines
Julio del 2,000
EL SPSS
El SPSS es un paquete estadístico de Análisis de datos
con más de 20 años de aplicación en la investigación de
las ciencias sociales y económicas. Contiene programas
capaces de realizar desde un simple análisis descriptivo
hasta diferentes tipos de análisis multivariante de datos,
como pueden ser: análisis discriminante, análisis de
regresión, cluster, análisis de varianza, etc... También
permite analizar series temporales, obtener tablas de
frecuencias, realizar gráficos, ...
POR QUE USAR Syntax?
1.
2.
3.
4.
Más opciones:
•
Uso de una variable más de una vez
•
Presentación de los totales
•
Varias tablas en un solo comando
Menor tiempo
Orden y precisión
Conservar y Repetir el trabajo
CASO ILUSTRATIVO
Encuesta a 678 hogares y 3189
personas del país
Los datos se encuentran en 03 archivos:
1.
Data01.sav:
Características Generales del hogar
(Ubicación, Miembros, Ingreso, Gasto)
2.
Data02.sav:
Características de los miembros
(Edad, Estado Civil, Nivel de Educación)
3.
Data03.sav:
Otras Características del hogar
(Tipo de vivienda, Pared, Piso, Artefactos)
PARTES DEL PROGRAMA
o
LEER DATOS
•
•
•
•
o
SELECCIONAR Y/O MODIFICAR
DATOS
•
•
•
•
o
Qué tipo de archivo de datos?
Dónde está?
Qué contiene?
Datos etiquetados?
Todos o algunos datos?
Nuevas variables?
Nuevas categorías de variables?
Valores perdidos?
PROCEDIMIENTO ESTADISTICO
• Qué procedimiento?
• Qué opciones?
o
GUARDAR DATOS
• Conservar los cambios en la data?
EJEMPLO DE PROGRAMA
* Este es un ejemplo de Programa Spss.
Get file 'C:\Curso\Data01.sav'
Var lab
Ubigeo Código de Dpto, Prov y Dist
Area Area de Residencia.
Val lab area
'1'
Urbana
'2'
Rural.
String dpto(a2).
Compute Dpto=substr(ubigeo,1,2).
Execute.
Var lab Dpto Departamento.
Table
/Gbase=Cases
/Ptotal t1 'Total' t2 'Total'
/Table=t1 + Dpto By t2 + area
/Statistics cpct( area( f5.1 ) '':area )
/Title 'EJEMPLO 01:' /Caption ')Date'.
Save Outfile 'C:\Curso\Ejemplo01.sav' /comp.
REGLAS GENERALES

Se inicia con un comando
(p.e.TABLES)

Los subcomandos se separan por /

Todo comando termina en un punto.

Los nombres de las variables se
escriben completos

Se pueden usar varias líneas

Los signos igual son opcionales

El punto se utiliza como separador de
decimales

Los comentarios comienzan con un
asterisco (*)

En muchos casos es necesario
EXECUTE.
USO FRECUENTE
•
VARIABLE LABEL
Nombre completo a las variables
(120 caracteres)
VAR LAB
MIEPERHO
INGHOG1D
DOMINI01
•
Número de Miembros
Ingreso Trimestral
Dominio
VALUE LABEL
Nombre a los valores de las variables
(60 caracteres)
VAL LAB ESTRAT01
1 Ciudades capitales
2 Grandes ciudades
3 Resto urbano
4 Rural
5 Resto rural
USO FRECUENTE
•
RECODE
Recodifica una variable.
HAY DOS OPCIONES:
1. Reemplazar valores
RECODE domini01
(1,2,3=1) (4,5,6=2)(7=3)(8=4).
RECODE hnbi (sysmis =0).
EXECUTE.
2. Crear una nueva variable
RECODE estrat01
(1 thru 3=1) (4,5 =2) INTO area.
RECODE nbicount
(1 thru higest=1) (0=2) into nbi.
EXECUTE.
USO FRECUENTE
• COMPUTE
Calcula variables nuevas
Operaciones y funciones
COMPUTE gasmali=(gru11hd+gru12hd+gru13hd/3).
COMPUTE gasmpc=(gashog2d/(mieperho*3).
COMPUTE Lningm=Ln((inghog1d/3)).
Execute.
Casos seleccionados
IF(area=1) urbana=1.
IF(percepho>=2) percep=1.
EXE.
Se debe escribir dos veces
IF(mieperho >= 1 & mieperho <= 4) miemb=1.
IF(mieperho > 4) miemb =2.
EXE.
USO FRECUENTE
•
SELECT IF
Selección permanente de casos
USE ALL.
FILTER OFF.
SELECT IF (p203=1).
EXE.
•
FILTER BY
Selección temporal de casos
USE ALL.
COMPUTE filtro = (p203=1).
FILTER BY filtro.
EXE.
USO FRECUENTE
o
SPLIT FILES
Divide el archivo de datos en
subgrupos que pueden ser analizados
simultáneamente.
o
SORT CASES
Reordena los casos en el archivo de
datos basado en una o más variables.
o
AGGREGATE
Crea un nuevo archivo con variables
calculadas. Puede ser un archivo de
hogares a partir de un archivo de
personas
o
MERGE FILES
Sirve para juntar dos archivos
o
RANK CASES
Se usa para la formación de deciles,
quintiles, etc.
SPSS Tables
Creación de tablas sofisticadas, de
fina presentación. Con más de 35
estadísticos capaces de ser
incluidos en estas tablas.
Que permite hacer?
 Utilizar más de 35 estadísticos para
celdas y resúmenes.
 Presentar datos de respuestas
múltiples efectivamente: calcula
porcentajes sobre respondentes o
respuestas para interpretación y
análisis mas sencillo
 Manejar los valores perdidos (missing
values) y cambiar sus etiquetas y
formatos
Ejemplo de
SPSS Tables Syntax
TABLES
/GBASE=CASES
/FTOTAL= t2 "Total" t1 "Total"
/TABLE=estrat01 + t2 BY nbicount + t1.
TABLES
/GBASE=CASES
/pTOTAL= t2 "Total" t1 "Total"
/TABLE= t2 + estrat01 BY t2 + nbicount
/STATISTICS
cpct(nbicount(f5.1) '':estrat01)
/TITLE 'Ejemplo 01 ' + ' )DATE'.
Ejemplo 01 09 Jul 00
Número de NBI de l hoga r
To ta l
To ta l
Es tra to
.00
1.00
2.00
3.00
4.00
10 0.0
59 .1
26 .5
10 .8
3.2
.3
10 0.0
77 .6
13 .8
5.1
3.1
.5
Grande s ciudades
10 0.0
79 .8
17 .3
1.9
1.0
Re sto urbano
10 0.0
70 .6
22 .9
5.5
.9
Rura l
10 0.0
52 .0
42 .0
6.0
Re sto rural
10 0.0
28 .8
40 .6
23 .7
C iudades
ca pitales
6.4
.5
TIPOS DE SUBCOMANDOS
Subcomandos GLOBALES
Subcomando
Descripción
AUTOLABEL
Crea etiquetas para todas las tablas
BASE
Determina la base de los porcentajes para las
variable categóricas
Crea variables para los totales de una tabla
FTOTAL, PTOTAL
GBASE
MDGROUP,
MRGROUP
MISSING
OBSERVATION
Determina la base de los porcentajes para las
variables de respuesta múltiple
Crea variables de respuesta múltiple
Determina el tratamiento de los valores perdidos
Declara las variables que serán “resumidas” al
interior de la tabla
Subcomandos LOCALES
Subcomando
Descripción
CAPTION
Crea notas al pie del cuadro
CORNER
Crea etiquetas para la tabla
SORT
Ordena las celdas de las tablas
STATISTICS
Indica las estadísticas que serán calculadas al
interior de las tablas
TABLE
Determina la estructura de las tablas
TITLE
Crea el título de la tabla
TIPOS DE VARIABLES
Categorías
CATEGORY, default
Los valores de esta variable se usan para clasificar
la data
•Observación
OBSERVATION
Los valores de esta variable se presentan en el
contenido de la tabla a través de estadísticas
(media, varianza, etc.)
•Respuesta
Múltiple
MRGROUP: Multiple response
Son variables que se crean a partir de variables
individuales en la data.
•Total
al final
FTOTAL: Following Total
En esta variable se calculan las estadísticas para el
total de la fila o columna. Se presenta luego de la
variable en estudio.
•Total
al comienzo
PTOTAL: Preceding Total
Es similar al anterior, pero se presenta antes de la
variable en estudio.
RELACION ENTRE VARIABLES
•
Dimensiones: BY
Se usa para separar las variables o
combinaciones de variables según serán
asignadas a las dimensiones de la tabla (filas,
columnas, capas)
Filas BY Columnas BY Capas
o
•
o
Apilar: +
Se usa para presentar dos variables en la misma
dimensión de la tabla (una a continuación de la
otra)
Var1 + Var2 BY Var3
Anidar: >
Se usa para presentar todos los valores de una
variable (variable anidada) respecto a cada uno
de los valores de otra variable (variable de
control)
Var1 > Var2 BY Var3
Combinar Apilar y Anidar: ( )
Se usa para tablas deonde se desea Apilar y
Anidar a la vez.
(Var1 + Var2) > Var3 BY Var4
CONTENIDO DE LA TABLA
CONTENIDO DE LA TABLA
Descargar

USO DEL SPSS Tables