HACIA EL CIRR
CODIFICACIÓN
INFORMATIZADA DE
REGISTROS Y RELEVAMIENTOS
Elaborado por Mara Riestra para el
Taller sobre Clasificaciones Internacionales
10 al 12 de setiembre de 2012
Cepal – Chile - Santiago
POR QUÉ CIRR
PARA QUÉ CIRR
PARA…
 Ofrecer codificación estandarizada de bases del
SEN.
 Propiciar el uso uniforme de los clasificadores
asociados a la codificación informatizada.
 Obtener indicadores de la demografía de las
descripciones de las variables codificadas que
agreguen valor al análisis estadísticos.
OPERACIONES CIRR
OPERACIONES DE REDUCCIÓN 
……………… EVITAR REDUNDANCIA
• VERTICAL Frases únicas (FU)
• HORIZONTAL  eliminar palabras repetidas
OPERACIONES CIRR
• OPERACIONES DE SINTESIS 
…………………………….. PROCESOS DE SUSTITUCIÓN
• NORMALIZADO
• FAMILIARIADO (mantiene raíz)
• ABUELIZADO (sinónimia clasificatoria)
• REGLAS (fabricar y vender  Fabricar)
FILOSOFÍA CIRR
 DEFINICIÓN DE PRIORIDADES 
PARETO  CURVA ABC
 DISTRIBUCIÓN DEL TRABAJO 
REDES SECTORIALES
 EVITAR ERRORES 
PAUTAS
MEJORA DEL CLASIFICADOR 
CÓDIGOS AUXILIARES
PARETO
A
B
C
TITULOS
1.261
1.821.554
6.504
179.266
131.247
200.294
93.367
568.773
719.332
794.355
ACTIVIDAD
19.811
7.051.474
REDES SECTORIALES
ERRORES
Evitar codificar solo la primera
descripción
Cantidad de dígitos s/información
Usar lenguaje cotidiano y nacional .
Ejemplo Prenda
MÓDULOS FUNCIONALES DEL CIRE
I- RECEPCION DE BASES Y/O CONSULTAS
II- PREPARACIÓN DE LAS BASES PARA CODIFICAR
III- CODIFICACIÓN
IV-CONTROL DE RESULTADOS
V-GESTIÓN DE TAREAS
PRIMER MÓDULO
RECEPCION DE BASES Y/O
CONSULTAS
RECEPCIÓN DE BASES y/o CONSULTAS
Para qué:
a. Documentar bases y consultas
b. Identificar y documentar las similitudes y
diferencias entre las distintos programas en torno
a los criterios y requerimientos de codificación.
c. Modificar la estructura de origen de los datos para
convertirlos en datos de entrada al CIRR
RECEPCIÓN DE BASES y/o CONSULTAS
Ejemplos de diferencias entre bases a codificar:
a. En algunos países los CNPyV no registran tareas
asociada a la ocupación; la EH en general sí.
b. Algunos códigos precodificados no son iguales
entre EH y CNPyV. Ej: categoría ocupacional
c. Los dígitos a codificar EH difieren de los del CNPyV y
a su vez difiere de los que puede utilizar otras
entidades fuera del INE
RECEPCIÓN DE BASES y/o CONSULTAS
ETAPAS DE ESTA FUNCIÓN:
A. Completar ficha
B. Armar la estructura de la base de datos a
“devolver” al usuario que pidió la codificación
RECEPCIÓN DE BASES y/o CONSULTAS
Modelo Ficha:
FICHA DE BASE DE DATOS RECIBIDAS
Identificación de las BD Recibidas
Nombre de BD recibida:
Descripción de BD recibida:
Tipología de Contenido
Origen:
Procedencia:
Nº de Registros
Fecha de Recepción:
Fechas de BD Recibida
Año de referencia:
Turno recepción:
Hora de recepción:
Contenido de BD recibida
Nº de campo
1
….
….
25
Nombre
Formato
Tamaño
Nº
Ítem a controlar
Nombre del archivo
= código
de la
todas las
2 Están
variables
a Recode
1
Entidad código
01
…
n
Nº
Ítem a controlar
1
Nombre del archivo =
código
delas
la Entidad
Están
todas
variables
2
n
Recolección
b
Sexo
o
Caza
c
Edad
p
Pesca
d
Lee/escribe
q
Cria
Nivel educativo
f Año al que
g llegó
Trimestre
r
Ocupación
s
h
u
Actividad
Tamaño
empresa
Razón
e
i
Semestre
Tiene título
Univer.
t
3
3
4
5
Social
Tipo
v
Empleado
Estructura = todas
las
bases
hay Tablas de
decodificación
Verificación Estado de
los
registros PEM
Se completo
Entidad - código
01
…
n
RECEPCIÓN DE BASES y/o CONSULTAS
Modelo posible DE BASE A DEVOLVER:
Valor agregado al usuario = base codificada
Código original del proyecto a
codificar
020101000470004200200000000000000005AF102
020101000470004200200000000000000006AF101
020101000470004200200000000000000006AF102
020101000470004200200000000000000006AF103
020101000470004200200000000000000006AF104
020101000470004200200000000000000007AF101
(*) adaptaciones nacionales
COD_CIIU*
COD_CIUO*
COD_CINE*
SEGUNDO MÓDULO
PREPARACIÓN DE BASES A
CODIFICAR 
Procesos Orto-semánticos
PASO PREPARATIVO 1.1: Tablas de trazabilidad
REDCODE
REDCODE
REDCODE
ID_FOUA ID_FUNA ID_FUCCA ID_FUFA ID_FUCSA CIIU*
ID_FOUO
ID_FUNO
ID_FUCCO ID_FUFO
ID_FOUT ID_FUNT ID_FUCCT
ID_FUFT
ID_FUCSO CIUO*
ID_FUCST CINEV
PASO PREPARATIVO 1.1: Tablas de trazabilidad
PAUTAS:
a. no hace falta colocar en la base de trazabilidad, los textos.
b. los ID tienen que identificar de que variable se trata.
PASO PREPARATIVO 1.1: Tablas de trazabilidad
PAUTAS:
c. de estas tablas salen las relaciones que:
c.1 permiten armar los datos para las pantallas de
verificación
c.2 permite establecer la relación entre códigos puesto y el
código del proyecto para armar la tabla de devolución de la
base codificada.
PASO PREPARATIVO 1.2: FRASES ORIGINALES
CODIGO ORIGINAL
ID_FUO_A
FRASE_ORIGINAL
TAMANO
020101000470004200200000000000000005AF102
1BEDEL
1,00
020101000470004200200000000000000006AF101
8
1,00
020101000470004200200000000000000006AF102
020101000470004200200000000000000006AF103
0,00
FAVRICA DE
MUEBLES
020101000470004200200000000000000006AF104
020101000470004200200000000000000007AF101
020101000470004200200000000000000007AF102
VACIA
3,00
0,00
PLANTERO
STATUS
VACIA
1,00
0,00
VACIA
PASO PREPARATIVO 1.3: Proceso P_Pal
OBJETIVO: actualizar los diccionarios basados en palabras:
a) corrector
b) null
c) padres e hijos (familiarizado)
d) padres y abuelos (campos semánticos)
e) locales y otras palabras especiales de actividad
f) sufijos ocupaciones
Valor agregado:
aumentar las palabras de los diccionarios con palabras propias de las bases a
codificar.
Instrumentos de trabajo: pantallas de familia, corrector y especiales.
La finalidad de este proceso es la siguiente:
• Llega la base a codificar, se arma la lista de todas
las palabras que forman la base y se computa su
frecuencia.
Se separan palabras Reconocidas de las No
reconocidas
Las nuevas palabras son las que procesamos por
familia (alta frecuencia) o corrector (baja
frecuencia)
PASO PREPARATIVO 2: OPERACIÓN FRASE ÚNICA
OBJETIVO: OBTENER BASE DE FRASES ORIGINALES ÚNICAS
Valor agregado:
reducción en al menos un 90% la cantidad de registros a codificar
EJEMPLO:
Títulos:
2.201.114 registros  139.009 FU
Ocupaciones: 9.033.449 registros  373.052 FU
Actividades: 9.327.340 registros  620.605 FU
PASO PREPARATIVO 3: Normalizado
OBJETIVO: OBTENER BASE DE FRASES ÚNICAS NORMALIZADAS
Valor agregado: reducir en alrededor de un 10% la base de frases
originales únicas a codificar (ya reducidas a alrededor de 90% de la base
original)
Ejemplo:
Ocupaciones: 373.053 FUO_O  206.480 FUON_O
1bedel  BEDEL
ni?o  NIÑO
PASO PREPARATIVO 3: Normalizado
Origen: sistemas de lecturas basados en idiomas que no usan acentos
ni ñ, mas problemas de tipeo.
hay:
Reemplaza por: Hay:
Reemplaza
por:
Hay:
Reemplaza por:
N?A
NIA
R?O
RIO
4
E
PA?AM
PAÑAM
C?A
CIA
5
R
L?TIC
LITIC
I?O
IÑO
MEC?AN
MECAN
BA?I
BAÑI
I?A
IÑA
I?E
IÑE
VA?I
VAÑI
?I?O
NIÑO
VR
BR
UR?D
URID
?I?A
NIÑA
U?A
UÑA
SI?N
SION
UE?O UEÑO
CIËN
CION
C?UT
CEUT
UE?A UEÑA
A?O
AÑO
IT?N
ITAN
BLIC? BLICO
BLICË
BLICO
EJ?R
EJER
NP
MP
PASO PREPARATIVO 4: Corrector Completa (CC)
OBJETIVO: eliminar los errores de ortografía y normalizar algunos símbolos que
no se pudieron normalizar en el paso 3 (ejemplo: inicios de frases con ? Pues si
se sacan de una quizás me impiden identificar la palabra). Es completa porque
quedan los conectores
Valor agregado:
a) reducir aún más la cantidad de frases a codificar,
b) Disponer de frases en buen estado ortográfico para poderlas utilizar como
futuros índices y diccionarios.
Ejemplo:
Ocupaciones: 206.480 FUON  183.298 FUCC
Favrica de muebles  fabrica de muebles
PASO PREPARATIVO 6: Familiarizado
OBJETIVO: reemplazar hijos por padres
Valor agregado:
a) reducir aún más la cantidad de frases a codificar,
b) Disponer de frases en buen estado ortográfico para
poderlas utilizar como futuros índices y diccionarios.
Ejemplo:
Ocupaciones: 183.298 FUCC  155.763
PASO PREPARATIVO 7: Abuelizado
OBJETIVO: reemplazar padres por abuelos
Valor agregado:
a) reducir aún más la cantidad de frases a codificar,
b) utilizar sinónimos de base clasificatoria
Ejemplo:
Ocupaciones: 155.763 FUF_O  146.597 FUA_O
FRASE_NORMALIZADA
'SIEMBRA DE CEREALES'
'CULTIVOS DE CEREALES'
'CULTIVO DE CEREALES'
'SIEMBRA CEREALES'
'CULTIVO DE CEREALE'
'COSECHA DE CEREALES'
'SIEMBRA DE CEREALE'
'COCECHA DE CEREALES'
'SEMBRANDO TRIGO'
FRECUENCIA FRASE_abuelizada
166
'CULTIVAR CEREAL'
8
'CULTIVAR CEREAL'
6
'CULTIVAR CEREAL'
4
'CULTIVAR CEREAL'
2
'CULTIVAR CEREAL'
2
'CULTIVAR CEREAL'
1
'CULTIVAR CEREAL'
1
'CULTIVAR CEREAL'
1
'CULTIVAR CEREAL'
191
FRASE_NORMALIZADA
'CONSTRUCCION'
'CONTRUCCION'
'CONSTRUCCIONES'
'CONTRUCION'
'COSTRUCCION'
'CONTRUCCIONES'
'CONSTRUCCIO'
………………………………
'DE CONTRUCIIN'
'CONTR8CCION'
'UNA COTRUCCION'
'CONTRUCCINES'
'CONTRYCION'
'XONSTRUCCION'
TOTAL
FRECUENCIA
219894
10911
4281
2544
891
346
291
2
2
2
2
2
2
243.363
FRASE_abuelizada
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
'CONSTRUCCION'
PASO PREPARATIVO 8: reglas
OBJETIVO: reducir verbos según reglas jerárquicas
Valor agregado:
a) reducir aún más la cantidad de frases a codificar,
b) Facilitar la codificación manual en forma homogénea
PASO PREPARATIVO 9: Síntesis de la redundancia
vo
Siembra y cultivo de lechuga rucula y berro
CULTIVAR CULTIVAR HORTALIZA HORTALIZA HORTALIZA
CULTIVAR HORTALIZA
MÓDULO CODIFICACIÓN – Relación con calidad
AUTOFRASE
• Títulos  95%
•Ocupaciones  85%
• Actividad  76 %
AUTOCODIFICACIÓN POR RED
AUTOCODIFICACIÓN POR MICROPROCESOS
CODIFICACION MANUAL DIRIGIDA
MÓDULO CODIFICACIÓN – Relación con calidad
GRAN FILTRO MACRO FILTRO
MICRO FILTRO
PICO FILTRO
COMPLEMENTARIO
NO DEBE
CINEV
LICENCIADO
60
LIC
60
LDO
60
LICDO
60
LCDO
60
BIOLOGIA
60110
FISICA
60120
MATEMATICAS
60131
QUIMICA
60140
EDUC
602
ACTIVIDAD FISICA Y
SALUD
TSU
DEPORTE
60221
6022
CIENCIAS DEL
DEPORTE
TSU
60222
GESTION
TECNOLOGICA DEL
DEPORTE
TSU
60224
MÓDULO CODIFICACIÓN – Relación con calidad
MÓDULOS FUNCIONALES DEL CIRE
I- RECEPCION DE BASES Y/O CONSULTAS
II- PREPARACIÓN DE LAS BASES PARA CODIFICAR
III- CODIFICACIÓN
IV-CONTROL DE RESULTADOS
V-GESTIÓN DE TAREAS
Obligatorias
Acción
Producto
Complementarias según sector
Materia prima o área del conocimiento
Destino
Nombre genérico del local
Qué HACE,
Qué ACCIÓN
o
PROCESO
realiza
la
unidad
económica
(UE)
en
cuestión
Las palabras claves relacionadas con la acción son
básicamente VERBOS.
Por ejemplo:
En la producción agropecuaria: cultivo, producción, cría, etc.
En la fabricación de bienes: elaboración, fabricación, confección,
refinación, producción, impresión, reparación, etc.
En comercialización de bienes: compra, venta, importación,
consignación, etc.
En prestación de servicios: fotocopiado, diseño, promoción,
asesoramiento, alquiler, compra-venta de inmuebles, administrar,
peinar, saco fotos, etc.
En síntesis: las ACCIONES dan respuesta a la pregunta:
¿Cuál es el PROCESO principal que realiza ?
Auxiliares
93
931
9311
9312
9313
7115
7126
7131
7221
22
Obreros de la minería, la construcción, la industria
manufacturera y el transporte
Obreros de la minería y la construcción
Obreros de minas y canteras
Obreros de obras públicas y mantenimiento
Obreros y ayudantes de la construcción de edificios
Ayudante de carpintero
Ayudante de plomería
Ayudante de pintor
Ayudante de herrería
Profesionales de la salud
221
Médicos
2211
Médico general
2212
Médicos especialistas
01 Ginecólogos
02 Pediatras
Descargar

2- NORMALIZADO